Dodatkowe wskaźniki bibliometryczne uwzględniające nadmiar liczby cytowań w stosunku do wartości indeksu h
Artykuł stanowi suplement do publikacji Indeks Hirscha w ocenie publikacji naukowych, który został utworzony 27 stycznia 2023 r. (22 stycznia 2024 r. artykuł liczy 2920 odsłon).
W stosowalności indeksu cytowań h należy wziąć pod uwagę także uwagi krytyczne dotyczące braku uwzględnienia rzeczywistej liczby cytowań Np dla danej publikacji poza indeksem h Nh=(Np-h), czyli nadmiarowości cytowań, wpływu stosowanych narzędzi do zarządzania danymi bibliometrycznymi, silnej zależności od długości kariery naukowej, ale również występującymi wyraźnymi różnicami w jego estymacji, gdy korzysta się z różnych baz danych, tj. Google’s Google Scholar (GS), Elsevier’s Scopus, Clarivate Analytics’ Web of Science (WoS) oraz akademickiego portalu społecznościowego (academic social networking site) (ASNS) - ResearchGate (RG). W takich przypadkach, które występują niewątpliwie w praktyce można wprowadzić dwa dodatkowe wskaźniki g i hg. Nadmiar cytowań ponad rdzeniem na osi rzędnych poza wymaganą liczbę h ilustruje rys. 1. Rys. 1. Graficzna ilustracja rozkładu cytowań w definicji indeksu h [1].
Okazuje się że w obydwóch kategoriach (kariery i cytowań za dany rok) w rankingu TOP2% nadmiarowość liczby cytowań w stosunku do wymaganej liczby h2 jest zjawiskiem powszechnym i wymaga również wnikliwej oceny bibliometrycznej. Występują bowiem liczne przypadki, gdy naukowcy mają wykazany mały indeks Hirscha, ale bardzo dużą liczbę cytowań jednego lub kilku artykułów (nadmiar ponad h-rdzeniem na rys. 1), nawet większą od naukowców z dużym indeksem h. Znakomitym przykładem może być Albert Einstein dla którego orientacyjnie wyznaczono indeks h =4(5) podczas gdy cytowania jego prac idą w setki tysięcy [1]. Z drugiej strony możliwa jest duża liczba artykułów o liczbie cytowań mniejszej niż h (co obrazuje h-ogon na rys. 1). Hirsch ustalił doświadczalnie, że całkowita liczba cytowań N jest proporcjonalna do kwadratu indeksu h (h2), tj. h = √n/a ze współczynnikiem proporcjonalności a = 3÷5 (ale współczynnik a=1 oznacza, że indeks h został uzyskany bez nadmiaru cytowań. Można rozpatrzyć [1] dwa hipotetyczne przykłady, gdy jeden z naukowców opublikował 20 artykułów, z których tylko 1 był cytowany 500 razy (czyli uzyskał indeks h=1), natomiast drugi opublikował też 20 artykułów, ale każdy z nich był cytowany 20 razy (czyli wykazał wymagane minimum 400 cytowań do uzyskania indeksu h=20). Jak w takim przypadku ocenić te dwa skrajne przypadki (500 cytowań vs. 400 cytowań) w kontekście wkładu naukowego i, co najważniejsze, na czyją korzyść? Pojawia się zatem pytanie, czy w takich przypadkach można jednoznacznie wskazywać na korzyść dużego indeksu h? Z analiz przeprowadzonych przez autora w rankingu TOP2% wynika, że duży nadmiar cytować w zakresie h-rdzenia mają w większości naukowcy z długoletnim stażem naukowym do czego przyczyniają się liczne publikacje o najwyższej cytowalności. Z kolei większą liczbę cytowań z artykułów poniżej h, czyli w ogonie na rys.1, mogą mieć młodzi naukowcy. Jest to ważne przy ocenie wniosków awansowych.
Dla przypomnienia indeks h został zdefiniowany następująco [1]: „Badacz ma wykazany indeks h, jeśli opublikowanych P artykułów dostało co najmniej h cytowań każdy, a reszta (P-h) artykułów otrzymała nie więcej niż h cytowań”.
Indeks g (g-indeks) [1] jest oparty na przekształceniu bazowego indeksu h i zdefiniowany jako liczba g najczęściej cytowanych publikacji, które uzyskały łącznie g2 cytowań. To również znaczy, że artykuły w liczbie (g + 1) będą mieć mniej niż (g + 1)2 cytowań. Na przykład, autor, którego g-index = 10, opublikował 10 artykułów, których łączna liczba cytowań jest nie mniejsza niż 100. Wysokie wartości indeksu g świadczą o dużych liczbach najczęściej cytowanych artykułów i z reguły powodują nadmiarowość cytowań w zakresie h-rdzenia/trzonu (rys.1).
Indeks hg jest definiowany jako średnia geometryczna [1]: hg = √h*g
W aspekcie geometrycznym indeks hg może być traktowany jako pierwiastek z zastępczego pola powierzchni prostokąta o wymiarach h´g w stosunku do pola powierzchni pod krzywą (hiperbolą) Hirscha (rys. 1), co przedstawia rys. 2. Indeks hg dobrze koreluje z indeksem h ponieważ jest zbliżony co do wartości bardziej do h niż g. [1].
Rys. 2. Geometryczna interpretacja indeksu hg [1].
Jeśli porówna się dorobek publikacyjny dwóch autorów z uzyskaną identyczną liczbą cytowań, z których pierwszy opublikował 30 artykułów, ale tylko 1 nich dostał 500 cytowań (h=1), a drugi 50 artykułów i każdy z nich dostał 10 cytowań (h=10) to indeksy g będą równe 22 (222 = 484 < 500 i 232 = 529> 500) i 10 (102 = 100 i 112 = 121> 100). Na tej podstawie, można na pierwszy rzut oka sądzić, że drugi autor jest lepiej postrzegany w środowisku naukowym ze względu na większą wydajność publikacyjną i większą dostrzegalność prac naukowych. Jednakże indeks g jest dużo mniejszy niż w przypadku pierwszego autora (10 vs 22), którego 29 artykułów pozostało anonimowymi. Z tego względu uzasadnione jest wprowadzenie wskaźnika hg, który bardziej bilansuje wkład naukowy obydwóch autorów, tj. , a przez to minimalizuje wpływ tylko jednej wysoko cytowanej publikacji. Przedstawione relacje można łatwo odczytać z rys. 2 ponieważ jednakowy indeks hg =14,97 można uzyskać przy mniejszej wartości wskaźnika g i wyższym indeksie h (autor A- h=14, g=16), lub odwrotnie (autor B – h=7, g=32), co wynika z prostej relacji geometrycznej. Z kolei autor C (h=11, g=25) większy indeks hg = 16,58 uzyskał z pośrednich wartości indeksów h i g.
W tabl. 1 porównano wskaźniki bibliometryczne h, hm, g, g/h i hg wyznaczone dla danych źródłowych dostępnych w bazach rankingu TOP2% [1]. Przykłady dotyczą wybranych naukowców z Polski reprezentujących nauki inżynieryjno-techniczne.
Tabl. 1. Zestawienie wskaźników bibliometrycznych dla autorów wg kryterium kariery naukowej w 2021 r. (Authors_career_2021) (www.Elsevier.digitalcommonsdata.com).
Nr | A h21(ns) |
B h21 |
C hm21 |
D g |
E g/h21 |
F hg |
G nc9621 |
1 | 73 | 81 | 50,812 | 161 | 1,99 | 114,2 | 25970 |
2 | 54 | 70 | 20,7059 | 132 | 1,89 | 96,12 | 17476 |
3 | 41 | 52 | 16, 2113 | 106 | 2,04 | 74,24 | 11439 |
4 | 35 | 41 | 21,7077 | 80 | 1,95 | 52,27 | 6538 |
5 | 29 | 31 | 22,1444 | 55 | 1,77 | 41,29 | 3052 |
6 | 17 | 22 | 14,0833 | 38 | 1,29 | 28,91 | 1498 |
7 | 13 | 17 | 12,754 | 26 | 1,31 | 21,02 | 679 |
8 | 7 | 10 | 9,500 | 18 | 1,43 | 13,42 | 329 |
Legenda:
A - h21 (ns) - h-indeks na koniec 2021 r. (bez autocytowań),
B - h21 - h-indeks na koniec 2021 r. (z autocytowaniami),
C - hm21 - hm-indeks na koniec 2021 r.,
D - indeks g
E - stosunek g/h21
F - indeks hg
G - nc9621 - całkowita liczba artykułów opublikowanych w latach 1996-2021.
Na rys. 3 przedstawiono związki miedzy indeksami g i h dla danych zebranych w tabl.1, które obrazują skalę nadmiaru cytowani, ale z uwzględnieniem autocytowań [1].
Rys. 3. Związki między indeksami h, g i hg dla wybranych naukowców z Polski oparte na danych z tabl. 1.
Wnioski:
1. Nadmiar cytowań wzrasta wraz z wartością indeksu h, ale orientacyjnie powyżej 30 występuje większy nadmiar cytowań.
2. Na podstawie nowych wskaźników można wykazać, że źródło nadmiaru cytowań może pochodzić z autocytowań, jak w przypadku autorów nr 2 i 3 w tabl. 1.
Więcej informacji o specyfice rozkładu indeksów h i hg w różnych dyscyplinach naukowych, m.in. naukach ścisłych (chemii i fizyce), medycznych i inżynieryjnych można znaleźć w artykułach analizujących publikacje autorów z różnych krajów [2,3]. Na uwagę zasługuje fakt, że w tym przypadku największy nadmiar publikacji (oceniany na podstawie średniej wartości współczynnika g/h) mają naukowcy z fizyki (1,85) i medycyny (1,60). W naukach inżynieryjnych to ok. 1,45. Natomiast średni współczynnik nadmiaru cytowań dla wszystkich ujętych dyscyplin to ok. 1,5 [1]. Dla polskich autorów [1] to ok. 2 (hśr= 31,32, gśr= 63,65).
Literatura:
1. W. Grzesik, Ocena porównawcza dodatkowych wskaźników bibliometrycznych w przypadku dużego nadmiaru liczby cytowań w stosunku do wartości indeksu h, Mechanik, 7, 2023, s. 46-50.
2. S. Alonso, F.J. Cabrerizo, E. Herrera-Viedma, F. Herrera, 2010, hg-index: a new index to characterize the scientific output of researchers based on the h- and g-indicies, Scientometrics, 82, 391-400, https://doi.org/10.1007/s11192-009-0047-5.
3. G.S. Hadagali, B.D. Kumbar, G.N. Gourikeremath, R. Hiremath, 2016, g- index as an improvement of the h-index: A comparative study of prominent Indian scientists. International Journal of Information Dissemination and Technology, 6(S1), S42-48.
Prof. dr hab. inż. Wit Grzesik, Opole