Dodatkowe wskaźniki  bibliometryczne uwzględniające nadmiar liczby cytowań w stosunku do wartości indeksu h
Artykuł stanowi suplement do publikacji Indeks Hirscha w ocenie publikacji naukowych, który został utworzony 27 stycznia 2023 r. (22 stycznia 2024 r. artykuł liczy 2920 odsłon).

W stosowalności indeksu cytowań h należy wziąć pod uwagę także uwagi krytyczne dotyczące braku uwzględnienia rzeczywistej liczby cytowań Np dla danej publikacji poza indeksem h  Nh=(Np-h), czyli nadmiarowości cytowań, wpływu stosowanych narzędzi do zarządzania  danymi bibliometrycznymi, silnej zależności od długości kariery naukowej, ale również występującymi wyraźnymi różnicami w jego estymacji, gdy korzysta się z różnych baz danych, tj. Google’s Google Scholar (GS), Elsevier’s Scopus, Clarivate Analytics’ Web of Science (WoS) oraz akademickiego portalu społecznościowego (academic social networking site) (ASNS) - ResearchGate (RG). W takich przypadkach, które występują niewątpliwie w praktyce można wprowadzić dwa dodatkowe wskaźniki g i hg. Nadmiar cytowań ponad rdzeniem na osi rzędnych poza wymaganą liczbę h ilustruje rys. 1. Rys. 1. Graficzna ilustracja rozkładu cytowań w definicji indeksu h [1].

Okazuje się że w obydwóch kategoriach (kariery i cytowań za dany rok) w rankingu TOP2% nadmiarowość liczby cytowań w stosunku do wymaganej liczby h2 jest zjawiskiem powszechnym i wymaga również wnikliwej oceny bibliometrycznej. Występują bowiem liczne przypadki, gdy naukowcy mają wykazany mały indeks Hirscha, ale bardzo dużą liczbę cytowań jednego lub kilku artykułów (nadmiar ponad h-rdzeniem na rys. 1), nawet większą od naukowców z dużym indeksem h. Znakomitym przykładem może być Albert Einstein dla którego orientacyjnie wyznaczono indeks h =4(5) podczas gdy cytowania jego prac idą w setki tysięcy [1]. Z drugiej strony możliwa jest duża liczba artykułów o liczbie  cytowań mniejszej niż h (co obrazuje h-ogon na rys. 1). Hirsch ustalił doświadczalnie, że całkowita liczba cytowań N jest proporcjonalna do kwadratu indeksu h (h2), tj. h = √n/a ze współczynnikiem proporcjonalności a = 3÷5 (ale współczynnik a=1 oznacza, że indeks h został uzyskany bez nadmiaru cytowań. Można rozpatrzyć [1] dwa hipotetyczne przykłady, gdy jeden z naukowców opublikował 20 artykułów, z których tylko 1 był cytowany 500 razy (czyli uzyskał indeks h=1), natomiast drugi opublikował też 20 artykułów, ale każdy z nich był cytowany 20 razy (czyli wykazał wymagane minimum 400 cytowań do uzyskania indeksu h=20). Jak w takim przypadku ocenić te dwa skrajne przypadki (500 cytowań vs. 400 cytowań) w kontekście wkładu naukowego i, co najważniejsze, na czyją korzyść? Pojawia się zatem pytanie, czy w takich przypadkach można jednoznacznie wskazywać na korzyść dużego indeksu h? Z analiz przeprowadzonych przez  autora w rankingu TOP2% wynika, że duży nadmiar cytować w zakresie h-rdzenia  mają w większości naukowcy z długoletnim stażem naukowym do czego przyczyniają się liczne publikacje o najwyższej cytowalności. Z kolei większą liczbę cytowań z artykułów poniżej h, czyli w ogonie na rys.1, mogą mieć młodzi naukowcy. Jest to ważne przy ocenie wniosków awansowych.

Dla przypomnienia indeks h został zdefiniowany następująco [1]: „Badacz ma wykazany indeks h, jeśli opublikowanych P artykułów dostało co najmniej h cytowań każdy, a reszta (P-h) artykułów otrzymała nie więcej niż h cytowań”.

Indeks g (g-indeks) [1] jest  oparty na przekształceniu bazowego indeksu h i zdefiniowany jako liczba g najczęściej cytowanych publikacji, które uzyskały łącznie g2 cytowań. To również znaczy, że artykuły w liczbie (g + 1) będą mieć mniej niż (g + 1)2 cytowań. Na przykład, autor, którego g-index = 10, opublikował 10 artykułów, których łączna liczba cytowań jest nie mniejsza niż 100. Wysokie wartości indeksu g świadczą o dużych liczbach najczęściej cytowanych artykułów i z reguły powodują nadmiarowość cytowań w zakresie h-rdzenia/trzonu (rys.1).

Indeks hg jest definiowany jako średnia geometryczna [1]: hg = √h*g

W aspekcie geometrycznym indeks hg może być traktowany jako pierwiastek z zastępczego pola powierzchni prostokąta o wymiarach h´g w stosunku do pola powierzchni pod krzywą (hiperbolą) Hirscha (rys. 1),  co przedstawia rys. 2. Indeks hg dobrze koreluje z indeksem h ponieważ jest zbliżony co do wartości bardziej do h niż g. [1].

Rys. 2. Geometryczna interpretacja indeksu hg [1].

Jeśli porówna się dorobek publikacyjny dwóch autorów z uzyskaną identyczną liczbą cytowań, z których pierwszy opublikował 30 artykułów, ale tylko 1 nich dostał 500 cytowań (h=1), a drugi 50 artykułów i każdy z nich dostał 10 cytowań (h=10) to indeksy g będą równe 22 (222 = 484 < 500 i 232 = 529> 500) i 10 (102 = 100 i 112 = 121> 100). Na tej podstawie, można na pierwszy rzut oka sądzić, że drugi autor jest lepiej postrzegany w środowisku naukowym ze względu na większą wydajność publikacyjną i większą dostrzegalność prac naukowych. Jednakże indeks g jest dużo mniejszy niż w przypadku pierwszego autora (10 vs 22), którego 29 artykułów pozostało anonimowymi. Z tego względu uzasadnione jest wprowadzenie wskaźnika hg, który bardziej bilansuje wkład naukowy obydwóch autorów, tj. , a przez to minimalizuje wpływ tylko jednej wysoko cytowanej publikacji. Przedstawione relacje można łatwo odczytać z rys. 2 ponieważ jednakowy indeks hg =14,97 można uzyskać przy mniejszej wartości wskaźnika g i wyższym indeksie h (autor A- h=14, g=16), lub odwrotnie (autor B – h=7, g=32), co wynika z prostej relacji geometrycznej. Z kolei autor C (h=11, g=25) większy indeks hg = 16,58 uzyskał z pośrednich wartości indeksów h i g.

W tabl. 1 porównano wskaźniki bibliometryczne h, hm, g, g/h i hg wyznaczone dla danych źródłowych dostępnych w bazach rankingu TOP2% [1]. Przykłady dotyczą wybranych naukowców z Polski reprezentujących nauki inżynieryjno-techniczne.

Tabl. 1. Zestawienie wskaźników bibliometrycznych dla autorów wg kryterium kariery naukowej w 2021 r. (Authors_career_2021) (www.Elsevier.digitalcommonsdata.com).

Nr A
h21(ns)
B
h21
C
hm21
D
g
E
g/h21
F
hg
G
nc9621
1 73 81 50,812 161 1,99 114,2 25970
2 54 70 20,7059 132 1,89 96,12 17476
3 41 52 16, 2113 106 2,04 74,24 11439
4 35 41 21,7077 80 1,95 52,27 6538
5 29 31 22,1444 55 1,77 41,29 3052
6 17 22 14,0833 38 1,29 28,91 1498
7 13 17 12,754 26 1,31 21,02 679
8 7 10 9,500 18 1,43 13,42 329

Legenda:
A - h21 (ns) - h-indeks na koniec 2021 r. (bez autocytowań),
B - h21 - h-indeks na koniec 2021 r. (z autocytowaniami),
C - hm21 - hm-indeks na koniec 2021 r.,
D - indeks g
E - stosunek g/h21
F - indeks hg
G - nc9621 - całkowita liczba artykułów opublikowanych w latach 1996-2021.

Na rys. 3 przedstawiono związki miedzy indeksami g i h dla danych zebranych w tabl.1, które obrazują skalę nadmiaru cytowani, ale z uwzględnieniem autocytowań [1]. 

 Rys. 3. Związki między indeksami hghg dla wybranych naukowców z Polski oparte na danych z tabl. 1.

Wnioski:
1. Nadmiar cytowań wzrasta wraz z wartością indeksu h, ale orientacyjnie powyżej 30 występuje większy nadmiar cytowań.
2. Na podstawie nowych wskaźników można wykazać, że źródło nadmiaru cytowań może pochodzić z autocytowań, jak w przypadku autorów nr 2 i 3 w tabl. 1.

Więcej informacji o specyfice rozkładu indeksów h i hg w różnych dyscyplinach naukowych, m.in. naukach ścisłych (chemii i fizyce), medycznych i inżynieryjnych można znaleźć w artykułach analizujących publikacje autorów z różnych krajów [2,3]. Na uwagę zasługuje fakt, że w tym przypadku największy nadmiar publikacji (oceniany na podstawie średniej wartości współczynnika g/h) mają naukowcy z fizyki (1,85) i medycyny (1,60). W naukach inżynieryjnych to ok. 1,45. Natomiast średni współczynnik nadmiaru cytowań dla wszystkich ujętych dyscyplin to ok. 1,5 [1]. Dla polskich autorów [1] to ok. 2 (hśr= 31,32, gśr= 63,65).

Literatura:
1. W. Grzesik, Ocena porównawcza dodatkowych wskaźników bibliometrycznych w przypadku dużego nadmiaru liczby cytowań w stosunku do wartości indeksu h, Mechanik, 7, 2023, s. 46-50.
2. S. Alonso, F.J. Cabrerizo, E. Herrera-Viedma, F. Herrera, 2010, hg-index: a new index to characterize the scientific output of researchers based on the h- and g-indicies, Scientometrics, 82, 391-400, https://doi.org/10.1007/s11192-009-0047-5.
3. G.S. Hadagali, B.D. Kumbar, G.N. Gourikeremath, R. Hiremath, 2016, g- index as an improvement of the h-index: A comparative study of prominent Indian scientists. International Journal of Information Dissemination and Technology, 6(S1), S42-48.

Prof. dr hab. inż. Wit Grzesik, Opole

 

 

1.png4.png5.png0.png1.png5.png8.png