Dodatkowe wskaźniki bibliometryczne...

Dodatkowe wskaźniki bibliometryczne uwzględniające nadmiar liczby cytowań w stosunku do wartości indeksu h
Artykuł stanowi suplement do publikacji Indeks Hirscha w ocenie publikacji naukowych, który został utworzony 27 stycznia 2023 r. (22 stycznia 2024 r. artykuł liczy 2920 odsłon).

W stosowalności indeksu cytowań h należy wziąć pod uwagę także uwagi krytyczne dotyczące braku uwzględnienia rzeczywistej liczby cytowań N_p dla danej publikacji poza indeksem h N_h=(N_p-h), czyli nadmiarowości cytowań, wpływu stosowanych narzędzi do zarządzania danymi bibliometrycznymi, silnej zależności od długości kariery naukowej, ale również występującymi wyraźnymi różnicami w jego estymacji, gdy korzysta się z różnych baz danych, tj. Google’s Google Scholar (GS), Elsevier’s Scopus, Clarivate Analytics’ Web of Science (WoS) oraz akademickiego portalu społecznościowego (academic social networking site) (ASNS) - ResearchGate (RG). W takich przypadkach, które występują niewątpliwie w praktyce można wprowadzić dwa dodatkowe wskaźniki g i h_g. Nadmiar cytowań ponad rdzeniem na osi rzędnych poza wymaganą liczbę h ilustruje rys. 1. Rys. 1. Graficzna ilustracja rozkładu cytowań w definicji indeksu h [1].

Okazuje się że w obydwóch kategoriach (kariery i cytowań za dany rok) w rankingu TOP2% nadmiarowość liczby cytowań w stosunku do wymaganej liczby h² jest zjawiskiem powszechnym i wymaga również wnikliwej oceny bibliometrycznej. Występują bowiem liczne przypadki, gdy naukowcy mają wykazany mały indeks Hirscha, ale bardzo dużą liczbę cytowań jednego lub kilku artykułów (nadmiar ponad h-rdzeniem na rys. 1), nawet większą od naukowców z dużym indeksem h. Znakomitym przykładem może być Albert Einstein dla którego orientacyjnie wyznaczono indeks h =4(5) podczas gdy cytowania jego prac idą w setki tysięcy [1]. Z drugiej strony możliwa jest duża liczba artykułów o liczbie cytowań mniejszej niż h (co obrazuje h-ogon na rys. 1). Hirsch ustalił doświadczalnie, że całkowita liczba cytowań N jest proporcjonalna do kwadratu indeksu h (h²), tj. h = √n/a ze współczynnikiem proporcjonalności a = 3÷5 (ale współczynnik a=1 oznacza, że indeks h został uzyskany bez nadmiaru cytowań. Można rozpatrzyć [1] dwa hipotetyczne przykłady, gdy jeden z naukowców opublikował 20 artykułów, z których tylko 1 był cytowany 500 razy (czyli uzyskał indeks h=1), natomiast drugi opublikował też 20 artykułów, ale każdy z nich był cytowany 20 razy (czyli wykazał wymagane minimum 400 cytowań do uzyskania indeksu h=20). Jak w takim przypadku ocenić te dwa skrajne przypadki (500 cytowań vs. 400 cytowań) w kontekście wkładu naukowego i, co najważniejsze, na czyją korzyść? Pojawia się zatem pytanie, czy w takich przypadkach można jednoznacznie wskazywać na korzyść dużego indeksu h? Z analiz przeprowadzonych przez autora w rankingu TOP2% wynika, że duży nadmiar cytować w zakresie h-rdzenia mają w większości naukowcy z długoletnim stażem naukowym do czego przyczyniają się liczne publikacje o najwyższej cytowalności. Z kolei większą liczbę cytowań z artykułów poniżej h, czyli w ogonie na rys.1, mogą mieć młodzi naukowcy. Jest to ważne przy ocenie wniosków awansowych.

Dla przypomnienia indeks h został zdefiniowany następująco [1]: „Badacz ma wykazany indeks h, jeśli opublikowanych P artykułów dostało co najmniej h cytowań każdy, a reszta (P-h) artykułów otrzymała nie więcej niż h cytowań”.

Indeks g (g-indeks) [1] jest oparty na przekształceniu bazowego indeksu h i zdefiniowany jako liczba g najczęściej cytowanych publikacji, które uzyskały łącznie g² cytowań. To również znaczy, że artykuły w liczbie (g + 1) będą mieć mniej niż (g + 1)²cytowań. Na przykład, autor, którego g-index = 10, opublikował 10 artykułów, których łączna liczba cytowań jest nie mniejsza niż 100. Wysokie wartości indeksu g świadczą o dużych liczbach najczęściej cytowanych artykułów i z reguły powodują nadmiarowość cytowań w zakresie h-rdzenia/trzonu (rys.1).

Indeks h_g jest definiowany jako średnia geometryczna [1]: h_g= √h*g

W aspekcie geometrycznym indeks h_g może być traktowany jako pierwiastek z zastępczego pola powierzchni prostokąta o wymiarach h´g w stosunku do pola powierzchni pod krzywą (hiperbolą) Hirscha (rys. 1), co przedstawia rys. 2. Indeks h_g dobrze koreluje z indeksem h ponieważ jest zbliżony co do wartości bardziej do h niż g. [1].

Rys. 2. Geometryczna interpretacja indeksu h_g [1].

Jeśli porówna się dorobek publikacyjny dwóch autorów z uzyskaną identyczną liczbą cytowań, z których pierwszy opublikował 30 artykułów, ale tylko 1 nich dostał 500 cytowań (h=1), a drugi 50 artykułów i każdy z nich dostał 10 cytowań (h=10) to indeksy g będą równe 22 (22² = 484 < 500 i 23² = 529> 500) i 10 (10² = 100 i 11² = 121> 100). Na tej podstawie, można na pierwszy rzut oka sądzić, że drugi autor jest lepiej postrzegany w środowisku naukowym ze względu na większą wydajność publikacyjną i większą dostrzegalność prac naukowych. Jednakże indeks g jest dużo mniejszy niż w przypadku pierwszego autora (10 vs 22), którego 29 artykułów pozostało anonimowymi. Z tego względu uzasadnione jest wprowadzenie wskaźnika h_g, który bardziej bilansuje wkład naukowy obydwóch autorów, tj. , a przez to minimalizuje wpływ tylko jednej wysoko cytowanej publikacji. Przedstawione relacje można łatwo odczytać z rys. 2 ponieważ jednakowy indeks h_g =14,97 można uzyskać przy mniejszej wartości wskaźnika g i wyższym indeksie h (autor A- h=14, g=16), lub odwrotnie (autor B – h=7, g=32), co wynika z prostej relacji geometrycznej. Z kolei autor C (h=11, g=25) większy indeks h_g = 16,58 uzyskał z pośrednich wartości indeksów h i g.

W tabl. 1 porównano wskaźniki bibliometryczne h, h_m, g, g/h i h_g wyznaczone dla danych źródłowych dostępnych w bazach rankingu TOP2% [1]. Przykłady dotyczą wybranych naukowców z Polski reprezentujących nauki inżynieryjno-techniczne.

Tabl. 1. Zestawienie wskaźników bibliometrycznych dla autorów wg kryterium kariery naukowej w 2021 r. (Authors_career_2021) (www.Elsevier.digitalcommonsdata.com).

Nr	A h21(ns)	B h21	C h_m21	D g	E g/h21	F h_g	G nc9621
1	73	81	50,812	161	1,99	114,2	25970
2	54	70	20,7059	132	1,89	96,12	17476
3	41	52	16, 2113	106	2,04	74,24	11439
4	35	41	21,7077	80	1,95	52,27	6538
5	29	31	22,1444	55	1,77	41,29	3052
6	17	22	14,0833	38	1,29	28,91	1498
7	13	17	12,754	26	1,31	21,02	679
8	7	10	9,500	18	1,43	13,42	329

Legenda:
A - h21 (ns) - h-indeks na koniec 2021 r. (bez autocytowań),
B - h21 - h-indeks na koniec 2021 r. (z autocytowaniami),
C - h_m21 - h_m-indeks na koniec 2021 r.,
D - indeks g
E - stosunek g/h21
F - indeks h_gG - nc9621 - całkowita liczba artykułów opublikowanych w latach 1996-2021.

Na rys. 3 przedstawiono związki miedzy indeksami g i h dla danych zebranych w tabl.1, które obrazują skalę nadmiaru cytowani, ale z uwzględnieniem autocytowań [1].

Rys. 3. Związki między indeksami h, g i h_g dla wybranych naukowców z Polski oparte na danych z tabl. 1.

Wnioski:
1. Nadmiar cytowań wzrasta wraz z wartością indeksu h, ale orientacyjnie powyżej 30 występuje większy nadmiar cytowań.
2. Na podstawie nowych wskaźników można wykazać, że źródło nadmiaru cytowań może pochodzić z autocytowań, jak w przypadku autorów nr 2 i 3 w tabl. 1.

Więcej informacji o specyfice rozkładu indeksów h i h_g w różnych dyscyplinach naukowych, m.in. naukach ścisłych (chemii i fizyce), medycznych i inżynieryjnych można znaleźć w artykułach analizujących publikacje autorów z różnych krajów [2,3]. Na uwagę zasługuje fakt, że w tym przypadku największy nadmiar publikacji (oceniany na podstawie średniej wartości współczynnika g/h) mają naukowcy z fizyki (1,85) i medycyny (1,60). W naukach inżynieryjnych to ok. 1,45. Natomiast średni współczynnik nadmiaru cytowań dla wszystkich ujętych dyscyplin to ok. 1,5 [1]. Dla polskich autorów [1] to ok. 2 (h_śr= 31,32, g_śr= 63,65).

Literatura:
1. W. Grzesik, Ocena porównawcza dodatkowych wskaźników bibliometrycznych w przypadku dużego nadmiaru liczby cytowań w stosunku do wartości indeksu h, Mechanik, 7, 2023, s. 46-50.
2. S. Alonso, F.J. Cabrerizo, E. Herrera-Viedma, F. Herrera, 2010, hg-index: a new index to characterize the scientific output of researchers based on the h- and g-indicies, Scientometrics, 82, 391-400, https://doi.org/10.1007/s11192-009-0047-5.
3. G.S. Hadagali, B.D. Kumbar, G.N. Gourikeremath, R. Hiremath, 2016, g- index as an improvement of the h-index: A comparative study of prominent Indian scientists. International Journal of Information Dissemination and Technology, 6(S1), S42-48.

Prof. dr hab. inż. Wit Grzesik, Opole

Dodatkowe wskaźniki bibliometryczne...

Regulaminy

Regulamin Usług i Portalu Internetowego

Informacje o plikach cookie