2012-05-10 26 views
19

Tengo una lista de autores. Deseo recuperar/calcular automáticamente el índice de citas (idealmente anual) (h-index, m-cociente, g-index, HCP indicator o ...) para cada autor.¿Cómo recuperar/calcular recuentos de citas y/o índices de citas de una lista de autores?

Author Year Index 
first 2000 1 
first 2001 2 
first 2002 3 

Puedo calcular todas estas métricas teniendo en cuenta los recuentos de citas de cada trabajo de cada investigador.

Author Paper Year Citation_count 
first 1 2000 1 
first 2 2000 2 
first 3 2002 3 

A pesar de mis esfuerzos, no he encontrado un método API/raspado capaz de hacer esto.

Mi institución tiene acceso a una serie de servicios, entre ellos, Web of Science.

+3

http://bmb-common.blogspot.ca/2011/11/google-scholar-still-sucks.html tiene alguna información, en particular, el paquete 'CITAN' parece bastante poderoso si tiene acceso a Scopus ; también ha habido algunas publicaciones recientes de PubMed sobre bloggers (si esto funciona para usted o no depende de si está satisfecho con la cobertura de PubMed en su campo). Incluso si pudieras robar WoS, no está permitido por sus términos de servicio ... –

+0

@Ben Bolker, gracias por las sugerencias, esto me señala la dirección correcta. –

+0

Esto es probablemente donde se creará una solución: http://ropensci.org/project-overview/ –

Respuesta

1

Efectivamente, el problema principal es construir el citation graph. Una vez que tenga eso, puede calcular las métricas que desee (por ejemplo, h-index, g-index, PageRank).

Supongamos que tiene una colección de documentos (que ha recuperado de alguna manera) puede extraer las citas de cada uno de ellos y crear el gráfico de citas. Puede encontrar útil ParsCit, an open-source CRF Reference String and Logical Document Structure Parsing Package que también es utilizado por CiteSeerX y funciona muy bien.