2012-10-07 16 views
5

He descargado un montón de datos de Nature en forma de archivos N-Quads, .nq. Estos contienen gráficos RDF, ¿verdad? ¿Cómo accedo a estos datos y cómo puedo traducir los gráficos RDF a un formato más útil (preferiblemente algo como Boost o igraph para R/C++/Python)?Gráficos N-Quad: ¿cómo los uso?

Respuesta

2

El flujo de trabajo típico es algo como esto:

  1. Importar los N-Quads volcado en una tienda de triple SPARQL con capacidad como OpenLink Virtuoso o Apache Fuseki
  2. Escribir consultas SPARQL que extraen los datos que necesita
  3. transformar los resultados de SPARQL, que se puede obtener en un sencillo XML o JSON (o CSV, dependiendo de la tienda) formato, en cualquier formato que necesita

Alternativamente, envíe las consultas SPARQL directamente desde sus aplicaciones y haga con los datos lo que sea necesario hacer. Existen bibliotecas de clientes SPARQL para la mayoría de los lenguajes, pero incluso si no tiene uno, es una cuestión bastante simple de%: codificar la consulta y construir una URL de consulta.

+0

Bien, gracias. ¿Hay algún tutorial que conozcas que yo pueda probar? Además, ¿la estrategia general (abstracta) es ejecutar el documento de texto n-quads y agregar enlaces al gráfico de salida en función de la sintaxis sujeto-predicado-objeto? – jclancy

+0

En general, sí. Pero N-Quads tiene un cuarto campo para cada "triple", llamado "gráfico". Diferentes archivos de N-Quads usarán esto para diferentes propósitos, a menudo para nombrar un contexto o fuente para el triple particular. Probablemente sea una buena idea primero averiguar para qué se usa el cuarto campo en el archivo dado, ya sea inspeccionando el archivo o buscando documentación del editor. Dependiendo de para qué desee utilizar los datos, el cuarto campo puede ser o no importante. – cygri

Cuestiones relacionadas