2011-06-16 16 views
6

¿Hay alguna manera de recuperar todas las categorías de dcterms:subject dentro de dbpedia?Recuperar categorías de objetos de dbpedia con SPARQL

Como un ejemplo, en http://dbpedia.org/page/Eiffel_Tower puedo ver en dcterms: someter las siguientes categorías:

  • categoría: Former_world's_tallest_buildings
  • categoría: Places_with_restrictions_on_photography
  • categoría: Michelin_Guide_starred_restaurants_and_chefs
  • categoría: Historic_Civil_Engineering_Landmarks
  • categoría: 1889_arquitectura
  • ...

deseo para recuperar todos los valores en category:xxx DBpedia. ¿Hay alguna manera?

+0

ver pregunta duplicado en http://answers.semanticweb.com/questions/10252/retrive-dbpedia-subject-categories-with-sparql para más respuestas en este – RobV

Respuesta

7

Si vas a hacer una consulta COUNT para ver la cantidad de categorías en DBpedia utilizando la siguiente consulta SPARQL:

SELECT COUNT(DISTINCT ?category) AS ?count WHERE {?subject dcterms:subject ?category} 

podrás conseguir ese DBpedia tiene 503788 categorías. Si consulta todas las categorías, el punto final no le dará la totalidad de las categorías 503788, ya que tiene un límite en la cantidad de resultados que puede recuperar. Pero puede emitir varias consultas utilizando LIMIT y OFFSET. Por ejemplo, para obtener los primeros 1000 categorías que puede hacer la siguiente consulta:

SELECT DISTINCT ?category WHERE {?subject dcterms:subject ?category} LIMIT 1000 OFFSET 0 

No sé cómo se va a utilizar esta información, pero mi recomendación sería que se ejecutan varias consultas con incrementar el desplazamiento (por ejemplo, 1000, 2000, 3000) y almacena en caché los resultados en cualquier almacenamiento que esté utilizando. Básicamente puede escribir un programa que ejecuta las consultas y coloca los resultados en la caché.

Recuerde sin embargo que las categorías en DBPedia son jerárquicas, por lo que una categoría es una categoría de borader de varias otras.

1

O simplemente ejecute:

SELECT ?category WHERE { ?category a <http://www.w3.org/2004/02/skos/core#Concept> } LIMIT 1000

Cuestiones relacionadas