Grupo de Facebook DBpedia en español
Notify Twitter

English version

El 13 de junio de 2018 actualizamos los datos del SPARQL endpoint.

La siguiente consulta SPARQL obtiene el número de instancias de cada clase de la ontología DBpedia.

SELECT ?class (COUNT(?s) AS ?count) WHERE {
 ?s a ?class .
 filter (strstarts(str(?s), "http://es.dbpedia.org/resource")) .
 filter (strstarts(str(?class), "http://dbpedia.org/ontology"))
} GROUP BY ?class ORDER BY DESC(?count)

La siguiente figura muestra cómo ha aumentado el número de instancias de la versión anterior (DBpedia 2014) a la nueva (DBpedia 10-2016) para las clases más pobladas.
Por ejemplo, para la clase 'Agent' hemos pasado de tener 276.260 instancias a 363.866.

Si comparamos con la anterior actualización de datos, en la que pasamos de la versión 3.9 a la versión 2014, debemos observar lo siguiente:

  • En la actualización de 2014 se incuyó en el SPARQL endpoint información de es.dbpedia.org y de dbpedia.org por lo que el número de recursos de un tipo dato era algo mayor que el doble de los que había en 2013 (DBpedia 3.9).
  • Para evitar esa duplicidad hemos incluido en la query SPARQL el filtrado de la variable ?s, contando sólo las que comienzan por es.dbpedia.org
  • No intentes ejecutar esta query en el SPARQL endpoint. Dará timeout porque es muy pesada. Nosotros hemos podido ejecutarla porque podemos hacer queries en un entorno sin restricciones de timeout.
  • También hemos actualizado la versión del triple store (Virtuoso), pasando de la versión 6 a la 7. Esto ha producido algunos problemas porque los namespaces conocidos por Virtuoso ha cambiado. Por ejemplo, el namespace dbpedia-owl antes era conocido por Virtuoso, pero ahora no está incluido y hay que explicitarlo en las queries poniendo PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>