Grupo de Facebook DBpedia en español
Notify Twitter

El QALD Challenge es un concurso internacional para fomentar el uso de tecnologías semánticas y de procesamiento de lenguaje natural.

El concurso consiste en entregar a los participantes 100 preguntas en lenguaje natural y las sentencias SPARQL capaces de responder a esas preguntas. Con esos datos, los participantes entrenan sus programas y, el día del concurso, los organizadores presentan 100 preguntas nuevas que deben ser respondidas (como sentencias SPARQL) por los programas. Gana el programa (el equipo que lo diseñó) que más preguntas responda correctamente.

Estas son las preguntas de la segunda edición (QADL-2) y su equivalente sobre esDBpedia:

Mapeos inversos#

Los mapeos son wikipedia --> DBpedia, sin flecha inversa. Esto es, no conozco (MRA) ninguna manera de, dada una clase o una propiedad (DBpedia) saber a qué Infobox (ficha) o qué atributo del infobox (ficha) corresponde.

Por ejemplo, la propiedad starring no tengo manera de saber si está mapeada con algún atributo de algún infobox. Lo único que puedo hacer es ver su domain (Work) y buscar fichas que tengan por nombre traducciones posibles de Work. En este ejemplo, la traducción podría ser Obra, o Trabajo, pero no hay ninguna ficha con este nombre.

Aproximación clase DBpedia --> ficha#

Una manera aproximada de saber qué infobox (ficha) mapea a una clase es esta (ejemplo para la clase Actor):
PREFIX dbo: <http://dbpedia.org/ontology/> 
PREFIX esdbp: <http://es.dbpedia.org/property/> 
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 
SELECT count(?uri) as ?count, ?v WHERE { 
   ?uri rdf:type dbo:Actor . 
   ?uri esdbp:wikiPageUsesTemplate ?v  
} ORDER BY DESC (?count)
que saca una lista muy larga, ordenada por los nombres de las fichas con "mayor probabilidad". En este ejemplo, la más probable es "Ficha_de_actor"

Si usamos esta aproximación para la clase Cave vemos que, al no retornar resultados, lo más probable sea que no está mapeada.

Aproximación propiedad DBpedia --> atributo #

Una aproximación para, dada una propiedad DBpedia, saber a qué atributo de ficha corresponde se tiene con esta query (en este ejemplo para el caso de la propiedad spouse):
PREFIX dbo: <http://dbpedia.org/ontology/> 
PREFIX esdbp: <http://es.dbpedia.org/property/> 
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 
SELECT count(?uri) as ?c, ?prop WHERE { 
   ?uri dbo:spouse ?v . 
   ?uri ?prop ?v  . 
   FILTER regex(?prop,'http://es.dbpedia.org/property')
} ORDER BY DESC (?c)
En este caso, por abrumadora mayoría, el atributo más probable es esdbp:cónyuge

Aproximación propiedad DBpedia --> atributo Y ficha#

Refinamos un poco más la consulta anterior y obtenemos:
PREFIX dbo: <http://dbpedia.org/ontology/> 
PREFIX esdbp: <http://es.dbpedia.org/property/> 
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 
SELECT count(?uri) as ?c, ?prop, ?ficha WHERE { 
   ?uri dbo:spouse ?v . 
   ?uri ?prop ?v  . 
   ?uri esdbp:wikiPageUsesTemplate ?ficha .  
   FILTER regex(?prop,'http://es.dbpedia.org/property')
} ORDER BY DESC (?c)
Obtenemos el desglose de los atributos anteriores por fichas. En este ejemplo, vemos que es esdbp:cónyuge proveniente, sobretodo, de las fichas de "Ficha_de_actor" y "Ficha_de_persona".

Hay propiedades para las que el coste de cálculo es muy alto. Por ejemplo: dbo:populationTotal (salta timeout)

¡OJO!: dbo:spouse es una propiedad de DBpedia, fruto de un mapeo. Pero, parece (resultado II Jornadas) que si existe un mapeo infobox--> clase y no están mapeadas todos sus atributos, el extractor mapea TODOS los atributos: para los que están mapeados usa el mapeo indicado usando dbo:propiedadLaQueSea, pero los que no están mapeados usa esdbp:propiedadLaQueSea. Por tanto, cuando la propiedad NO es dbo:loQueSea sino esdbp:loQueSea, la aproximación para el mapeo queda así (ejemplo para esdbp:diseño):

PREFIX esdbp: <http://dbpedia.org/property/> 
PREFIX esdbp: <http://es.dbpedia.org/property/> 
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 
SELECT count(?uri) as ?c, ?prop, ?ficha WHERE { 
   ?uri esdbp:diseño ?v . 
   ?uri ?prop ?v  . 
   ?uri esdbp:wikiPageUsesTemplate ?ficha .  
   FILTER regex(?prop,'http://es.dbpedia.org/property')
} ORDER BY DESC (?c)

Infobox de la wikipedia inglesa --> ficha de wikipedia del español#

Por ejemplo, en la página The_Scream de la wikipedia inglesa se puede ver que usa el "infobox artwork". Nos gustaría saber si ese infobox tiene un equivalente (con qué nombre) en esWikipedia.

ug... ni idea :-(

atributo de Infobox de la wikipedia inglesa --> atributo de ficha de wikipedia del español#

Por ejemplo, en la página Illinois de la wikipedia inglesa se puede ver que en el "infobox U.S. state" se usa la propiedad "BorderingStates". Nos gustaría saber si ese atributo tiene un equivalente (con qué nombre) en alguna ficha esWikipedia.

ug... ni idea :-(