Preguntas abiertas


Esta es una lista de preguntas, con o sin respuesta, sobre la información contenida en es.DBpedia.

Lo ideal sería hacer una lista de quality issues como la que tiene qSKOS (María, gracias por el link): https://github.com/cmader/qSKOS/wiki/Quality-Issues

1.- ¿Puedo saber qué ríos tienen una longitud superior a 1000km?#

MRA: Aunque hay un mapeo 'Ficha_de_río', las páginas wikipedia de Guadalquivir o Ebro usan la ficha 'Cuerpo de agua', para la que aún no hay mapeo.
La página 'Ríos de España' tiene una tabla que podría mapearse.
La categoría 'Ríos de España' tiene una subcategoría de 'ríos por provincia' que puede ser interesante.

SELECT * WHERE {
?rio dcterms:subject <http://es.dbpedia.org/resource/Categoría:Ríos_de_España> .
?rio <http://es.dbpedia.org/property/longitud> ?v
}

Pero sólo devuelve un resultado. Es como si sólo uno de los ríos de la categoría indicase la longitud.

Una manera de preguntárselo a dbpedia.org (No la del idioma español sino la general) sería esta:

SELECT ?uri ?lon WHERE{
 ?uri rdf:type dbpedia-owl:River.
 ?uri dbpprop:length ?lon
}ORDER BY DESC (?lon)
LIMIT 5

Por cierto, ¿qué río es el Molawin? :-P

Tareas pendientes:

2.- ¿Puedo saber cuál es el nombre de la capital de cada provincia española?#

MRA: Hay una página en wikipedia llamada 'Provincia de España', con una tabla (ver pregunta 1) de la que se podría sacar
Cada provincia tiene una ficha "localidad de España".
Por type 'Provincias_de_España ' sólo salen 32. Esta sería la query:
PREFIX esdbpr: <http://es.dbpedia.org/resource/> 
PREFIX esdbpp: <http://es.dbpedia.org/property/> 
SELECT ?uri ?c   WHERE{
   ?uri dbpedia-owl:type esdbpr:Provincias_de_España .
   ?uri esdbpp:capital   ?c
}

Además, los resultados son del tipo Provincia_de_XXX salvo casos como Vizcaya o Álava.

Tareas pendientes:

3.- ¿Puedo saber en qué capitales de provincia de España gobierna el PP?#

MRA: Cada provincia (ver preguntas anteriores) tiene un alcalde, y ese alcalde pertenece a un partido político. Pero hay que ir con cuidado...

Esta consulta muestra los alcaldes de las capitales de provincia

PREFIX esdbpr: <http://es.dbpedia.org/resource/> 
PREFIX esdbpp: <http://es.dbpedia.org/property/> 
PREFIX esdbpo: <http://es.dbpedia.org/ontology/> 
SELECT ?uriprov ?uriciu ?urialc   WHERE{
   ?uriprov dbpedia-owl:type esdbpr:Provincias_de_España .
   ?uriprov esdbpp:capital   ?uriciu .
   ?uriciu  esdbpp:alcalde   ?urialc .
}

Observa que: 1) los alcaldes aparecen a veces como recurso, a veces como literal. 2) hay capitales con varios alcaldes --> alcaldes antiguos y nuevos

Si vamos a preguntar por la propiedad 'partido' de cada alcalde, debemos eliminar los alcaldes que obtenemos como un literal. Este paso es fundamental: si no hacemos esto no abtendremos ningún resultado.

Algo como esto nos nuestra los partidos políticos a los que pertenecen los alcaldes de las capitales de provincia:

PREFIX esdbpr: <http://es.dbpedia.org/resource/> 
PREFIX esdbpp: <http://es.dbpedia.org/property/> 
PREFIX esdbpo: <http://es.dbpedia.org/ontology/> 
SELECT ?uriprov ?uriciu ?urialc ?part  WHERE{
   ?uriprov dbpedia-owl:type esdbpr:Provincias_de_España .
   ?uriprov esdbpp:capital   ?uriciu .
   ?uriciu  esdbpp:alcalde   ?urialc .
   ?urialc  dbpedia-owl:party ?part
   FILTER (isiri(?urialc))
}
}

Los alcaldes tienen la propiedad 'sucesor', que vale "En el cargo" en el caso de los alcaldes actuales. Con esta consulta obtenemos los alcaldes actuales:

PREFIX esdbpr: <http://es.dbpedia.org/resource/> 
PREFIX esdbpp: <http://es.dbpedia.org/property/> 
SELECT ?uriprov ?uriciu ?urialc ?part ?suce WHERE{
   ?uriprov dbpedia-owl:type esdbpr:Provincias_de_España .
   ?uriprov esdbpp:capital   ?uriciu .
   ?uriciu  esdbpp:alcalde   ?urialc .
   ?urialc  esdbpp:partido ?part .
   ?urialc  esdbpp:sucesor ?suce .
   FILTER (isiri(?urialc) && REGEX(?suce, 'En el cargo'))
}
}
Obteniendo 8 resultados, de los que 3 aparecen como recurso "Partido Popular" y en un caso aparece como el recurso "PP".

Esta consulta nos devolvería los que tienen el recurso "Partido Popular", pero se dejaría fuera el caso del recurso "PP":

PREFIX esdbpr: <http://es.dbpedia.org/resource/> 
PREFIX esdbpp: <http://es.dbpedia.org/property/> 
PREFIX esdbpo: <http://es.dbpedia.org/ontology/> 
SELECT ?uriciu ?urialc WHERE{
   ?uriprov dbpedia-owl:type esdbpr:Provincias_de_España .
   ?uriprov esdbpp:capital   ?uriciu .
   ?uriciu  esdbpp:alcalde   ?urialc .
   ?urialc  esdbpp:partido ?part .
   ?urialc  esdbpp:sucesor ?suce .
   ?urialc  esdbpp:partido esdbpr:Partido_Popular .
   FILTER (isiri(?urialc) && REGEX(?suce, 'En el cargo'))

Debemos unir los dos casos, quedado una consulta como esta:

PREFIX esdbpr: <http://es.dbpedia.org/resource/> 
PREFIX esdbpp: <http://es.dbpedia.org/property/> 
SELECT ?uriciu ?urialc ?part WHERE{
   {
   ?uriprov dbpedia-owl:type esdbpr:Provincias_de_España .
   ?uriprov esdbpp:capital   ?uriciu .
   ?uriciu  esdbpp:alcalde   ?urialc .
   ?urialc  esdbpp:partido ?part .
   ?urialc  esdbpp:sucesor ?suce .
   ?urialc  esdbpp:partido esdbpr:Partido_Popular 
   }UNION {
   ?uriprov dbpedia-owl:type esdbpr:Provincias_de_España .
   ?uriprov esdbpp:capital   ?uriciu .
   ?uriciu  esdbpp:alcalde   ?urialc .
   ?urialc  esdbpp:partido ?part .
   ?urialc  esdbpp:sucesor ?suce . 
   ?urialc  esdbpp:partido esdbpr:PP 
   }   
   FILTER (isiri(?urialc) && REGEX(?suce, 'En el cargo'))
}

O ha cambiado el panorama político, y yo no me he enterado, o aquí faltan capitales de provincia :-P

Tareas pendientes:

4.- ¿Cuántas veces ha ganado Rafael Nadal el torneo Roland Garros?#

MRA: Esta consulta proporciona los jugadores de tenis que han ganado en Roland Garros
PREFIX esdbpr: <http://es.dbpedia.org/resource/> 
PREFIX esdbpp: <http://es.dbpedia.org/property/> 
SELECT ?person  WHERE{
  ?person  rdf:type             dbpedia-owl:TennisPlayer .
  ?person  esdbpp:resultadorolandgarros  ?res  
  FILTER(regex(?res,'G'))
}

Nota: Hay que mejoral la ficha de tenista. En la ficha actual, detrás de la 'G' viene una lista de años en los que ha sido 'G'. Esa lista de años se pierde en el proceso de extracción.
Por tanto, no tenemos manera de sacar los años en los que ha sido campeón. La lista anterior saca los tenistas que alguna vez han ganado Roland Garros.
En es.wikipedia hay una categoría que tiene la lista de ganadores de RG por años, pero es una tabla para la que no hay mapeo. http://es.wikipedia.org/wiki/Anexo:Campeones_de_Roland_Garros_(individual_masculino)

Tareas pendientes:

5.- ¿Qué propiedades en los recursos son de tipo xsd:date?#