Grupo de Facebook DBpedia en español
Notify Twitter

1) Ejecuta isql#

En línea de comandos (Para Windows y Linux) accede al directorio DIRVIRTUOSO/bin y ejecuta el comando isql. OJO! Asegúrate de que se está ejecutando ese isql y no otro (en Ububtu 10 hay otro para gestionar MySQL). Se debe mostrar el siguiente prompt:

 SQL>

2) Indica el fichero a cargar#

Teclea el comando ld_dir con los siguientes argumentos:

  • Directorio donde está el fichero, relativo al directorio bin de virtuoso. Eg.: ../../../ExtractionResult/es/
  • Nombre del fichero a cargar. Eg.: disambiguations_es.nt
  • Named Graph IRI: Eg.: http://localhost:8890/DAV/esdbpedia (si no tienes claro qué es esto mira Instalación del SPARQL endpoint)

Para este ejemplo, el comando sería:

ld_dir ('/home/pepe/DBpedia/ExtractionResult/es/', 'disambiguations_es.nt', 'http://localhost:8890/DAV/esdbpedia');

isql responderá inmediatamente con un lacónico "Done.". OJO!: Aún no se ha ejecutado la carga real. Podemos seguir invocando comandos ld_dir hasta tener todos los ficheros dispuestos para la carga real.

Nota: el argumento del nombre de fichero admite expresiones regulares para indicar múltiples ficheros. Por ejemplo, admite '*_es.nt' para cargar todos los ficheros terminados en "_es.nt" que se encuentren en el directorio indicado en el primer argumento.

3) Carga "real" de los ficheros de triples#

En el prompt de isql hay que ejecutar el comando

rdf_loader_run ();

Esto lanza todo el proceso de carga de los fichero sindicados por los comandos ld_dir.

4) Espera...#

Dependiendo de la máquina en la que esté instalado Virtuoso, el proceso de carga puede ser largo o terriblemente largo.

Por ejemplo, la siguiente tabla muestra la duración de los procesos de carga de fichero de triples (en formato .nt) en distintas máquinas:

1) Máquina con 8 procesadores i7 y 12GB de RAM, con Ubuntu 10:

tamaño del fichero (.nt) tiempo
26 MB 8 s
200 MB 2.5 min
1.8 GB 22 min
(Aprox, 1 min por cada 100MB)

2) Portátil con Core2 Duo @2.2GHz y 4GB RAM, con Windows 7 de 64bits

(Aprox, 6.5 min por cada 100MB)