HTML Microdata document

This HTML5 document contains 53 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

Prefix	Namespace IRI
category-es	http://es.dbpedia.org/resource/CategorÃa:
dct	http://purl.org/dc/terms/
wikipedia-es	http://es.wikipedia.org/wiki/
n14	http://www.soi.city.ac.uk/~ser/idfpapers/ksj_orig.
dbo	http://dbpedia.org/ontology/
foaf	http://xmlns.com/foaf/0.1/
dbpedia-es	http://es.dbpedia.org/resource/
prop-es	http://es.dbpedia.org/property/
rdfs	http://www.w3.org/2000/01/rdf-schema#
n13	http://portal.acm.org/citation.cfm%3Fid=
n12	http://rdf.freebase.com/ns/m.
rdf	http://www.w3.org/1999/02/22-rdf-syntax-ns#
owl	http://www.w3.org/2002/07/owl#
n16	http://es.wikipedia.org/wiki/Tf-idf?oldid=121943707&ns=
n8	https://archive.org/details/
prov	http://www.w3.org/ns/prov#
xsdh	http://www.w3.org/2001/XMLSchema#
dbr	http://dbpedia.org/resource/

Subject Item: wikipedia-es:Tf-idf
foaf:primaryTopic: dbpedia-es:Tf-idf

Subject Item: dbpedia-es:Tf-idf
rdfs:label: Tf-idf
rdfs:comment: Tf-idf (del inglés Term frequency – Inverse document frequency), frecuencia de término – frecuencia inversa de documento (o sea, la frecuencia de ocurrencia del término en la colección de documentos), es una medida numérica que expresa cuán relevante es una palabra para un documento en una colección. Esta medida se utiliza a menudo como un factor de ponderación en la recuperación de información y la minería de texto. El valor tf-idf aumenta proporcionalmente al número de veces que una palabra aparece en el documento, pero es compensada por la frecuencia de la palabra en la colección de documentos, lo que permite manejar el hecho de que algunas palabras son generalmente más comunes que otras.
owl:sameAs: n12:06j2h_
dct:subject: category-es:Funciones category-es:Procesamiento_de_lenguaje_natural
foaf:isPrimaryTopicOf: wikipedia-es:Tf-idf
prop-es:autor: Salton G, Fox EA, Wu H Jones KS Salton G McGill MJ Wu HC, Luk RWP, Wong KF, Kwok KL Salton G, Buckley C
prop-es:aÃ±o: 1988 1986 2008 1972
prop-es:doi: 101016 101108 101145
prop-es:editorial: dbpedia-es:McGraw-Hill
prop-es:enlaceautor: Gerard Salton Karen Spärck Jones
prop-es:fecha: noviembre de 1983
prop-es:isbn: 0
prop-es:nÃºmero: 5 11 1 3
prop-es:pÃ¡ginas: 11 1 1022 513
prop-es:tÃtulo: Introduction to modern information retrieval Extended Boolean information retrieval Interpreting tf–idf term weights as making relevance decisions A statistical interpretation of term specificity and its application in retrieval Term-weighting approaches in automatic text retrieval
prop-es:url: n8:introductiontomo00salt n13:358466 n14:pdf
prop-es:volumen: 28 26 24
dbo:wikiPageID: 5530510
dbo:wikiPageRevisionID: 121943707
dbo:wikiPageExternalLink: n14:pdf n8:introductiontomo00salt n13:358466
dbo:wikiPageLength: 7463
prov:wasDerivedFrom: n16:0
dbo:abstract: Tf-idf (del inglés Term frequency – Inverse document frequency), frecuencia de término – frecuencia inversa de documento (o sea, la frecuencia de ocurrencia del término en la colección de documentos), es una medida numérica que expresa cuán relevante es una palabra para un documento en una colección. Esta medida se utiliza a menudo como un factor de ponderación en la recuperación de información y la minería de texto. El valor tf-idf aumenta proporcionalmente al número de veces que una palabra aparece en el documento, pero es compensada por la frecuencia de la palabra en la colección de documentos, lo que permite manejar el hecho de que algunas palabras son generalmente más comunes que otras. Variaciones del esquema de peso tf-idf son empleadas frecuentemente por los motores de búsqueda como herramienta fundamental para medir la relevancia de un documento dada una consulta del usuario, estableciendo así una ordenación o ranking de los mismos. Tf-idf puede utilizarse exitosamente para el filtrado de las denominadas stop-words (palabras que suelen usarse en casi todos los documentos), en diferentes campos como la clasificación y resumen de texto. Una de las funciones de ranking más sencillas se calcula como la suma de los valores tf-idf de cada término de la consulta. Muchas funciones de ranking más complejas constituyen variaciones de este simple modelo.

Subject Item: dbr:Tfâidf
owl:sameAs: dbpedia-es:Tf-idf