This HTML5 document contains 53 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

PrefixNamespace IRI
category-eshttp://es.dbpedia.org/resource/Categoría:
dcthttp://purl.org/dc/terms/
wikipedia-eshttp://es.wikipedia.org/wiki/
n14http://www.soi.city.ac.uk/~ser/idfpapers/ksj_orig.
dbohttp://dbpedia.org/ontology/
foafhttp://xmlns.com/foaf/0.1/
dbpedia-eshttp://es.dbpedia.org/resource/
prop-eshttp://es.dbpedia.org/property/
rdfshttp://www.w3.org/2000/01/rdf-schema#
n13http://portal.acm.org/citation.cfm%3Fid=
n12http://rdf.freebase.com/ns/m.
rdfhttp://www.w3.org/1999/02/22-rdf-syntax-ns#
owlhttp://www.w3.org/2002/07/owl#
n16http://es.wikipedia.org/wiki/Tf-idf?oldid=121943707&ns=
n8https://archive.org/details/
provhttp://www.w3.org/ns/prov#
xsdhhttp://www.w3.org/2001/XMLSchema#
dbrhttp://dbpedia.org/resource/
Subject Item
wikipedia-es:Tf-idf
foaf:primaryTopic
dbpedia-es:Tf-idf
Subject Item
dbpedia-es:Tf-idf
rdfs:label
Tf-idf
rdfs:comment
Tf-idf (del inglés Term frequency – Inverse document frequency), frecuencia de término – frecuencia inversa de documento (o sea, la frecuencia de ocurrencia del término en la colección de documentos), es una medida numérica que expresa cuán relevante es una palabra para un documento en una colección. Esta medida se utiliza a menudo como un factor de ponderación en la recuperación de información y la minería de texto. El valor tf-idf aumenta proporcionalmente al número de veces que una palabra aparece en el documento, pero es compensada por la frecuencia de la palabra en la colección de documentos, lo que permite manejar el hecho de que algunas palabras son generalmente más comunes que otras.
owl:sameAs
n12:06j2h_
dct:subject
category-es:Funciones category-es:Procesamiento_de_lenguaje_natural
foaf:isPrimaryTopicOf
wikipedia-es:Tf-idf
prop-es:autor
Salton G, Fox EA, Wu H Jones KS Salton G McGill MJ Wu HC, Luk RWP, Wong KF, Kwok KL Salton G, Buckley C
prop-es:año
1988 1986 2008 1972
prop-es:doi
101016 101108 101145
prop-es:editorial
dbpedia-es:McGraw-Hill
prop-es:enlaceautor
Gerard Salton Karen Spärck Jones
prop-es:fecha
noviembre de 1983
prop-es:isbn
0
prop-es:número
5 11 1 3
prop-es:páginas
11 1 1022 513
prop-es:título
Introduction to modern information retrieval Extended Boolean information retrieval Interpreting tf–idf term weights as making relevance decisions A statistical interpretation of term specificity and its application in retrieval Term-weighting approaches in automatic text retrieval
prop-es:url
n8:introductiontomo00salt n13:358466 n14:pdf
prop-es:volumen
28 26 24
dbo:wikiPageID
5530510
dbo:wikiPageRevisionID
121943707
dbo:wikiPageExternalLink
n14:pdf n8:introductiontomo00salt n13:358466
dbo:wikiPageLength
7463
prov:wasDerivedFrom
n16:0
dbo:abstract
Tf-idf (del inglés Term frequency – Inverse document frequency), frecuencia de término – frecuencia inversa de documento (o sea, la frecuencia de ocurrencia del término en la colección de documentos), es una medida numérica que expresa cuán relevante es una palabra para un documento en una colección. Esta medida se utiliza a menudo como un factor de ponderación en la recuperación de información y la minería de texto. El valor tf-idf aumenta proporcionalmente al número de veces que una palabra aparece en el documento, pero es compensada por la frecuencia de la palabra en la colección de documentos, lo que permite manejar el hecho de que algunas palabras son generalmente más comunes que otras. Variaciones del esquema de peso tf-idf son empleadas frecuentemente por los motores de búsqueda como herramienta fundamental para medir la relevancia de un documento dada una consulta del usuario, estableciendo así una ordenación o ranking de los mismos. Tf-idf puede utilizarse exitosamente para el filtrado de las denominadas stop-words (palabras que suelen usarse en casi todos los documentos), en diferentes campos como la clasificación y resumen de texto.​ Una de las funciones de ranking más sencillas se calcula como la suma de los valores tf-idf de cada término de la consulta. Muchas funciones de ranking más complejas constituyen variaciones de este simple modelo.
Subject Item
dbr:Tf–idf
owl:sameAs
dbpedia-es:Tf-idf