HTML Microdata document

This HTML5 document contains 13 embedded RDF statements represented using HTML+Microdata notation.

The embedded RDF content will be recognized by any processor of HTML5 Microdata.

Prefix	Namespace IRI
category-es	http://es.dbpedia.org/resource/CategorÃa:
dct	http://purl.org/dc/terms/
n13	http://numerentur.org/gradiente-descendente/
wikipedia-es	http://es.wikipedia.org/wiki/
dbo	http://dbpedia.org/ontology/
foaf	http://xmlns.com/foaf/0.1/
dbpedia-es	http://es.dbpedia.org/resource/
n4	http://es.wikipedia.org/wiki/Problema_de_desvanecimiento_de_gradiente?oldid=122754236&ns=
rdfs	http://www.w3.org/2000/01/rdf-schema#
rdf	http://www.w3.org/1999/02/22-rdf-syntax-ns#
owl	http://www.w3.org/2002/07/owl#
prov	http://www.w3.org/ns/prov#
xsdh	http://www.w3.org/2001/XMLSchema#
dbr	http://dbpedia.org/resource/

Subject Item: dbpedia-es:Problema_de_desvanecimiento_de_gradiente
rdfs:label: Problema de desvanecimiento de gradiente
rdfs:comment: En aprendizaje de máquinas, el problema de desvanecimiento de gradiente es una dificultad encontrada para entrenar redes neuronales artificiales mediante métodos de aprendizaje basados en descenso estocástico de gradientes y de retropropagación. En tales métodos, cada uno de los pesos de la red neuronal recibe una actualización proporcional a la derivada parcial de la función de error con respecto al peso actual en cada iteración de entrenamiento.
dct:subject: category-es:Redes_neuronales_artificiales category-es:Aprendizaje_automÃ¡tico
foaf:isPrimaryTopicOf: wikipedia-es:Problema_de_desvanecimiento_de_gradiente
dbo:wikiPageID: 9021709
dbo:wikiPageRevisionID: 122754236
dbo:wikiPageExternalLink: n13:
dbo:wikiPageLength: 3570
prov:wasDerivedFrom: n4:0
dbo:abstract: En aprendizaje de máquinas, el problema de desvanecimiento de gradiente es una dificultad encontrada para entrenar redes neuronales artificiales mediante métodos de aprendizaje basados en descenso estocástico de gradientes y de retropropagación. En tales métodos, cada uno de los pesos de la red neuronal recibe una actualización proporcional a la derivada parcial de la función de error con respecto al peso actual en cada iteración de entrenamiento. El problema es que, en algunos casos, el gradiente se irá desvaneciendo a valores muy pequeños, impidiendo eficazmente el peso de cambiar su valor. En el caso peor, esto puede impedir que la red neuronal continúe su entrenamiento. Como ejemplo de la causa del problema, funciones de activación tradicionales como la función de la tangente hiperbólica tienen gradientes en la gama (0, 1), y la retropropagación computa gradientes por la regla de la cadena. Esto tiene el efecto de multiplicar n de estos números pequeños para computar gradientes de las "capas" de frente en una red de n capas, significando que el gradiente (señal de error) disminuye exponencialmente con n mientras las capas de frente se entrenan muy despacio. La retropropagación permitió a los investigadores entrenar redes neuronales supervisadas profundas desde un inicio con muy poco éxito. La tesis de diploma de 1991 de Hochreiter identificó formalmente la razón de este fracaso en el "problema de desvanecimiento de gradiente", lo cual no sólo afectará a las redes prealimentadas de muchas capas, sino también a las redes recurrentes. Estas últimas se entrenan por desdoblamiento en redes neuronales prealimentadas muy profundas, donde se crea una capa nueva cada vez que se da un paso en la secuencia de entrada por la red. Cuando se usan funciones de activación cuyas derivadas pueden tomar valores más grandes, uno de los riesgos es encontrar el denominado problema de gradiente explosivo.

Subject Item: wikipedia-es:Problema_de_desvanecimiento_de_gradiente
foaf:primaryTopic: dbpedia-es:Problema_de_desvanecimiento_de_gradiente

Subject Item: dbr:Vanishing_gradient_problem
owl:sameAs: dbpedia-es:Problema_de_desvanecimiento_de_gradiente