Modelo de extracción automática de glosario de términos utilizando técnicas de procesamiento de lenguaje natural y Clustering

Zuñiga Rojas, Gabriela

dc.contributor.advisor	Vera Olivera, Harley
dc.contributor.author	Zuñiga Rojas, Gabriela
dc.date.accessioned	2024-12-12T23:33:24Z
dc.date.available	2024-12-12T23:33:24Z
dc.date.issued	2024
dc.identifier.other	253T20241266
dc.identifier.uri	http://hdl.handle.net/20.500.12918/10014
dc.description.abstract	En el presente trabajo de investigación intitulada: “MODELO DE EXTRACCIÓN AUTOMÁTICA DE GLOSARIO DE TÉRMINOS UTILIZANDO TÉCNICAS DE PROCESAMIENTO DE LENGUAJE NATURAL Y CLUSTERING”, para abordar la complejidad y esfuerzo manual que representa la extracción de términos para glosarios a partir de requisitos funcionales en proyectos de desarrollo de software a gran escala, proponemos un enfoque automatizado para la extracción y agrupamiento de términos de glosario. El método combina técnicas de pre-procesamiento y heurísticas para la identificación de términos, junto con embeddings generados con FastText para medir similitudes semánticas. Para el agrupamiento se emplearon los algoritmos 𝐾-means, Expectation Maximization (EM) y Clusterización Jerárquica. La técnica fue aplicada a un conjunto de 2966 requisitos obteniéndose 318 grupos semánticos, y su eficacia fue evaluada mediante la distancia de Wasserstein (Word Mover's Distance) de 0.0113, el cual comparando los resultados automáticos con agrupamientos manuales es menor. Los experimentos mostraron que el uso de FastText y EM logra una agrupación semántica efectiva y consistente, validando la aplicabilidad del enfoque en entornos reales de desarrollo de software.	es_PE
dc.format	application/pdf	en_US
dc.language.iso	spa	es_PE
dc.publisher	Universidad Nacional de San Antonio Abad del Cusco	es_PE
dc.rights	info:eu-repo/semantics/embargoedAccess	en_US
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Glosario	es_PE
dc.subject	Lenguaje natural	es_PE
dc.subject	Software	es_PE
dc.subject	Clustering	es_PE
dc.title	Modelo de extracción automática de glosario de términos utilizando técnicas de procesamiento de lenguaje natural y Clustering	es_PE
dc.type	info:eu-repo/semantics/masterThesis
thesis.degree.name	Maestro en Ciencias mención Informática
thesis.degree.grantor	Universidad Nacional de San Antonio Abad del Cusco. Escuela de Posgrado
thesis.degree.discipline	Maestría en Ciencias mención Informática
dc.subject.ocde	http://purl.org/pe-repo/ocde/ford#1.02.02
renati.author.dni	45073823
renati.advisor.orcid	https://orcid.org/0000-0003-2011-8797
renati.advisor.dni	42541815
renati.type	http://purl.org/pe-repo/renati/type#tesis
renati.level	http://purl.org/pe-repo/renati/nivel#maestro
renati.discipline	611027
renati.juror	Enciso Rodas, Lauro
renati.juror	Dueñas Jimenez, Ray
renati.juror	Medrano Valencia, Ivan Cesar
renati.juror	Montoya Cubas, Carlos Fernando
dc.publisher.country	PE