dc.contributor.advisor | Vera Olivera, Harley | |
dc.contributor.author | Zuñiga Rojas, Gabriela | |
dc.date.accessioned | 2024-12-12T23:33:24Z | |
dc.date.available | 2024-12-12T23:33:24Z | |
dc.date.issued | 2024 | |
dc.identifier.other | 253T20241266 | |
dc.identifier.uri | http://hdl.handle.net/20.500.12918/10014 | |
dc.description.abstract | En el presente trabajo de investigación intitulada: “MODELO DE EXTRACCIÓN AUTOMÁTICA DE GLOSARIO DE TÉRMINOS UTILIZANDO TÉCNICAS DE PROCESAMIENTO DE LENGUAJE NATURAL Y CLUSTERING”, para abordar la complejidad y esfuerzo manual que representa la extracción de términos para glosarios a partir de requisitos funcionales en proyectos de desarrollo de software a gran escala, proponemos un enfoque automatizado para la extracción y agrupamiento de términos de glosario. El método combina técnicas de pre-procesamiento y heurísticas para la identificación de términos, junto con embeddings generados con FastText para medir similitudes semánticas. Para el agrupamiento se emplearon los algoritmos 𝐾-means, Expectation Maximization (EM) y Clusterización Jerárquica. La técnica fue aplicada a un conjunto de 2966 requisitos obteniéndose 318 grupos semánticos, y su eficacia fue evaluada mediante la distancia de Wasserstein (Word Mover's Distance) de 0.0113, el cual comparando los resultados automáticos con agrupamientos manuales es menor. Los experimentos mostraron que el uso de FastText y EM logra una agrupación semántica efectiva y consistente, validando la aplicabilidad del enfoque en entornos reales de desarrollo de software. | es_PE |
dc.format | application/pdf | en_US |
dc.language.iso | spa | es_PE |
dc.publisher | Universidad Nacional de San Antonio Abad del Cusco | es_PE |
dc.rights | info:eu-repo/semantics/embargoedAccess | en_US |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Glosario | es_PE |
dc.subject | Lenguaje natural | es_PE |
dc.subject | Software | es_PE |
dc.subject | Clustering | es_PE |
dc.title | Modelo de extracción automática de glosario de términos utilizando técnicas de procesamiento de lenguaje natural y Clustering | es_PE |
dc.type | info:eu-repo/semantics/masterThesis | |
thesis.degree.name | Maestro en Ciencias mención Informática | |
thesis.degree.grantor | Universidad Nacional de San Antonio Abad del Cusco. Escuela de Posgrado | |
thesis.degree.discipline | Maestría en Ciencias mención Informática | |
dc.subject.ocde | http://purl.org/pe-repo/ocde/ford#1.02.02 | |
renati.author.dni | 45073823 | |
renati.advisor.orcid | https://orcid.org/0000-0003-2011-8797 | |
renati.advisor.dni | 42541815 | |
renati.type | http://purl.org/pe-repo/renati/type#tesis | |
renati.level | http://purl.org/pe-repo/renati/nivel#maestro | |
renati.discipline | 611027 | |
renati.juror | Enciso Rodas, Lauro | |
renati.juror | Dueñas Jimenez, Ray | |
renati.juror | Medrano Valencia, Ivan Cesar | |
renati.juror | Montoya Cubas, Carlos Fernando | |
dc.publisher.country | PE | |