Show simple item record

dc.contributor.advisorVera Olivera, Harley
dc.contributor.authorZuñiga Rojas, Gabriela
dc.date.accessioned2024-12-12T23:33:24Z
dc.date.available2024-12-12T23:33:24Z
dc.date.issued2024
dc.identifier.other253T20241266
dc.identifier.urihttp://hdl.handle.net/20.500.12918/10014
dc.description.abstractEn el presente trabajo de investigación intitulada: “MODELO DE EXTRACCIÓN AUTOMÁTICA DE GLOSARIO DE TÉRMINOS UTILIZANDO TÉCNICAS DE PROCESAMIENTO DE LENGUAJE NATURAL Y CLUSTERING”, para abordar la complejidad y esfuerzo manual que representa la extracción de términos para glosarios a partir de requisitos funcionales en proyectos de desarrollo de software a gran escala, proponemos un enfoque automatizado para la extracción y agrupamiento de términos de glosario. El método combina técnicas de pre-procesamiento y heurísticas para la identificación de términos, junto con embeddings generados con FastText para medir similitudes semánticas. Para el agrupamiento se emplearon los algoritmos 𝐾-means, Expectation Maximization (EM) y Clusterización Jerárquica. La técnica fue aplicada a un conjunto de 2966 requisitos obteniéndose 318 grupos semánticos, y su eficacia fue evaluada mediante la distancia de Wasserstein (Word Mover's Distance) de 0.0113, el cual comparando los resultados automáticos con agrupamientos manuales es menor. Los experimentos mostraron que el uso de FastText y EM logra una agrupación semántica efectiva y consistente, validando la aplicabilidad del enfoque en entornos reales de desarrollo de software.es_PE
dc.formatapplication/pdfen_US
dc.language.isospaes_PE
dc.publisherUniversidad Nacional de San Antonio Abad del Cuscoes_PE
dc.rightsinfo:eu-repo/semantics/embargoedAccessen_US
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectGlosarioes_PE
dc.subjectLenguaje naturales_PE
dc.subjectSoftwarees_PE
dc.subjectClusteringes_PE
dc.titleModelo de extracción automática de glosario de términos utilizando técnicas de procesamiento de lenguaje natural y Clusteringes_PE
dc.typeinfo:eu-repo/semantics/masterThesis
thesis.degree.nameMaestro en Ciencias mención Informática
thesis.degree.grantorUniversidad Nacional de San Antonio Abad del Cusco. Escuela de Posgrado
thesis.degree.disciplineMaestría en Ciencias mención Informática
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#1.02.02
renati.author.dni45073823
renati.advisor.orcidhttps://orcid.org/0000-0003-2011-8797
renati.advisor.dni42541815
renati.typehttp://purl.org/pe-repo/renati/type#tesis
renati.levelhttp://purl.org/pe-repo/renati/nivel#maestro
renati.discipline611027
renati.jurorEnciso Rodas, Lauro
renati.jurorDueñas Jimenez, Ray
renati.jurorMedrano Valencia, Ivan Cesar
renati.jurorMontoya Cubas, Carlos Fernando
dc.publisher.countryPE


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/embargoedAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/embargoedAccess