Identificación de locutor usando codebooks de coeficientes cepstrales en las frecuencias de Mel y modelos ocultos de Markov

Show simple item record

dc.contributor.advisor Villafuerte Serna, Rony
dc.contributor.author Auccapuma Gamarra, Jhon Dennis
dc.contributor.author Mamani Condori, Errol Wilderd
dc.date.accessioned 2017-12-27T15:32:47Z
dc.date.available 2017-12-27T15:32:47Z
dc.date.issued 2016
dc.identifier.other 253T20160079
dc.identifier.uri http://repositorio.unsaac.edu.pe/handle/UNSAAC/2466
dc.description.abstract El habla es un tipo de señal complicada producto del resultado de una serie de trans¬formaciones ocurridas en diferentes niveles: semántica, lingüística y acústica. Estas trans¬formaciones conducen a diferencias en las características de un individuo ampliamente estudiadas por la Biometría. La identificación de locutor (identificar quién es la persona que emitió la voz) en síntesis, es un análisis detallado de las características del habla de cada individuo basado en puntuaciones. En este contexto este proyecto se centró en la identificación de locutor mediante Coeficientes Cepstrales en las Frecuencias Mel o Mel Frequency Cepstral Cofficients (MPCC) y Modelos Ocultos de Markov o Hidden Markov Model (HMM). Iniciando el procesamiento de voz, para obtener las características más importantes de un individuo se utilizó Coeficientes Cepstrales en las Frecuencias Mel , debido a que en la actualidad otorgan los mejores resultarlos en el análisis Cepstral según el estado de arte, posteriormente; se hiso uso de la cuantificación vectorial o Vector quan- tization (VQ) que por medio del algoritmo de clasificación K-means ,divide el conjunto de vectores característicos en un número determinado de vectores representativos, los cuales mejoran sustancialmente el tiempo de procesamiento. Para el modelamiento de los de vectores representativos se hiso uso de los Modelos Ocultos de Markov; los HMMs son en¬trenados para generar el modelo oculto del locutor el cual estará formado por la secuencia de observaciones (símbolos de observación) y la secuencia de estados, para luego encontrar la secuencia de estados con mayor probabilidad, la identidad de un locutor se determi¬na mediante el modelo que obtenga la máxima probabilidad (puntuación) determinado por el algoritmo de Viterbi. Adicionalmente se estimaron los parámetros de los módulos de pre procesamiento, extracción de características, pos procesamiento v el cuantificador vectorial basado en codebooks; para sugerir el tamaño de codebook más adecuado y los parámetros con los que se obtenga buenos resultados en la identificación de un locutor ;para cada módulo se describió la teoría y la implementación del código fuente en Java. Finalmente, nuestros resultados experimentales muestran los parámetros con los que se obtienen buenos resultados teniendo un 90% de aceptación para un grupo reducido y cerrado de 5 personas en condiciones reales (con ruido de fondo), con una tendencia de decrecimiento a medida que aumenta el número de población y una mayor efectividad en condiciones ideales (ambiente cerrado y sin ruido de fondo). es_PE
dc.description.uri Tesis
dc.format application/pdf en_US
dc.language.iso spa es_PE
dc.publisher Universidad Nacional de San Antonio Abad del Cusco es_PE
dc.rights info:eu-repo/semantics/restrictedAccess en_US
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/2.5/pe/ *
dc.source Universidad Nacional de San Antonio Abad del Cusco es_PE
dc.source Repositorio Institucional - UNSAAC es_PE
dc.subject Biometría es_PE
dc.subject MFCC es_PE
dc.subject HMM es_PE
dc.subject VQ es_PE
dc.subject K-means es_PE
dc.title Identificación de locutor usando codebooks de coeficientes cepstrales en las frecuencias de Mel y modelos ocultos de Markov es_PE
dc.type info:eu-repo/semantics/bachelorThesis
thesis.degree.name Ingeniero Informático y de Sistemas
thesis.degree.grantor Universidad Nacional de San Antonio Abad del Cusco. Facultad de Ingeniería Eléctrica, Electrónica, Informática y Mecánica
thesis.degree.level Título profesional
thesis.degree.discipline Ingeniería Informática y de Sistemas
dc.subject.ocde Automatización y Sistemas de Control 


Files in this item

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/restrictedAccess Except where otherwise noted, this item's license is described as info:eu-repo/semantics/restrictedAccess

Search DSpace


Browse

My Account

Statistics