Show simple item record

dc.contributor.advisorVillafuerte Serna, Rony
dc.contributor.authorAuccapuma Gamarra, Jhon Dennis
dc.contributor.authorMamani Condori, Errol Wilderd
dc.date.accessioned2017-12-27T15:32:47Z
dc.date.available2017-12-27T15:32:47Z
dc.date.issued2016
dc.identifier.other253T20160079
dc.identifier.urihttp://hdl.handle.net/20.500.12918/2466
dc.description.abstractEl habla es un tipo de señal complicada producto del resultado de una serie de trans¬formaciones ocurridas en diferentes niveles: semántica, lingüística y acústica. Estas trans¬formaciones conducen a diferencias en las características de un individuo ampliamente estudiadas por la Biometría. La identificación de locutor (identificar quién es la persona que emitió la voz) en síntesis, es un análisis detallado de las características del habla de cada individuo basado en puntuaciones. En este contexto este proyecto se centró en la identificación de locutor mediante Coeficientes Cepstrales en las Frecuencias Mel o Mel Frequency Cepstral Cofficients (MPCC) y Modelos Ocultos de Markov o Hidden Markov Model (HMM). Iniciando el procesamiento de voz, para obtener las características más importantes de un individuo se utilizó Coeficientes Cepstrales en las Frecuencias Mel , debido a que en la actualidad otorgan los mejores resultarlos en el análisis Cepstral según el estado de arte, posteriormente; se hiso uso de la cuantificación vectorial o Vector quan- tization (VQ) que por medio del algoritmo de clasificación K-means ,divide el conjunto de vectores característicos en un número determinado de vectores representativos, los cuales mejoran sustancialmente el tiempo de procesamiento. Para el modelamiento de los de vectores representativos se hiso uso de los Modelos Ocultos de Markov; los HMMs son en¬trenados para generar el modelo oculto del locutor el cual estará formado por la secuencia de observaciones (símbolos de observación) y la secuencia de estados, para luego encontrar la secuencia de estados con mayor probabilidad, la identidad de un locutor se determi¬na mediante el modelo que obtenga la máxima probabilidad (puntuación) determinado por el algoritmo de Viterbi. Adicionalmente se estimaron los parámetros de los módulos de pre procesamiento, extracción de características, pos procesamiento v el cuantificador vectorial basado en codebooks; para sugerir el tamaño de codebook más adecuado y los parámetros con los que se obtenga buenos resultados en la identificación de un locutor ;para cada módulo se describió la teoría y la implementación del código fuente en Java. Finalmente, nuestros resultados experimentales muestran los parámetros con los que se obtienen buenos resultados teniendo un 90% de aceptación para un grupo reducido y cerrado de 5 personas en condiciones reales (con ruido de fondo), con una tendencia de decrecimiento a medida que aumenta el número de población y una mayor efectividad en condiciones ideales (ambiente cerrado y sin ruido de fondo).es_PE
dc.description.uriTesis
dc.formatapplication/pdfen_US
dc.language.isospaes_PE
dc.publisherUniversidad Nacional de San Antonio Abad del Cuscoes_PE
dc.rightsinfo:eu-repo/semantics/closedAccessen_US
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/pe/*
dc.sourceUniversidad Nacional de San Antonio Abad del Cuscoes_PE
dc.sourceRepositorio Institucional - UNSAACes_PE
dc.subjectBiometríaes_PE
dc.subjectMFCCes_PE
dc.subjectHMMes_PE
dc.subjectVQes_PE
dc.subjectK-meanses_PE
dc.titleIdentificación de locutor usando codebooks de coeficientes cepstrales en las frecuencias de Mel y modelos ocultos de Markoves_PE
dc.typeinfo:eu-repo/semantics/bachelorThesis
thesis.degree.nameIngeniero Informático y de Sistemas
thesis.degree.grantorUniversidad Nacional de San Antonio Abad del Cusco. Facultad de Ingeniería Eléctrica, Electrónica, Informática y Mecánica
thesis.degree.levelTítulo profesional
thesis.degree.disciplineIngeniería Informática y de Sistemas
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#2.02.03
renati.author.dni47133915
renati.author.dni46511982
renati.advisor.orcidhttps://orcid.org/0000-0003-4607-522X
renati.advisor.dni23957778
renati.typehttp://purl.org/pe-repo/renati/type#tesis
renati.levelhttp://purl.org/pe-repo/renati/nivel#tituloProfesional
renati.discipline612296
dc.publisher.countryPE


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/closedAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/closedAccess