Tesis:

Speech signals feature extraction model for a speaker's gender and age identification system.


  • Autor: MUÑOZ MULAS, Cristina Elena

  • Título: Speech signals feature extraction model for a speaker's gender and age identification system.

  • Fecha: 2014

  • Materia: Sin materia definida

  • Escuela: E.T.S DE INGENIEROS INFORMÁTICOS

  • Departamentos: ARQUITECTURA Y TECNOLOGIA DE SISTEMAS INFORMATICOS

  • Acceso electrónico: http://oa.upm.es/33121/

  • Director/a 1º: MARTINEZ OLALLA, Rafael

  • Resumen: Durante el proceso de producción de voz, los factores anatómicos, fisiológicos o psicosociales del individuo modifican los órganos resonadores, imprimiendo en la voz características particulares. Los sistemas ASR tratan de encontrar los matices característicos de una voz y asociarlos a un individuo o grupo. La edad y sexo de un hablante son factores intrínsecos que están presentes en la voz. Este trabajo intenta diferenciar esas características, aislarlas y usarlas para detectar el género y la edad de un hablante. Para dicho fin, se ha realizado el estudio y análisis de las características basadas en el pulso glótico y el tracto vocal, evitando usar técnicas clásicas (como pitch y sus derivados) debido a las restricciones propias de dichas técnicas. Los resultados finales de nuestro estudio alcanzan casi un 100% en reconocimiento de género mientras en la tarea de reconocimiento de edad el reconocimiento se encuentra alrededor del 80%. Parece ser que la voz queda afectada por el género del hablante y las hormonas, aunque no se aprecie en la audición.