Tesis:

Digital signal processing techniques for application in the analysis of pathological voice and normophonic singing voice


  • Autor: MURPHY, Katharine

  • Título: Digital signal processing techniques for application in the analysis of pathological voice and normophonic singing voice

  • Fecha: 2008

  • Materia: Ciencias de la computación y tecnología informática

  • Escuela: FACULTAD DE INFORMATICA

  • Departamentos: ARQUITECTURA Y TECNOLOGIA DE SISTEMAS INFORMATICOS

  • Acceso electrónico: http://oa.upm.es/1079

  • Director/a 1º: GOMEZ VILDA, Pedro

  • Resumen: Singing voice is one specific example of vocal sound made by human beings. If we consider the larynx apparatus as a type of singing instrument then we can further say that sung voice is perhaps the best and most stable utilisation of such an instrument. Singing remains at a stable pitch over time, and professional singers may well be the people who utilise the vocal apparatus most appropriately. If we compare a healthy sustained vowel given by a non-singer to that given by a professional singer, the difference in quality of recording can be seen in the stability of energy, pitch, jitter, shimmer and other classical perturbation parameters of Voice Quality assessment. In order to make assumptions about the health of the voice, signals produced at the vocal folds are the most interesting, as it is around this area specifically that most vocal problems are encountered. Using Digital Signal Processing techniques to extract such signals we can ascertain a number of things. Firstly, we can examine what happens to the structure of the vocal folds in intonation, and in particular, which parameters are more pertinent than others in analysis of the system. Secondly, we can attempt to use the results to make statistical studies on groups of subjects, in the hope that the pertinent parameters can pull out any abnormal samples. Results from this process have a potential medical application. The thesis will provide a description of the analysis of singing voice, paying particular attention to the changes happening due to pitch increase, and give a detailed example of statistical experimentation using parameters taken from the signals of interest. La voz cantada nos ofrece un ejemplo específico del sonido de la voz humana. Si consideramos el aparato de la laringe como una especie de instrumento para el canto podremos suponer asimismo que la voz cantada nos muestra quizás la mejor y más estable forma de uso de tal instrumento. El canto permanece en una frecuencia estable durante un periodo de tiempo y puede considerarse que los cantantes profesionales son aquellos sujetos que utilizan las cuerdas vocales de forma más apropiada. Si comparamos una vocal estable y continua producida por un cantante no formado con la misma producida por un cantante profesional, la diferencia en la calidad del registro se aprecia en la estabilidad de la energía, frecuencia, jitter, shimmer y los parámetros clásicos de perturbación de uso en la evaluación de la Calidad de la Voz. Para formular una hipótesis acerca de la salud de la voz, las señales más interesantes son las asociadas a las variables dinámicas en las cuerdas vocales porque la mayoría de los problemas de la voz se ponen allí de manifiesto. Al utilizar las técnicas de DSP para extraer tales señales se consigue extraer asimismo una serie de evidencias de gran interés. En primer lugar se puede examinar la dinámica que tiene lugar en la estructura de las cuerdas vocales respecto a la entonación y, en particular, qué parámetros guardan relaciones más importantes que otros en el análisis de la dinámica de dicho sistema. En segundo lugar, se puede utilizar los resultados para llevar a cabo investigaciones estadísticas con grupos de individuos para averiguar si los parámetros pertinentes muestran desviaciones anómalas. Los resultados de este estudio poseen un indudable interés médico. La presente tesis tiene como objetivo proporcionar una descripción del análisis de la voz cantada. Dirige su atención hacia los cambios en la dinámica de la cuerda vocal producidos por las variaciones de la frecuencia y ofrece un ejemplo pormenorizado de la experimentación a mediante la parametrización avanzada de las variables dinámicas de interés.