Home » Departamento de Procesamiento de Señales » Defensa Proyecto : “Reconocimiento automático de voz hablada para pruebas neuropsicológicas y detección de dificultades en el leguaje”

Defensa Proyecto : “Reconocimiento automático de voz hablada para pruebas neuropsicológicas y detección de dificultades en el leguaje”

Jueves 31 de Mayo 14hs, Salón de Seminarios del IIE – Facultad de Ingeniería, Julio Herrera y Reissig 565

Tenemos el agrado de invitarlos a la defensa de proyecto de carrera “Reconocimiento automático de voz hablada para pruebas neuropsicológicas y detección de problemas en el lenguaje”

Estudiantes : Gabriel De Cola y Guzmán Chalupa

Tutores : Pablo Cancela y Martín Rocamora

Tribunal : Federico Lecumberry, Juan Valle Lisboa y Pablo Zinemanas

Saludos,

Martín Rocamora

Resúmen :

Este proyecto nace en respuesta a una propuesta realizada por el Centro de
Investigación Básica en Psicología (CIBPsi) de Facultad de Psicología,
UdelaR. En el CIBPsi se busca diseñar e implementar una batería
digitalizada de tareas que permita evaluar predictores de dificultades en
el aprendizaje de la lectura. Se pretende crear una interfaz lúdica para
los niños y una evaluación sistemática y masiva. Se espera que los datos
recopilados permitan predecir dificultades en el aprendizaje de la lectura
posibilitando intervenciones precisas y oportunas.
El aporte que busca realizar este proyecto de fin de carrera es la
automatización de la etapa de evaluación de un predictor de dificultades en
la lectura en niños : la nominación automatizada rápida (RAN, por sus siglas
en inglés), que es considerado uno de los principales predictores de
desempeño lector. Consiste en la denominación secuencial de un conjunto de
50 elementos dispuestos en una matriz de 5 filas, en que se pide al niño
que nombre uno a uno cada elemento lo más rápido posible, y se mide la
precisión en las respuestas y el tiempo total de la tarea. Los elementos de
la matriz pueden ser objetos, colores, números o letras. La aplicación de
estos tests implica que una persona debe presentar la tarea al niño, y
grabar la realización en un archivo de audio.
La solución propuesta se basa en la idea de que el test usa elementos que
se repiten, es decir, se basa en la autosimilitud de la señal de audio. El
sistema implementado segmenta la señal de audio para identificar el inicio
y el fin de cada palabra y luego extrae características que permiten
compararlas. Existe una etapa de alineamiento entre los segmentos de audio
correspondientes a las palabras detectadas, que busca establecer su
similitud, teniendo en cuenta deformaciones temporales entre realizaciones
diferentes de una misma palabra. Luego, los segmentos de audio se agrupan
automáticamente para establecer cuáles corresponden a una misma palabra.
Por último, se realiza una comparación entre la matriz original del test
RAN y la secuencia de palabras identificadas, que permite detectar los
errores cometidos.