Audio

En cuanto a audio se refiere, el Grupo de Procesamiento de Audio tiene esencialmente dos ejes de investigación. Por un lado se trabaja en el análisis, interpretación y transcripción computacional de música. Esta linea incluye relevar y analizar los distintos patrones rítmicos en la música afrouruguaya (Candombe), o la transcripción automática de piezas a partir de audio y videos de su ejecución. También incluye problemas de lo que se denomina “identificación de fuentes”, es decir, dada una grabación de audio, identificar qué instrumentos son ejecutados en cada instante, incluyendo la  voz humana como caso particular. El otro eje se desarrolla a más bajo nivel, es decir, con las señales de audio sin ser interpretadas sino como secuencias de datos con características particulares. Esto incluye el problema de detectar la autenticidad de una grabación con fines forenses.

Imágenes y Video

Al igual que en audio, el Grupo de Procesamiento de Imágenes (GTI) trabaja con este tipo de datos a distintos niveles de interpretación. El nivel más bajo incluye problemas en donde lo que se busca es manipular los datos sin tener información semántica (es decir, de interpretación conceptual) de lo que se puede observar en la imagen, con el objetivo de mejorar, restaurar, o transformar una o un conjunto de imágenes. Ejemplos de esto son la eliminación de ruido, corrección de foco, ajuste de constraste, registrado (correspondencia pixel a pixel entre una o varias imágenes). En este tema se trabaja activamente en problemas como la combinación de imágenes para aumentar el rango dinámico/contraste (HDR), interpolación (aumentar artificialmente la resolución de una imagen), eliminación de ruido (denoising), inpainting (completar de manera visualmente indistinguible zonas borradas de una imagen), eliminación de artefactos (contornos falsos) generados por excesiva compresión. Las imágenes sobre las que se ha trabajado en estos temas incluyen desde fotografías comunes a imágenes satelitales y/o médicas.

El nivel semántico más alto del procesamiento de imágenes (y video) es conocido comunmente como Visión por Computadora. En esta área se busca interpretar el contenido de las imágenes: desde sus elementos básicos como ser la detección de bordes y formas, hasta el reconocimiento de objetos, o características de una escena como ser la ubicación del horizonte, puntos y lineas de fuga. El GTI en particular tiene un estrecho vínculo en esta área con el grupo homónimo de la Université ENS-Cachan de París. Como resultado de esto, muchos de los métodos utilizados para lograr objetivos como los mencionados se basan en las técnicas conocidas como Gestalt Computacional. Otras de las actividades del departamento en visión por computadora incluyen el reconocimiento automático de patrones en las imágenes, por ejemplo la identificación de especies vegetales presentes en una cierta área de tierra a partir de imágenes tomadas por drones, el estado de irrigación de plantaciones, calidad de aguas para su potabilización, cuantificación de la irradiación solar en el territorio nacional a partir de imágenes satelitales.

En cuanto a video, nuestro trabajo reciente en esta linea incluye la eliminación de borrosidades debidas a movimiento de cámaras portátiles. También se ha desarrollado junto con la FIC una plataforma abierta y general para la restauración de películas. Finalmente, se ha trabajado recientemente en el desarrollo de medidas de calidad perceptual en video.

Imágenes y Video en Biología y Medicina

Nuestro departamento cuenta con un grupo dedicado al procesamiento de señales aplicado a la medicina. Este grupo está físicamente ubicado en el Institut Pasteur de Montevideo (IPM). La labor de dicho grupo se centra en el análisis y reconocimiento de información proveniente de imágenes médicas, así como la adquisición, procesamiento y mejoramiento de imágenes de microscopía de diversos tipos y cristalografía. Algunos de los trabajos recientes de este grupo incluyen la clasificación, segmentación y reconocimiento de distintos tipos de tejidos y estructuras biológicas a distintas escalas, desde la identificación de funciones en imágenes PET, la detección de cambios estructurales en el cortex del cerebro de roedores, hasta la caracterización de proteinas y redes mitocondriales dentro de las células.

Procesamiento de señales biomédicas

Otra fuente de señales importante son los equipos de medición de magnitudes que proveen información relevante sobre una persona o paciente. La adquisición, mejoramiento, almacenamiento e interpretación de este tipo de señales, muy distintas a las imágenes o audio, representa otra linea de trabajo en la que nuestro departamento ha trabajado durante años. En particular, se cuenta con un grupo interdisciplinario que incluye profesores de otras instituciones (el Dr. Ángel Caputti del Instituto de Investigaciones Biológicas Clemente Estable), otros institutos de Facultad de Ingeniería (Dr. Álvaro Martín, Ing. Guillermo Dufort del Instituto de Computación) y otros departamentos del Instituto de Ingeniería Eléctrica (Electrónica) cuya linea de investigación es la captura, procesamiento, compresión y transmisión de señales electroencefalográficas. También aquí se ha trabajado a alto nivel, desarrollando por ejemplo un equipo que permite a una persona paralizada escribir texto mediante la presentación de patrones en un monitor.

Biometría

La biometría engloba a toda tecnología cuyo objetivo sea medir y cuantificar aspectos físicos, principalmente de personas, con fines de autentificación o identificación. Nuestro departamento viene trabajando en esta área desde hace muchos años en conjunción con la Dirección NAcional de Identificación Civil (DNIC) para resolver numerosos problemas prácticos incluyendo la identificación de niños en base a huellas digitales, el reconocimiento facial robusto al envejecimiento, reconocimiento facial en condiciones adversas (oscuridad, oclusiones). (Al tratarse de interpretación de imágenes, puede considerarse en nuestro caso a la biometría como un caso especial de visión por computadora).

Otros tipos de señales

Del auge de las fuentes renovables y las redes eléctricas surge la disponibilidad de enormes volúmenes de datos provenientes de controladores y estaciones de medición de magnitudes como niveles de embalses, radiación solar, viento, etc., generación eléctrica y curvas de consumo. Este tipo de señales de mucha relevancia para la economía de cualquier país. Nuestro departamento también tiene como una de sus líneas el análisis y procesamiento de este tipo de señales. Por ser datos considerados tradicionalmente dentro de la esfera de la econometría, nuestro departamento se ha vinculado para este trabajo con instituciones como el Instituto de Estadística de la Facultad de Economía, el grupo del Prof. Jairo Cugliari en la Université Lyon-II, Lyon, Francia, y la Administración del Mercado Eléctrico (ADME) del Uruguay.

Reconocimiento de Patrones y Aprendizaje
Automático

Las técnicas de aprendizaje automático están íntimamente ligadas desde sus orígenes al procesamiento de señales, desde el diseño de filtros adaptivos, a los problemas de clasificación supervisada y no supervisada  que surgen naturalmente de problemas de señales multimedia como audio, imágenes y video. Ejemplos de esto incluyen el reconocimiento de objetos, animales o individuos en escenas, la separación de fuentes de audio en una grabación (instrumentos, voces), etc. De la necesidad de avanzar en esas áreas surge que en nuestro departamento incluya entre sus líneas el desarrollo de técnicas de aprendizaje automático novedosas.