Grupo de Tratamiento de Imágenes
Instituto de Ingeniería Eléctrica
Facultad de Ingeniería
Universidad de la República
[ gti - home ]
   actividades    investigación    gente    software    links    contáctenos
 
 
Teoría Computacional de la Gestalt

Dictado por el Dr.Andrés Almansa y el Dr.Gregory Randall

Temario

  1. Introducción a la visión artificial y a la teoría computacional de la Gestalt.
  2. Revisión de herramientas básicas de la visión artificial : muestreo, interpolación y mapa topográfico.
  3. Practica 1 : principio de Shannon, cambios de contraste, líneas de nivel
  4. Teoría de la visión de Marr (G. Randall)
  5. Teoría de la Gestalt, visión crítica. (G. Randall)
  6. Principio de Helmholtz y su aplicación a la detección de cuadrados y líneas
  7. Practica 2 : detección de cuadrados y líneas
  8. Principio de Exclusión, maximalidad y MDL. Aplicación a la detección de líneas
  9. Decuantificación de la orientación
  10. Practica 3 : Problemas de cuantificación, consecuencias y alternativas de corrección
  11. Detección de modas de un histograma y clusters
  12. Puntos de fuga
  13. Bordes significativos y comparación con snakes
  14. Practica 4 : Puntos de fuga y bordes significativos
  15. Experimentos psico-visuales, detección de clusters, conclusiones
  16. Proyectos
  17. Un ejemplo de composición jerárquica: búsqueda de formas

Créditos

8

Objetivos

Comprender los principios básicos de la teoría computacional de la Gestalt para el reconocimiento de patrones en imágenes, y ser capaz de aplicarlos a la resolución de un problema concreto

Metodología de enseñanza

El curso se organizara en 12 clases teóricas de 2 horas (1 clase por semana), y sesiones prácticas de 2 horas (1 por semana).

Evaluación

Para la aprobación se requerirá la entrega de un informe sobre 3 de las 4 prácticas, y del proyecto final, del cual se realizará una defensa 3 semanas después de finalizado el curso. Para la nota final del curso se realizará un promedio ponderado en el cual 30% corresponderá a las practicas y 70% al proyecto final. Para la aprobación deberán entregarse al menos 3 de las 4 prácticas, obtener al menos un 60% del puntaje total de las prácticas, un 60% del proyecto, y un 60% del puntaje total.

Fecha

Del 29 de marzo al 25 de junio 2004

Horas Presenciales

24 teórico + 16 practicas (40 horas)

Se preveen ademas unas 40 horas de estudio individual mas 40 horas de trabajo en el proyecto final

Cupo

Máximo 20 estudiantes, se dará prioridad a los estudiantes de posgrado ya sea del PEDECIBA o de la facultad de ingeniería. En caso de ser necesario se realizará una selección por sorteo entre los inscriptos que hayan asistido a la primera clase.

Bibliografía

Básica

Agnès Desolneux, Lionel Moisan, Jean-Michel Morel, « Computational Gestalt Theory », LNCS, Springer Verlag, to appear. Los estudiantes dispondran de un preprint de dicho libro en la fotocopiadora del CEI.

Gaetano Kanisza, « La Grammaire du Voir », ISBN 2-84134-061-9, Diderot 1997, traduccion al francés de la edicion italiana, original : « Grammatica del vedere », Società editrice il Mulino, 1980. Traduccion al español : « Gramatica de la Vision: Percepcion y Pensamiento », Paidos Iberica, Ediciones S. A., Oct 1991, ISBN: 8475094228. Se dispondrá de una copia de la edición francesa en la biblioteca del InCo

Recomendada

David Marr, « Vision : A Computational Investigation into the Human Representation and Processing of Visual Information », W H Freeman & Co.; (September 1983), ISBN: 0716715678.

Lionel Moisan, « Mathematical and Numerical Models for Digital Images », Notas del curso de DEA de la ENS Cachan, 2002.

Pablo Musé, Frédéric Sur, jean-Michel Morel, « Recherche dans les grandes bases de formes », Technical Report Nro 2002-02, CMLA, ENS Cachan, 2002. Bajar el documento

Lisani, Monasse, Rudin, « Fast Shape Extraction and Application », Technical Report Nro 2001-16, CMLA, ENS Cachan, 2001. Bajar el documento

 
 
diseño y mantenimiento visitante: 57899 mapa del sitio atrás  arriba