Deep Learning for Computer Vision

Aprendizaje Profundo para Visión Artificial

Deep Learning for Computer Vision

Mauricio Delbracio, Ph.D
José Lezama, Ph.D
Guillermo Carbajal, Msc

Instituto de Ingeniería Eléctrica
Facultad de Ingeniería
Universidad de la República

Descripción

El aprendizaje profundo (deep learning) es una técnica que emplea redes neuronales para aprender representaciones a partir de una serie de datos observados, que puedan ser de utilidad para resolver problemas de alto nivel como ser predicción, restauración o clasificación de señales. Dichas representaciones se denominan profundas por estar construidas a partir de una jerarquía compuesta de sucesivas capas que representan las observaciones con un nivel creciente de abstracción. El aprendizaje profundo pretende descubrir las propiedades intrínsecas de grandes volúmenes de datos construyendo representaciones distribuidas, tanto en contextos supervisados como no supervisados.

Este curso brinda una introducción al aprendizaje profundo con un enfoque práctico en la visión artificial. El objetivo principal es presentar a los estudiantes los principales aspectos de modelado, algorítmicos y de optimización de forma de que ellos mismos puedan implementar (diseñar, entrenar y validar) sus propios modelos. Se presentarán modelos simples basados en redes convolucionales que permiten explicar matemáticamente algunas de las propiedades claves para su éxito. Todos los conceptos serán ilustrados con aplicaciones específicas en los campos de visión artificial y procesamiento de imágenes.

Keywords: Aprendizaje Profundo, Deep Learning, Visión Artificial, Computer Vision

Información - 2018

Por consultas:

Slides 2018

Clase Contenido Slides
Clase 1
(03Set)
  • Introducción a la visión artificial y aprendizaje automático
  • Formalización de aprendizaje (dataset, aproximar funciones, curse of dim)
  • Intro. al aprendizaje profundo, motivación
  • Reseña histórica
  • Presentación curso, evaluación, docentes
[pdf] [mp4]
Clase 2
(05Set)
  • Introducción al problema de clasificación
  • Un ejemplo: clasificador por k− vecinos más cercanos
  • Clasificador óptimo (Bayes)
  • (Breve) tutorial de imágenes
  • Presentación Entregable 1
[pdf] [mp4]
Clase 3
(10Set)
  • Clasificación Lineal - Perceptrón
  • Support Vector Machine (SVM)
  • Regresión Logística
  • Optimización - Descenso por gradiente
  • Introducción al problema de clasificación
[pdf] [mp4]
Clase 4
(17Set)
  • Modelos lineales, generalización
  • Redes Neuronales Prealimentadas (feedforward)
  • Neuronas artificiales
  • Teorema aproximación universal
  • Capacidad, sobreajuste, subajuste
[pdf] [mp4]
Clase 5
(19Set)
  • Ejemplo de Backpropagation para calcular gradientes
  • Algoritmo de Backpropagation
  • Algoritmo de Backpropagation aplicado a red feedforward
[pdf] [mp4]
Clase 6
(24Set)
  • Redes Fully Connected (Repaso)
  • Capa Convolución
  • Capa Pooling
  • Ejemplos de CNNs, Aplicaciones
[pdf] [mp4]
Clase 7
(26Set)
  • Redes Neuronales: Regularización
[pdf] [mp4]
Clase 8
(01Oct)
  • Descenso por Gradiente Estocástico (SGD)
  • SGD+Momentum / SGD Nesterov
  • AdaGrad / RMSProp / ADAM
  • Learning rate decay
  • Optimización por métodos de segundo orden
[pdf] [mp4]
Clase 9
(O3ct)
  • Funciones de Activación: Entrenamiento
  • Preprocesamiento de datos
  • Inicialización de parámetros de red (pesos)
  • Batch Normalization
  • Hiperparámetros: ¿cómo fijarlos?
  • Monitoreo del proceso de aprendizaje
[pdf] [mp4]
Clase 10
(8Oct)
  • CPU vs GPU
  • Librerías
  • Caffe (c/demo)
  • TensorFlow
  • PyTorch (c/demo)
[pdf] [mp4]
Clase 11
(10Oct)
  • Redes Famosas: LeNet, AlexNet, VGG, GoogleNet, ResNet
  • Otras Redes (DenseNet, WideNets, ResNeXt, Stochastic Depth, FractalNets)
[pdf] [mp4]
Clase 12
(17Oct)
  • Redes Neuronales Recurrentes (RNN)
  • Back Propagation Through Time (BPTT)
  • Aplicaciones
  • Long Short Term Memory (LSTM)
[pdf] [mp4]
Clase 13
(22Oct)
  • ¿Qué aprenden las redes neuronales de convolución?
  • Saliency Maps, visualización de clases/features
  • DeepDream
  • Ataques Adversarios
  • Presentación Trabajo Final
[pdf] [mp4]
Clase 14
(24ct)
  • Clasificación de objetos
  • Segmentación Semántica
  • Clasificación + Localización
  • Detección de Objetos
  • Segmentación de Instancias
  • Presentación Entregable 3
[pdf] [mp4]
Clase 15
(29Oct)
  • Aprendizaje no Supervisado
  • Pixel RNN / Pixel CNN
  • Autoencoders
  • Variational Autoencoders (VAE)
[pdf] [mp4]
Clase 16
(31Oct)
  • Generative Adversarial Networks (GAN)
  • Wasserstein GAN
[pdf] [mp4]
Clase 17
(5Nov)
  • Transfer Learning
  • Síntesis de textura, transferencia de estilo
  • Problemas inversos en imágenes
  • Out-of-distribution Detection
[pdf] [mp4]
Clase 18
(7Nov)
  • Aprendizaje por Refuerzo (Profundo)
  • Deep Q-Learning
  • Deep Policy Gradient
[pdf] [mp4]






last modified: 7 nov 2018
Valid XHTML 1.0 Strict