# Visión Artificial

### 4º Grado en Ingeniería Informática

Curso 2017-2018

## recursos

- [libro de Szeliski](http://szeliski.org/Book/drafts/SzeliskiBook_20100903_draft.pdf)

- [OpenCV](https://opencv.org/), [tutoriales en Python](https://docs.opencv.org/3.3.1/d6/d00/tutorial_py_root.html)

- [scikit-image](http://scikit-image.org/), [scikit-learn](http://scikit-learn.org)


- [TensorFlow](https://www.tensorflow.org/)

- [ImageNet](http://www.image-net.org)


- [Python](https://docs.python.org/3.6/)

- [numpy](http://www.numpy.org/), [scipy](http://docs.scipy.org/doc/scipy/reference/)

- [matplotlib](http://matplotlib.org/index.html)

## notebooks

1. [instalación](install.ipynb)

1. [dispositivos de captura](captura.ipynb)

1. [gráficas](graphs.ipynb)
1. [canales de color](color.ipynb)

1. [indexado, stacks](stacks.ipynb)
1. [histograma](histogram.ipynb)
1. [efecto chroma](chroma.ipynb)
1. [segmentación por color](colorseg.ipynb)
1. [cuantización de color](codebook.ipynb)

1. [transformaciones de dominio](lookup.ipynb) 

1. [filtros de imagen](filtros.ipynb)
1. [análisis frecuencial](fourier.ipynb)
1. [filtrado inverso](inversefilt.ipynb)

1. [detección de bordes](bordes.ipynb)

## programas de ejemplo

1. [`hello.py`](../code/hello.py): lee imagen de archivo, la reescala, muestra y sobreescribe un texto.

1. [`webcam.py`](../code/webcam.py): muestra la secuencia de imágenes capturadas por una webcam.

1. [`2cams.py`](../code/2cams.py): combina las imágenes tomadas por dos cámaras.

1. [`player.py`](../code/player.py): función auxiliar que permite aplicar una cierta función a la secuencia de imágenes, con opción de guardar (S) y parar el vídeo (espacio).

1. [`mouse.py`](../code/mouse.py): ejemplo de captura de eventos de ratón.

1. [`trackbar.py`](../code/trackbar.py): ejemplo de parámetro interactivo.

1. [`stream.py`](../code/stream.py): ejemplo de uso de la fuente genérica de imágenes "mkStream".

1. [`stream2.py`](../code/stream2.py): ejemplo de mkStream para leer un conjunto de imágenes en disco mostrándolas y avanzando de una en una pulsando una tecla.

1. [`deque.py`](../code/deque.py): transformación del generador mkStream, produciendo una lista de las $n$ imágenes más recientes.

1. [`mjpegserver.py`](../code/mjpegserver.py): servidor de secuencias de video en formato mjpeg.

1. [`histogram.py`](../code/histogram.py): histograma en vivo con opencv.

1. [`histogram2.py`](../code/histogram2.py): histograma en vivo con matplotlib.

1. [`surface.py`](../code/surface.py): superficie 3D de niveles de gris en vivo usando pyqtgraph.

1. [`backsub.py`](../code/backsub.py): eliminación de fondo mediante MOG2.

1. [`server.py`](../code/server.py): ejemplo de servidor web de imágenes capturadas con la webcam.

1. [`camshift.py`](../code/camshift.py): tracking mediante reproyección de histograma.

1. [`grabcut.py`](../code/grabcut.py): segmentación de objetos interactiva mediante GrabCut.

1. [`spectral.py`](../python/spectral.py): FFT en vivo.

## ejercicios propuestos

**E1**. Modificación de los canales de color (brillo, saturación, etc.) sobre la secuencia de imágenes tomada con la webcam.

**E2**. Amplia `player.py` o `stream.py` para seleccionar con el ratón una región de interés (ROI) y almacenar en una lista imágenes, que pueden opcionalmente guardarse en disco. Este programa nos servirá como base para futuros ejercicios.

**E3**. Construye un detector de movimiento. Puedes hacer un generador que filtre la secuencia de imágenes dejando pasar solo los frames estáticos (o, si se prefiere, los que han sufrido un cambio apreciable). Puedes apoyarte en `deque.py`.

**E4**. Construye un servidor web sencillo usando [flask](http://flask.pocoo.org/) que muestre una cierta transformación, especificada en la url, de las imágenes tomadas con la cámara. Apóyate en `server.py`.

**E5**. Implementa el efecto chroma con imágenes en vivo de la webcam. Pulsando una tecla se captura el fondo y los objetos que aparezcan se superponen en otra imagen o secuencia de video. Compara el resultado con el método automático de eliminación de fondo ilustrado en `backsub.py`.

**E6**. Construye un clasificador de objetos en base a la similitud de los histogramas de color del ROI (de los 3 canales por separado). Apóyate en E2.

**E7**. Implementa la segmentación por color usando modelos de histograma en un programa que admite como argumento a) una carpeta con trozos de imágen que sirven como muestras de color y b) otra imagen o secuencia de video que deseamos clasificar. El resultado puede ser un conjunto de máscaras para cada clase, o una "imagen de etiquetas", donde diferentes colores indican cada una de las regiones.

**E8**. Muestra el efecto de diferentes filtros sobre la imagen en vivo de la webcam. Selecciona con el teclado el filtro deseado y modifica sus posibles parámetros (p.ej. el nivel de suavizado) con las teclas de flecha. Es conveniente permitir la selección de un ROI para comparar el resultado del filtro con el resto de la imagen.

## clases

### 0. presentación


[instalación](install.ipynb)


- Introducción a la asignatura

- Repaso de Python, numpy y matplotib

### 1. introducción a la imagen digital

[gráficas](graphs.ipynb), [canales de color](color.ipynb), [indexado/stacks](stacks.ipynb), [dispositivos de captura](captura.ipynb)

- Imagen digital: rows, cols, depth, step. Planar or pixel order. Tipo de pixel: byte vs float

- Color encoding: RGB vs YUV vs HSV

- Coordendas de pixel, coordenadas normalizadas (indep de resolución), coordenadas calibradas (independiente del field of view).

- Aspect ratio. Resize.

- ROI, masks

- Manipulación: slice regions, "stack" de imágenes

- primitivas gráficas

- captura: webcams, cameras ip, archivos de vídeo, v4l2-ctl, etc. Load / save.

- entornos de conda, pyqtgraph, pycharm, spyder

- Herramientas: formatos de imagen, imagemagick, gimp, mplayer/mencoder/ffmpeg, etc.

### 2. manipulación de imágenes

[histograma](histogram.ipynb), [efecto chroma](chroma.ipynb), [segmentación por color](colorseg.ipynb)
<br>
[cuantización de color](codebook.ipynb), [transformaciones de dominio](lookup.ipynb) 

- Histograma, transformaciones de valor (brillo, contraste), ecualización

- Transformaciones de dominio (deformaciones), lookup table.

- chroma key

- reproyección de histograma

### 3. filtros digitales

[filtros de imagen](filtros.ipynb), [análisis frecuencial](fourier.ipynb), [filtrado inverso](inversefilt.ipynb)

- lineal

    - convolution
    - máscaras para paso alto, bajo, etc.
    - separabilidad
    - integral image, box filter
    - dominio frecuencial
    - [inverse filtering](http://yuzhikov.com/articles/BlurredImagesRestoration1.htm), [Wiener](https://www.cis.rit.edu/class/simg782/lectures/lecture_16/lec782_05_16.pdf)


- no lineal

    - mediana
    - min, max
    - algoritmos generales


- [morphological operations](http://docs.opencv.org/master/d9/d61/tutorial_py_morphological_ops.html#gsc.tab=0) (set operations)

    - structuring element
    - dilate, erode
    - open, close
    - gradient
    - fill holes


- Gaussian filter

    - cascading
    - Fourier
    - separabilidad
    - DOG

###  4. detección de bordes

[detección de bordes](bordes.ipynb)

Bordes y segmentos de recta:

- gradiente: visualización como *vector field*

- operador de Canny

- transformada de Hough

- HOG

### 5. *keypoints*

[elipsoide de incertidumbre](covarianza.ipynb), [keypoints](keypoints.ipynb)

Puntos de interés:

- herramientas

    - elipse de incertidumbre
    - modelo cuadrático
    
    
- detectores sencillos

    - blobs / saddle points (Hessian)
    - corners (Harris)

- SIFT