In [None]:
from IPython.display import Video

# Introducción a Generative Adversarial Networks

Juan Pedro Fisanotti

@fisadev

# Objetivos

- Entender qué son las GANs, cómo funcionan, aplicaciones
- Mostrar cómo es una implementación típica

- Presentar una tecnología super interesante :)


`"The coolest idea in machine learning in the last twenty years"`

-- Yann LeCun

`"Pretty much all interesting AI approaches involve GANs in the middle"`

-- Eric Smith

# Generative Adversarial Networks

- Una arquitectura de redes neuronales (como las de la charla de Ariel)

- Donde dos redes neuronales son entrenadas a la vez, compitiendo/colaborando


- Con el objetivo de aprender a "generar" datos de algún tipo

- Ayudados por ejemplos de ese tipo de dato

# Generar datos?

Cualquier tipo de dato que pueda expresarse numéricamente.

No solo números, también **imágenes, audio, texto.**

Por ejemplo...

Generar imagenes de objetos:

![](images/objects.jpeg)


Generar caras de personas:

![](images/faces.png)


Generar textos:

![](images/I_am.png)


Y **obviamente**, generar textos diciendo que Python es mejor que .Net:

![](images/best_programming_language.png)


Generar dibujos realistas a partir de dibujos simples de lineas:

![](images/bag.png)


Mejorar la resolución de imágenes ("enhance!"):

![](images/resolution.png)


Rellenar partes faltantes de imágenes:

![](images/refill.png)


O incluso generar una escena completa a partir de lo que queremos que tenga:

![](images/scene.gif)


Transferir estilo/concepto de una imagen a otra:

![](images/transfer_style.png)


Transferir estilo/concepto de una imagen a otra:

![](images/transfer_style2.jpg)


Transferir estilo/concepto de una imagen a otra:

![](images/transfer_style3.jpg)


Incluso transferir gestos:

![](images/gestures.jpg)


In [None]:
Video("not_jim.mp4")

(y me faltarían ejemplos con audio)

Ok, creo que se entiende la idea. 

**Generan** datos.

# Para qué?

Algunas aplicaciones de esos ejemplos son obvias.

Otras no tanto:

- Multiplicar datos disponibles para entrenar otros modelos.
- Completar información faltante en datos incompletos (bases de datos, videos, imágenes tapadas, etc).
- Generar escenarios y datos ficticios para testear, probar técnicas, o más barato que generar datos reales (ej: modelo humano inexistente, diseño 3d de objetos realistas, etc).

# Cómo?

La idea general es notablemente sencilla...

![](images/gans.svg)

La red **generadora**, recibe priors como entrada (ruido random, input humano, imagen incompleta, etc) y a partir de ellos intenta generar datos "realistas".

La red **discriminadora**, recibe como entrada datos reales o fakes (generados por la **generadora**), e intenta clasificarlos en "real" vs "fake".

Y las entrenamos con la misma herramienta de siempre: **descenso por el gradiente**.

![](images/gradient_descent.svg)

El error que le pedimos minimizar a la **discriminadora**, es la diferencia entre las clasificaciones (real vs fake) esperadas vs predichas.

El error que le pedimos minimizar a la **generadora**, es la cantidad de fakes generados que fueron correctamente detectados por la discriminadora.

# Problemas/dificultades

- Datos complejos requieren **mucho** hardware y tiempo de entrenamientos **muy** largos

- Pocos ejemplos -> riesgo de muy buen discriminador muy rápido -> generador pierde capacidad de aprender

![](images/too_good_discriminator.svg)

- "Mode collapse": un muy buen fake, puede hacer que el generador se concentre en generar solo fakes como ese

![](images/mode_collapse.svg)

- Dificultad para identificar convergencia. Cuándo cortar? Riesgo de caer en un "mal loop".

![](images/bad_loop.svg)

- Dificultad para medir calidad

# Demo!

# Demo: mejores resultados

![](best_inputs.png)

![](best_outputs.png)

# Preguntas?

**Slides y demo para correr localmente:** http://github.com/fisadev/talks (directorio "gans")

**Demo en Google Colab:** https://colab.research.google.com/drive/1O3Hu318fWzxEZ29jB1DHBHmuOpRvsecI

**Contacto:** fisadev@gmail.com / @fisadev en twitter