# Modelado Generativo

* Que quiere decir que un modelo sea generativo?
* Como es diferente un modelo generativo a un modelo discriminativo?
* Framework e ideas matematicas para estructurar nuestro enfoque a problemos con soluciones generativas.

## Que es modelado generativo?

* Un modelo generativo puede ser definido de la siguiente forma:
    > Un modelo generativo describe como un dataset es generado, en terminos de un modelo probabilistico. Muestrear de este modelo nos permite generar nueva data.

1. Supongan que tenemos un dataset de imagenes de caballos. 
2. Queremos construir un modelo que genere nuevas imagenes de un caballo que nunca ha existido.
3. pero que todavia se ve real porque el modelo ha aprendido las reglas generales que gobiernan la apariencia de un caballo.

Este es el tipo de problemas que pueden ser solucionados con modelos generativos.

## Un proceso tipico de modelado generativo

![Proceso Modelado Generativo](../assets/gen_modeling_process.png)

* Cada observacion consiste en varias _features_ &mdash;para un problema de generacion de imagenes, las features usualmente son los valores de pixels individuales.
* Nuestra meta es crear un modelo que pueda generar nuevos conjuntos de features que parezcan como si fueron creados usando las mismas reglas que la data original.
* Conceptualmente, para generacion de imagenes esta es una tarea bastante dificil.

* Un modelo generativo tambien debe ser _probabilistico_ en vez de _deterministico_. Si nuestro modelo es simplemente un calculo fijo, como tomar el valor promedio de cada pixel en el dataset, no es generativo. Porque?
* El modelo debe incluir un elemento _estocastico_ (aleatorio) que influya las muestras individuales generadas por el modelo.

* En otras palabras, nos podemos imaginar que existe una distribucion probabilistica desconocida que explica porque algunas imagenes son mas probables de aparecer en el dataset de entrenamiento y otras no.
* Nuestro trabajo es construir un modelo que imite esta distribucion lo mas cerca posible y luego muestrear de el para generar nuevas, distintas observaciones que parezcan como las del dataset original

## Modelado Generativo versus discriminativo

* Basicamente la mayoria de ejemplos que han estudiado en machine learning.
* Ejemplo: Tenemos un dataset de pinturas, algunas por Van Gogh y algunas por otros artistas. Con suficiente data etiquetada, podemos entrenar un modelo discriminativo para predecir si una pintura fue pintada por Van Gogh. 
* El modelo aprenderia que ciertos colores, figuras y texturas son mas propensas a indicar que una pintura es de Van Gogh.
* Para pinturas con estos features, el modelo ajustaria su prediccion.

![Modelado Discriminativo](../assets/disc_modeling_process.png)

* Una diferencia clave es que cuando hacemos modelado discriminativo, cada observacion en el training set tiene una etiqueta. 
* Por esta razon, el modelado discriminativo es sinonimo con _aprendizaje supervizado_, o aprender una funcion que mapea un input a un output usando un dataset etiquetado. 
* El modelado generativo usualmente se realiza con un dataset no etiquetado (es decir, una forma de _aprendizaje no supervisado_), aunque tambien puede ser aplicado a un dataset etiquetado para aprender a generar observaciones de cada clase. 

## Diferencias en notacion matematica

_Modelado discriminativo_ estima $p(y|{ \bf x })$&mdash;la probabilidad de un label $y$ dada una observacion ${\bf x}$

_Modelado generativo_ estima $p({\bf x})$&mdash;la probabilidad de observar una observacion ${\bf x}$

* En otras palabras, el modelado discriminativo intenta estimar la probabilidad de que una observacion **x** pertenezca a la categoria _y_. 
* Al modelado generativo no le interesa etiquetar observaciones.
* En vez, intenta estimar la probabilidad de ver la observacion.

* El punto clave es que aunque fueramos capazes de construir un modelo discriminativo perfecto para identificar pinturas de Van Gogh, igual no tendria idea de como crear pinturas que parezcan a las de Van Gogh.
    * Solamente puede output probabilidades de imagenes existentes, ya que para esto fue entrenado.
* En vez, tendriamos que entrenar un modelo generativo
    * para poder output conjuntos de pixeles que tengan una alta probabilidad de pertenecer al dataset original.

## Avances en Machine Learning

Para entender porque el modelado generativo se puede considerar la siguiente frontera para machine learning, hay que entender porque el modelado discriminativo ha sido la fuerza detras de la mayoria del progreso en la metodologia de machine learning en las ultimas dos decadas, en academia y en la industria.

**Desde un punto de vista academico**

* El progreso en modelado discriminativo es mas facil de monitorear.
    * Podemos medir metricas de desempenio en contra de ciertas tareas de clasificacion de alto perfil para determinar la mejor metodologia al momento.
* Los modelos generativos son mas dificiles de evaluar, especialmente cuando la calidad del output es en gran parte subjetiva. 
* Por tanto, en anios recientes se ha puesto mucha enfasis en entrenar modelos discriminativos para alcanzar desempenios a nivel humano o super humano en una variedad de tareas de clasificacion de texto o imagenes.

**Caso:** 
* [ImageNet Large Scale Visual Recognition Challenge (ILSVRC)](https://machinelearningmastery.com/introduction-to-the-imagenet-large-scale-visual-recognition-challenge-ilsvrc/)

Al igual que es mas facil publicar resultado medibles dentro de un contexto academico, los modelos discriminativos historicamente han sido mas faciles de aplicar a problemas de negocio que los modelos generativos. Por lo general, en un contexto de negocios, no nos interesa _como_ se genero la data, pero si queremos saber como un nuevo ejemplo debe ser clasificado o valorado. Por ejemplo:

* Dada una imagen satelital, un oficial de defensa del gobierno solo estaria interesado en conocer la probabilidad de que contenga unidades enemigas, no la probabilidad de que esa imagen en particular aparezca.
* Un jefe de servicio al cliente solo estaria interesado en conocer si el sentimiento de un email entrante es positivo o negativo y no tendria mucho uso para un modelo generativo que genere ejemplos de correos de clientes que no existen.

## El auge del modelado generativo

En los ultimos 3 a 5 anios muchos de los avances mas interesantes en el campo han sido a traves de aplicaciones novedosas de deep learning a tareas de modelado generativo.

**Casos**
* [StyleGAN de NVIDIA](https://arxiv.org/abs/1812.04948): crear imagenes hiper-realisticas de caras humanas
* [GPT-2 de OpenAI](https://paperswithcode.com/paper/language-models-are-unsupervised-multitask): modelo de lenguaje.
* [Usos maliciosos de AI](https://www.eff.org/files/2018/02/20/malicious_ai_report_final.pdf)

* Hay claras aplicaciones positivas para industrias como disenio de juegos y cinematografia, y mejoras en generacion de musica automatica. 
* Aunque esto sea emocionante, tambien genera dilemas eticos al rededor de la proliferacion de contenido falso en el internet y significa que va a ser mas dificil confiar en lo que vemos y leemos a traves de canales publicos de comunicacion.

![Face Generation](../assets/face_generation.png)

Adicional a los usos practicos de modelaje generativo, hay tres profundas razones por las cuales el modelado generativo se puede considerar como la llave para una forma mas sofisticada de inteligencia artificial.

1. Desde un punto de vista puramente teorico, no deberiamos estar satisfechos solamente siendo capaces de categorizar data. Deberiamos buscar un entendimiento mas completo de como se genero la data en primer lugar.
    * Esto es un problema mas dificil de resolver dada la alta dimensionalidad del espacio de outputs factibles y el relativamente pequenio numero de creaciones que podriamos considerar que pertenecen al dataset.
    * Sin embargo, como veremos, muchas de las mismas tecnicas que han impulsado el desarrollo en modelado discriminativo, como deep learning, se pueden usar para modelos generativos.

2. Es altamente probable que el modelado generativo sea central para impulsar desarrollos futuros en otros campos de machine learning, como reinforcement learning.
    * RL: el estudio de enseniarle a agentes a optimizar una meta en un ambiente a traves de prueba y error

**Caso**
* [World Models](https://arxiv.org/abs/1803.10122)
* [How Artificial Intelligence is Changing Science](https://www.quantamagazine.org/how-artificial-intelligence-is-changing-science-20190311/)
* [Deoldify](https://github.com/jantic/DeOldify)

3. Finalmente, si verdaderamente queremos decir que hemos construido una maquina que ha adquirido un tipo de inteligencia comparable con la de los humanos, los modelos generativos van a ser parte de la solucion.
    * Teorias neurocientificas actuales sugieren que nuestra percepcion de la realidad no es un model discriminativo operando sobre nuestros inputs sensoriales para producir predicciones de lo que estamos experimentando.
    * En vez, es un modelo generativo que ha sido entrenado desde nuestro nacimiento para producir simulaciones de nuestros entornos que precisamente igualan el futuro.
    * Algunas teorias incluso sugieren que el output de este modelo generativo es lo que directamente percibimos como realidad.