In [1]:
import numpy as np
import torch
from torch import nn, optim
import random

# Como Hacer Una Red Neuronal _Artificial_ Con Un Cordón De Zapatos

<img width=400 src="images/mcgiver.jpg" >

## Empecemos por el principio... ¿Machine Learning? ¿Deep Learning? ¿Neural Networks?

<img width=400 src="images/ml_dl.png" >

El Machine learning consiste en conseguir que un algoritmo genérico que no es capaz de resolver una tarea, la resuelva... ¿Como? Modificandose a si mismo poco a poco... En comparación al DL, el ML más clasico funciona bastante bien incluso con pocos datos, por lo que los experimentos con 'perceptrones' (las primeras redes neuronales) en los años 50 se abandonaron rápido.

<img width=200 src="images/training.gif" >

Pero el Machine Learning tradicional tiene sus limitaciones, no escala bien con muchos datos y cuando empezamos a ser capaces de recopilar cantidades considerables de datos, y a tener ordenadores lo suficientemente potentes, el Deep Learning empezó a tomar la delantera!!! (1998 Yann LeCun)

# En qué consiste el Deep Learning?

<img width=300 src="images/deep_learning_meme4.jpg" >

El Deep Learning usa principalmente como bloque de construcción Redes Neuronales Artificiales, creando nuevas redes **profundas** encadenando redes sencillas una tras otra. 

Vale, ya tenemos una idea aproximada de qué es el machine learning, y el deep learning, pero...

## ¿En qué consiste una Red Neuronal Artificial?

# La "neurona"

![neurone](images/neurone.png)

## Representación matemática

\begin{equation}
y = ax + b
\end{equation}

\begin{equation}
y = Wx + b
\end{equation}

Por ejemplo:
\begin{equation}
0.2 = 0.05 * 4
\end{equation}


In [2]:
x = 4
W = 0.05

y = W * x

print("y =", y)

y = 0.2


\begin{equation}
1.5 = W * 6
\end{equation}

Partamos del mismo problema pero suponiendo que no conocemos el valor de W

In [22]:
x = 6
W = random.uniform(0, 0.5)

y = W * x
print("W =", W)
print("y =", y)

W = 0.37725023281877074
y = 2.2635013969126243


Queríamos que el resultado de la ecuación fuese 1.5, pero tenemos otro valor...

Empecemos por calcular por cuanto nos hemos equivocado

In [23]:
error = y - 1.5

print("Queremos 1.5, pero y =", y)
print("Nuestro error es de", error)

Queremos 1.5, pero y = 2.2635013969126243
Nuestro error es de 0.7635013969126243


Vamos a intentar modificar W en base a cuánto nos hemos equivocado

In [25]:
y = W * x
print("y = ", y)

nuevo_W = W - error # * 0.1
y = nuevo_W * x

print("Tras modificar W, y =", y)

y =  2.2635013969126243
Tras modificar W, y = 1.80540055876505


Si damos pasos muy grandes nos pasamos y nunca llegamos al mínimo, así que mejor dar pasos pequeñitos

![lr](images/learningrate.png)

In [19]:
for i in range(100):
    y = W * x
    error = y - 1.5
    W = W - error * 0.01

y = W * x
print("Tras 100 pasos, y =", y, "y W =", W)

Tras 100 pasos, y = 1.5023081417070694 y W = 0.25038469028451155


### Y así tenemos nuestra primera neurona!!!

<img src="images/hommer.jpg">

# Capas de neuronas

Hemos visto una neurona con **un** valor de entrada y **un** valor de salida que equivale a una ecuación lineal:

\begin{equation}
y = W * x + b
\end{equation}

Pero... ¿Cómo sería una neurona con varios valores de entrada?  
Sencillamente tendremos varios x y varios W.


\begin{equation}
y = (W1 * x1) + (W2 * x2) + ... + (Wn * xn) + b
\end{equation}

![lr](images/multi_in.png)

¿Y si queremos varios valores de salida?  
Como hemos visto antes, usamos una ecuación lineal que nos permite tener varios x, pero solo un y, por lo que para tener varios valores de salida necesitamos... ¡ MAS NEURONAS ! Lo que significa más ecuaciones:

\begin{equation}
y1 = (W11 * x1) + (W21 * x2) + ... + (Wn1 * xn) + b1  
\end{equation}
\begin{equation}
y2 = (W12 * x1) + (W22 * x2) + ... + (Wn2 * xn) + b2 
\end{equation}
\begin{equation}
...
\end{equation}
\begin{equation}
ym = (W1m * x1) + (W2m * x2) + ... + (Wnm * xn) + bm 
\end{equation}

![lr](images/multi_in_out.png)

Cada una de estas neuronas recibe todos los inputs y devuelve un único output, y tenemos una forma más bonita de representarlas, usando matrices:

![lr](images/matrices.png)


# De 'Shallow' a 'Deep' 

Ya sabemos cómo crear una capa de neuronas usando ecuaciones lineales, con multiples inputs y multiples outputs.

Sin embargo, al ser operaciones lineales las relaciones que la red será capaz de extraer de los inputs serán lineales, así que para solucionar esto vamos a encadenar varias capas de neuronas, pasando los outputs de una de nuestras capas a la siguiente, y añadiendo una operación no-lineal entre ellas.

Cuantas más capas añadamos, más compleja es la representación de los datos que podemos obtener:
![lr](images/layer_sizes.jpeg)

# Todo esto ya parece muy dificil de hacer... No hay algo que me lo de ya hecho?

Por supuesto, a la hora de trabajar con redes neuronales no definimos las operaciones una a una, ni tenemos que calcular nosotros mismos las pendientes de las distintas curvas, sino que usamos frameworks que nos abstraen de todo esto.

Por ejemplo, probemos con PyTorch y su maravilloso autograd

In [None]:
network = nn.Sequential(
    nn.Linear(3, 6),
    nn.Sigmoid(),
    nn.Linear(6, 3)
)

# MINI DEMO: NeuroCar

<img width=200 style="display:inline-block;" src="images/neurocar.png" />
<br/><br/><br/><br/>

Notebook: [NeuroCar.ipynb](NeuroCar.ipynb)

In [None]:
!open "NeuroCar/application.macosx/NeuroCar.app"

# ¿Qué más se puede hacer con Deep Learning?

¡Muchisimas cosas! El Deep Learning está presente en muchas areas, en conducción autónoma, medicina, astronomía, comunicación, sistemas de recomendación, arte...

<img src="images/selfdriving.gif">

### Generación de texto
https://talktotransformer.com/

<img width=400 src="images/gpt2.png">

### Generación de imágenes
https://thispersondoesnotexist.com/

<img width=200 src="images/gan.jpeg">

# En mi trabajo...

- Evaluación de la calidad del lenguaje
- Detección de temas controvertidos
- Detección de manipulación en imágenes
- Sistemas de recomendación

<img width=400 src="images/deep_learning_meme2.png">