<a href="https://colab.research.google.com/github/FranciscoMichati/Redes-neuronales/blob/main/redes_neuronales_2022_practico_10.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Red neuronal

Típicamente, una red neuronal artificial consiste en un conjunto de $N$ unidades de procesamiento o "neuronas" que se interconectan entre si vía una matríz de interacciones "sinápticas" $w\in \mathbb{R}^{n\times n}$.
Más precisamente, el estado $x_i$ de la $i$-esima neurona se actualiza según

$$
x_i(t+1) = g\bigg(\sum_j w_{ij}x_j(t) - u_i\bigg) \;\;\;\;\;\;\;\;(1)
$$

Aquí, la función $g:\mathbb{R}\to \mathbb{R}$ es la misma para toda neurona, y se evalúa en términos de una suma pesada sobre el estado de todas las otras neuronas al tiempo anterior $t$, más un término umbral $u_i\in \mathbb{R}$,

$$
h_i(t) = \sum_j w_{ij}x_j(t) - u_i
$$

que se denomina campo local asociado a la neurona $i$.
La entrada $w_{ij}$ de la matriz $w$ corresponde a la conección sináptica que va desde la neurona $j$ hacia la neurona $i$; es decir, media el flujo de información desde $j$ hacia $i$.

La actualización del estado de las neuronas puede ser sincrónico (todas actualizan su estado simultaneamente) o asincrónico (las neuronas actualizan su esado de a una a la vez y en orden típicamente aleatorio).

El conjunto de neuronas suele dividirse en 3 subconjuntos: el de entrada $E$, el de salida $S$ y el oculto $O$.
En este caso, el estado de las neuronas de entrada no se determina por la ecuación $(1)$, sinó que externamente a travéz de un *input*.
La red se entrena utilizando un conjunto de ejemplos, cada uno constituido por un *input* y *output* correspondiente.
Sea $e_{ki}$ el valor de la $i$-esima entrada del $k$-ésimo y $s_{ki}$ el valor de la $i$-ésima salida en el $k$-ésimo output.
De esta manera, el $k$-ésimo ejemplo viene dado por el par $(e_k,s_k)$ de vectores $e_k$ y $s_k$.

Para que aprenda del $k$-ésimo ejemplo, se compara el output $s_k$ del $k$-ésimo ejemplo, contra el output $x(e_k)$ generador por la red ante el $k$-ésimo input $e_k$.
Luego, se reajustan los pesos sinápticos $w$ y los umbrales $u$, con la esperanza de reducir las "diferencias" entre el output esperado y el output generado.
Este proceso suele repetirse, varias veces sobre cada ejemplo (elegidos secuencialmente de manera aleatoria), hasta que las "diferencias" entre outputs esperados y outputs generados se reducen a un valor aceptable según algún criterio a definir.

## Red feed-forward

En una red feed forward, las neuronas se organizan en capas.
Las neuronas de entrada constituyen la primera capa, que en realidad no se suele contar, o se la denomina capa $0$, ya que las mismas se pueden representar por meras variables.
Luego, pueden seguir varias capas de neuronas ocultas, y finalmente una capa de neuronas de salida que siempre existe.
En este tipo de redes neuronales, las neuronas de una capa sólo reciben conecciones sinápticas de capas anteriores, y típicamente desde la capa anterior.
Por ende, la matriz de conecciones sinápticas $w$ suele remplazarse por un tensor de grado 3, cuya entrada $w_{lij}$ corresponde a la conección sináptica que va desde la neurona $j$ en la capa $l$ hacia la neurona $i$ en la capa $l+1$.

Como ejemplo, a continuación se esquematiza una red neuronal de dos capas, una oculta y una de salida. Posee 3 neuronas de entradas, 4 neuronas en la capa oculta y 2 neuronas en la capa de salida.
Identificaremos el estado de la $i$-ésima neurona en la $l$-ésima capa con la variable $x_{li}$.
Además, notar que con el fin de remplazar los umbrales $u_{li}$ por correspondientes conecciones sinápticas $w_{li0}$, se agregan "neuronas fijas" (las de color rosado e indexadas por $i=0$) que, por definición, permanecen siempre en el estado $x_{l0}=-1$.

<img src="https://github.com/jipphysics/redes-neuronales-2022/blob/master/practicos/assets/red-feedforward.png?raw=true:, width=100" alt="My Image" width=300>

## Perceptrón simple

El perceptrón simple es una red feed-forward de una sola capa, i.e. no posee capas ocultas.

### Referencias

* Introduction to the theory of neural computations, J. Hertz, H. Krogh, R.G. Palmer, CRC Press (1991)

## **Ejercicio 1)** Importando librerías

Importe las librerías `numpy` para operar con arrays, `scipy` para utilizar rutinas de algebra lineal y `matplotlib.pyplot` para graficar.

In [None]:
import numpy as np
import scipy as sp
import scipy.linalg as linalg
import matplotlib.pyplot as plt

## **Ejercicio 2)** 

Consideremos el caso de un perceptrón simple con una única neurona de salida y la función signo como función activación (sección 5.2 del Hertz)

$$
g(h)
=
\left\{
\begin{array}{ll}
1 & h > 0 \\
-1 & c.c.
\end{array}
\right.
$$

**a)** Importe la función `make_classification` de scikit-learn para generar un conjunto de ejemplos a aprender. Para ello, escriba

    from sklearn.datasets import make_classification

**b)** Genere un conjunto de 10 ejemplos (`n_samples=10`). Los inputs deben ser vectores con dos coordenadas (`n_features=2`). Los outputs deben poseer dos valores (`n_classes=2`). Notar que `make_classification` genera salidas con valores en $\{0,1\}$, use la función $v\to 2v-1$ para transformarlos a valores en $\{-1,1\}$. 

**c)** Grafique los ejemplos en el plano.

**d)** Implemente un perceptrón simple de 2 entradas + 1 neurona fija, y una salida. Entrene la red utilizando la regla (ver ec. 5.23 del Hertz)

$$
\Delta w_{i} = \eta \Theta\bigg(\epsilon-s_kh_k\bigg)s_ke_{ki}
$$

iterando sequencialmente sobre los ejemlos de entrenamiento.
Aquí, $s_k$ es la única componente del output del $k$-ésimo ejemplo, $e_{ki}$ es la $i$-ésima componente de la entrada del $k$-ésimo ejemplo,

$$
h_k
=
\sum_{i=0}^N w_ie_{ki}
$$

es el campo local asociado a la única neurona de salida cuando la red es evaluada en el input del $k$-ésimo ejemplo.
Además, $\eta>0$ y $\epsilon>0$ son parámetros pequeños que controlan la convergencia del proceso de entrenamiento y

$$
\Theta(x)
=
\left\{
\begin{array}{ll}
1 & x>0\\
0 & c.c.
\end{array}
\right.
$$

es la función escalón de Heaviside.

**e)** Repitiendo **c)**, grafique la separatriz definida por $x \to -w_2/w_1x+w_0$.

In [None]:
# 2.a)
from sklearn.datasets import make_classification

## **Ejercicio 3)** 

**a)** Realice la animación que les comentó Pancho y gánese un champan.

**b)** Compártalo con los compañeros.

In [None]:
# 3.a)