<a href="https://colab.research.google.com/github/gibranfp/CursoAprendizajeProfundo/blob/master/notebooks/1a_perceptron.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Neuronas artificiales 
---

In [0]:
import numpy as np
import scipy as sp
import matplotlib.pyplot as plt
from sklearn import datasets

La operación que lleva a cabo una neurona artificial, está dada por la suma pesada evaluada en una función de activación $\phi$.  Una de las primeras funciones de activación utilizadas fue la escalón unitario, definida como

$
\phi(x) = \begin{cases} 1, & \text{si } x > 0\\0, & \text{en caso contrario}\end{cases}
$

Esta se puede llevar a cabo con la siguiente función de Python:

In [0]:
def escalon(z):
    if z > 0.0:
        return 1.0
    else:
        return 0.0

Por su parte, la suma pesada simplemente consiste en multiplicar cada entrada por su correspondiente peso y sumarle el sesgo. Esto lo podemos expresar como

$
z = w_1 \cdot x_1 + w_2 \cdot x_2 + \cdots + w_d \cdot x_d + b 
$

En su forma vectorial

$
z = \mathbf{w}^T \mathbf{x} + b
$

Para realizar esto en Python, podemos usar la función `dot` de NumPY de la siguiente manera `z = np.dot(w.T, x) + b`. Así, la operación de la neurona completa sería:

In [0]:
def neurona(x, w, b):
  z = np.dot(w.T, x) + b
  a = escalon(z)

  return a

Esta neurona es capaz de aproximar el operador OR, cuya salida es 1 cuando al menos 1 de las 2 entradas es 1:


| $x_1$ | $x_2$ | $y$
| ------------- |:-------------:| -----:|
|0 |0 |0|
|0 |1 |1|
|1 |0 |1|
|1 |1 |1|

La neurona recibe 2 valores binarios como entrada y produce un valor binario como salida. Específicamente, la neurona calcularía

$
\hat{y} = \phi(w_1 \cdot x_1 + w_2 \cdot x_2 + b)
$

Para poder aproximar la operación OR es necesario encontrar los valores apropiados de $w_1$, $w_2$ y $b$. Una posible elección sería 10, 10 y -5 respectivamente. Verifiquemos estos valores:

In [0]:
X = np.array([[0., 0.], [0., 1.], [1., 0.], [1., 1.]])
w = np.array([10, 10]).T
b = -5

for i in range(X.shape[0]):
  y_hat = neurona(X[i, :], w, b)
  print('x = {0}, y_hat = {1}'.format(X[i, :], y_hat))

x = [0. 0.], y_hat = 0.0
x = [0. 1.], y_hat = 1.0
x = [1. 0.], y_hat = 1.0
x = [1. 1.], y_hat = 1.0


De forma similar, podemos aproximar la operación AND:


| $x_1$ | $x_2$ | $y$
| ------------- |:-------------:| -----:|
|0 |0 |0|
|0 |1 |0|
|1 |0 |0|
|1 |1 |1|

Nuevamente, debemos encontrar los valores apropiados para los pesos y el sesgo. Probemos con $w_1 = 10$, $w_2 = 10$ y $b = -15$.

In [0]:
w = np.array([10, 10]).T
b = -15 

for i in range(X.shape[0]):
  y_hat = neurona(X[i, :], w, b)
  print('x = {0}, y_hat = {1}'.format(X[i, :], y_hat))

x = [0. 0.], y_hat = 0.0
x = [0. 1.], y_hat = 0.0
x = [1. 0.], y_hat = 0.0
x = [1. 1.], y_hat = 1.0


También podemos aproximar la negación de la operación AND (NAND):


| $x_1$ | $x_2$ | $y$
| ------------- |:-------------:| -----:|
|0 |0 |1|
|0 |1 |1|
|1 |0 |1|
|1 |1 |0|

En este caso, los valores para los pesos y el sesgo son $w_1 = -10$, $w_2 = -10$ y $b = 15$.

In [0]:
w = np.array([-10, -10]).T
b = 15 

for i in range(X.shape[0]):
  y_hat = neurona(X[i, :], w, b)
  print('x = {0}, y_hat = {1}'.format(X[i, :], y_hat))

x = [0. 0.], y_hat = 1.0
x = [0. 1.], y_hat = 1.0
x = [1. 0.], y_hat = 1.0
x = [1. 1.], y_hat = 0.0


In [0]:
def perceptron(X, y, n_epochs = 10):
    w_new = np.zeros(X.shape[1])
    b_new = 0
    for i in range(n_epochs):
        serr = 0.0
        for j in range(X.shape[0]):
            w_old = w_new
            b_old = b_new
            
            y_hat = neurona(X[j], w_old, b_old)
            error = y[j] - y_hat
           
            w_new = w_old + error * X[j]     
            b_new = b_old + error
           
            serr += np.abs(error)
        print("Epoch {0}: error = {1}".format(i, serr / float(X.shape[0])))

    return w_new, b_new

Probemos el algoritmo del perceptrón para aprender la operación lógica OR.

In [0]:
X = np.array([[0., 0.], [0., 1.], [1., 0.], [1., 1.]])
y_or = np.array([0., 1., 1., 1.]) 

w, b = perceptron(X, y_or)

print('\nw_1 = {0}, w_2 = {1}, b = {2}'.format(w[0], w[1], b))
print('x_1\tx_2\ty\ty_hat')
for i in range(X.shape[0]):
  y_hat = neurona(X[i], w, b)
  print('{0}\t{1}\t{2}\t{3}'.format(X[i, 0], X[i, 1], y_or[i], y_hat))

Epoch 0: error = 0.25
Epoch 1: error = 0.5
Epoch 2: error = 0.25
Epoch 3: error = 0.0
Epoch 4: error = 0.0
Epoch 5: error = 0.0
Epoch 6: error = 0.0
Epoch 7: error = 0.0
Epoch 8: error = 0.0
Epoch 9: error = 0.0

w_1 = 1.0, w_2 = 1.0, b = 0.0
x_1	x_2	y	y_hat
0.0	0.0	0.0	0.0
0.0	1.0	1.0	1.0
1.0	0.0	1.0	1.0
1.0	1.0	1.0	1.0


Ahora veamos qué ocurre si en lugar de la operación OR tratamos de aprender la operación AND

In [0]:
y_and = np.array([0., 0., 0., 1.])
w, b = perceptron(X, y_and)

print('\nw_1 = {0}, w_2 = {1}, b = {2}'.format(w[0], w[1], b))
print('x_1\tx_2\ty\ty_hat')
for i in range(X.shape[0]):
  y_hat = neurona(X[i], w, b)
  print('{0}\t{1}\t{2}\t{3}'.format(X[i, 0], X[i, 1], y_and[i], y_hat))

Epoch 0: error = 0.25
Epoch 1: error = 0.75
Epoch 2: error = 0.75
Epoch 3: error = 0.5
Epoch 4: error = 0.25
Epoch 5: error = 0.0
Epoch 6: error = 0.0
Epoch 7: error = 0.0
Epoch 8: error = 0.0
Epoch 9: error = 0.0

w_1 = 2.0, w_2 = 1.0, b = -2.0
x_1	x_2	y	y_hat
0.0	0.0	0.0	0.0
0.0	1.0	0.0	0.0
1.0	0.0	0.0	0.0
1.0	1.0	1.0	1.0


Minsky y Papert mostraron que una neurona del tipo LTU no puede aproximar de forma precisa una función no lineal como la compuerta XOR:


| $x_1$ | $x_2$ | $y$
| ------------- |:-------------:| -----:|
|0 |0 |0|
|0 |1 |1|
|1 |0 |1|
|1 |1 |0|

Sin embargo, es posible aproximar este tipo  combinando múltiples LTU conectadas en red. Por ejemplo, es posible llevar a cabo la operación XOR con operaciones OR, AND y NAND:

$
	  x_1 \text{ XOR }  x_2 = (x_1 \lor x_2) \land \neg(x_1 \land x_2)
	$  



In [0]:
def multicapa(x, W1, b1, W2, b2):
  escv = np.vectorize(escalon)
  a = escv(np.dot(W1.T, x) + b1)
  return escv(np.dot(W2.T, a) + b2)

In [0]:
y_xor = np.array([0., 1., 1., 0.])
W1 = np.array([[10, -10], [10, -10]])
b1 = np.array([-5, 15])

W2 = np.array([[10], [10]])
b2 = np.array([-15])

for i in range(X.shape[0]):
  print(multicapa(X[i], W1, b1, W2, b2))

[0.]
[1.]
[1.]
[0.]
