# Ejemplo 01
En este ejemplo vamos a crear una neurona artificial y vamos a entrenarla para hacer que tenga el comportamiento de una compuerta OR. A diferencia de la sesión pasada, vamos a entrenar desde cero nuestra neurona.

In [1]:
import numpy as np

Funciones de la sesión pasada. Nota que en inicializar capa invertí la forma de W para que no tengamos que hacer la transposición de la matriz.

In [2]:
def inicializarCapa(numCaracteristicas, numNeuronas):
    w = np.random.rand(numNeuronas,numCaracteristicas)
    b = np.random.rand(numNeuronas,1)
    return w,b

def calcularZ(w,x,b):
    z = np.dot(w,x) + b     
    return z

def activacion(z):
    y = 1 / (1 + np.exp(-z))
    return y

def capaNeuronal(w,x,b):
    z = calcularZ(w,x,b)
    y_pred = activacion(z)
    return z, y_pred

Vamos a calcular el error logístico, el cual es muy útil para saber que tal va nuestro algoritmo. 
El error logístico se calcula con la ecuación:

$E = \frac{1}{m} (-Y log(y_{pred}) + (1 - Y) log(1 - y_{pred}))$

La ecuación funciona así: 
- Si $Y$ y $Y_{pred}$ son 0, el error es $E=0$
- Si $Y$ y $Y_{pred}$ son 1, el error es $E=0$
- $Log(0) = 1$ y $Log(1) = 0$ Por ende, la ecuación solamente tiene errores cuando $Y$ y $Y_{pred}$ son diferentes.

In [3]:
def calcularError(y_esperado, y_obtenido):
    numMuestras = y_esperado.shape[0]
    error = - (y_esperado *np.log(y_obtenido) + (1 - y_esperado)*np.log(1 - y_obtenido))
    error = np.sum(error) / numMuestras
    return error

Las derivada cuando solo hay una capa neuronal es tan simple como $Y_{pred} - Y$, con ello, podemos calcular las derivadas de los pesos como:

$\frac{dE}{dz} = Y_{pred} - Y$

$\frac{dE}{dw} = \frac{dE}{dz} \cdot X^{T} $

$\frac{dE}{db} = \frac{dE}{dz}$

In [4]:
def calcular_derivadas(y_esperado, y_obtenido, entradas):
    dz = y_obtenido - y_esperado    
    dw = np.dot(dz,entradas.T)
    db = np.sum(dz, axis=1, keepdims=True)
    return dz, dw, db

## Entrenamiento
Ahora, vamos a entrenar nuestra red neuronal. Cada uno de los pasos del algoritmo nos acercará a un error cada vez menor

In [5]:
w,b = inicializarCapa(numCaracteristicas = 2,numNeuronas = 1)

#Funcion OR:
x = np.array([[0,0]
             ,[0,1]
             ,[1,0]
             ,[1,1]]).T
y_esperado = np.array([[0,1,1,1]])

print("Los tamaños de X deben ser:(NumCaracteristicas, NumMuestras)")
print(x.shape)
print("Los tamaños de Y deben ser:(NumSalidas, NumMuestras)")
print(y_esperado.shape)

#Hiperparámetros:

#Learning rate
lr = 0.01
#Error mínimo al que queremos llegar
minError = 0.05
#Cantidad de veces que se entrenará la red neuronal.
maxEpochs = 100000

for counter in range(0,maxEpochs):
    #Hacemos la propagación hacia el frente.
    z, y_obtenido = capaNeuronal(w,x,b)
    
    #Calculamos el error.
    error = calcularError(y_esperado, y_obtenido)
    
    #Luego hacemos la retropropagación para obtener las derivadas.
    dz, dw, db = calcular_derivadas(y_esperado, y_obtenido, x)
    
    #Con las derivadas, ajustamos los pesos de la siguiente manera:
    w = w - lr * dw
    b = b - lr * db
    
    #Si el error ha sobrepasado el mínimo, detenemos el algoritmo.
    if(error < minError):
        break;
    
    # Cada 100 Epocas vemos como va el error.
    if counter % 100 == 0:
        print("Epoch:"+str(counter))
        print("Error: "+str(error))

Los tamaños de X deben ser:(NumCaracteristicas, NumMuestras)
(2, 4)
Los tamaños de Y deben ser:(NumSalidas, NumMuestras)
(1, 4)
Epoch:0
Error: 2.212492339292866
Epoch:100
Error: 1.6297121933499774
Epoch:200
Error: 1.42173519146556
Epoch:300
Error: 1.2735320525886482
Epoch:400
Error: 1.1530337250013558
Epoch:500
Error: 1.051957151879547
Epoch:600
Error: 0.9659836682272147
Epoch:700
Error: 0.8920900524677952
Epoch:800
Error: 0.8279903212233977
Epoch:900
Error: 0.7719193363900616
Epoch:1000
Error: 0.722499133967463
Epoch:1100
Error: 0.6786429961073558
Epoch:1200
Error: 0.6394848407380205
Epoch:1300
Error: 0.6043271316600314
Epoch:1400
Error: 0.572602350671644
Epoch:1500
Error: 0.5438443288734506
Epoch:1600
Error: 0.517666731639499
Epoch:1700
Error: 0.4937467522214743
Epoch:1800
Error: 0.4718126244193126
Epoch:1900
Error: 0.4516339606821467
Epoch:2000
Error: 0.43301420130702684
Epoch:2100
Error: 0.4157846571265167
Epoch:2200
Error: 0.3997997671491164
Epoch:2300
Error: 0.38493329159835804
E

Probamos el código. Para obtener los resultados, corremos la red neuronal sobre una prueba (sin hacer la retropropagación, la matriz w y el vector b ya tienen contenidos los pesos sinápticos que generan el comportamiento, si haces retropropagación los desajustas!)

In [6]:
#Probando:
x_test = np.array([[1,0]]).T
_, y_test = capaNeuronal(w,x_test,b)

print("Entradas "+str(x_test))
print("Genera salida "+str(y_test)+"o bien (redondeado)..."+str(np.round(y_test)))

Entradas [[1]
 [0]]
Genera salida [[0.98901595]]o bien (redondeado)...[[1.]]
