In [1]:
import pandas as pd
import numpy as np
import math

## Dataset

#### En este laboratorio usaremos un dataset del usuario 'Zalando' en Github. Este data set surge como una alternativa al dataset MNIST tradicional de clasificación de números escritos a mano. Surge con el objetivo de proveer un dataset de "entrenamiento" o básico en la industria que se adapte más a las situaciones actuales (muchas imágenes) y que provea un método de entrenamiento más díficil que su antecesor.
#### El dataset consiste de 70 mil registros (60mil de entrenamiento y 10mil de testing). Cada record consiste en una imágen de 28X28 pixeles con una categoría asociada que describe el tipo de prenda al que pertenece.  

### Labels o Categorias
#### Cada record de training y test tienen asignado una de las siguientes etiquetas.:

| Etiqueta | Descripción |
| --- | --- |
| 0 | T-shirt/top |
| 1 | Trouser |
| 2 | Pullover |
| 3 | Dress |
| 4 | Coat |
| 5 | Sandal |
| 6 | Shirt |
| 7 | Sneaker |
| 8 | Bag |
| 9 | Ankle boot |

In [2]:
# definiendo la función de activación
def sigmoide(x):
    return 1.0/(1.0+np.exp(-x))

In [3]:
# validando la funcion sigmoide
print(sigmoide(0))
print(sigmoide(7))
print(sigmoide(-7))

0.5
0.9990889488055994
0.0009110511944006454


In [4]:
# derivada de la sigmoide
#(e^-x)/(1+e^-x)^2
def d_sigmoide(x):
    return (np.exp(-x))/((1+np.exp(-x))**2)

In [5]:
# validando la funcion
print(d_sigmoide(0))
print(d_sigmoide(7))
print(d_sigmoide(-7))

0.25
0.0009102211801218265
0.0009102211801218265


### Implementación softmax
#### permite restringir el resultado de una función entre 0 y 1 para poder usarlo como una probabilidad. Esto nos permite crear una red neuronal multi-clase, ya que no es un resultado binario si no "probabilistico" entre múltiples posibles clases

In [6]:
def softmax(x_list):
    return np.exp(x_list)/np.exp(x_list).sum(0)


In [7]:
# podemos ver que retorna una probabilidad que premia a los numeros más grandes relativamente.
softmax(np.asarray([4,7,5,10]))

array([0.00234065, 0.04701312, 0.00636253, 0.9442837 ])

### inicialización de tethas
#### inicializadas con un número random entre 0 y 1

In [58]:
def crear_red(outputs, inputs, hidden):
    i_hidden = np.random.uniform(0,1,size=(inputs, hidden))
    i_output = np.random.uniform(0,1,size=(hidden,outputs))
    return i_hidden, i_output

In [9]:
# verificación
crear_red(5,1,2)

(array([[0.10993072],
        [0.0716494 ],
        [0.847462  ],
        [0.85494674],
        [0.74786923]]), array([[0.44702897, 0.74107434]]))

### Backprop implementation
### parametros:
#### num de inputs, num de neuronas en capa oculta, num de outputs
#### num iteraciones, learning rate
### Estructura de datos
#### Dos listas (Arreglos) X(independientes), y (dependiente-clasificación)

In [46]:
def forprop(X,hidden, outputs):
    # producto punto de los inputs y la capa oculta
    # aplicamos la función sigmoide de activación para obtener los resultados de la capa oculta
    activadas = sigmoide(np.dot(X,hidden))

    return activadas
    
def calcular_error(resultado,real):
    # simple resta entre 'y' y el resultado obtenido.
    error = real - resultado
    print ('Error: ',sum(error))
    return error

In [47]:
#funcion con iteraciones para validad mi backprop
def backprop(X, y, hidden, outputs, ite, learning_rate):
    for i in range(ite):
        # activación y forprop
        activadas = forprop(X,hidden, outputs)
        resultado = np.dot(activadas, outputs)
        error = calcular_error(resultado, y)
        
        # ---- seccion backprop ----
        # con el error obtenido podemos ajustar los pesos bajo el dominio del learning_rate
        dz = error * learning_rate
        outputs += activadas.T.dot(dz)
        dh = dz.dot(outputs.T) * d_sigmoide(activadas)
        hidden += X.T.dot(dh)

In [49]:
# probando con un simple XOR
X_p = np.array([[0,0], [0,1], [1,0], [1,1]])
y_p = np.array([ [0],   [1],   [1],   [0]])

p_h, p_o = crear_red(2,3,1)
#len(X_p[0])
backprop(X_p, y_p, p_h, p_o, 100, 0.1)
# podemos ver que el error comeinza a decrecer. 

Error:  [-3.86332405]
Error:  [-1.82497221]
Error:  [-0.87601308]
Error:  [-0.41750182]
Error:  [-0.19292875]
Error:  [-0.08230688]
Error:  [-0.02767448]
Error:  [-0.00066213]
Error:  [0.01269784]
Error:  [0.01930219]
Error:  [0.02256146]
Error:  [0.02416365]
Error:  [0.0249447]
Error:  [0.02531873]
Error:  [0.02549099]
Error:  [0.0255632]
Error:  [0.02558581]
Error:  [0.02558386]
Error:  [0.02556975]
Error:  [0.02554963]
Error:  [0.02552658]
Error:  [0.02550209]
Error:  [0.02547694]
Error:  [0.02545149]
Error:  [0.02542592]
Error:  [0.02540034]
Error:  [0.02537477]
Error:  [0.02534925]
Error:  [0.02532379]
Error:  [0.02529839]
Error:  [0.02527305]
Error:  [0.02524778]
Error:  [0.02522257]
Error:  [0.02519742]
Error:  [0.02517234]
Error:  [0.02514732]
Error:  [0.02512235]
Error:  [0.02509745]
Error:  [0.02507261]
Error:  [0.02504783]
Error:  [0.02502311]
Error:  [0.02499844]
Error:  [0.02497383]
Error:  [0.02494927]
Error:  [0.02492478]
Error:  [0.02490033]
Error:  [0.02487594]
Error: 

### --- Reading data

In [31]:
# training data
train = pd.read_csv('./data/fashion-mnist_train.csv')
train.head()

Unnamed: 0,label,pixel1,pixel2,pixel3,pixel4,pixel5,pixel6,pixel7,pixel8,pixel9,...,pixel775,pixel776,pixel777,pixel778,pixel779,pixel780,pixel781,pixel782,pixel783,pixel784
0,2,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
1,9,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
2,6,0,0,0,0,0,0,0,5,0,...,0,0,0,30,43,0,0,0,0,0
3,0,0,0,0,1,2,0,0,0,0,...,3,0,0,0,0,1,0,0,0,0
4,3,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0


In [32]:
train_y = train.pop('label')

In [33]:
# slicing data (Too large)
half = int(len(train['pixel1'])/2)
train_X1 = train[:half]
train_X2 = train[half:]

In [34]:
train_y1 = train[:half]
train_y2 = train[half:]

In [50]:
trainX1 = train_X1.values.tolist()
trainX2 = train_X2.values.tolist()

In [51]:
trainy1 = train_y1.values.tolist()
trainy2 = train_y2.values.tolist()

In [59]:
HL, OL = crear_red(10,784, 50)

In [60]:
backprop(trainX1, trainy1, HL, OL, 1000, 0.1)

ValueError: operands could not be broadcast together with shapes (30000,784) (30000,10) 