# Redes Neuronales

En este documento se explicará los pasos a seguir para implementar una red neuronal en Python, utilizando el método de propagación hacia atrás.

Una Red Neuronal se puede modelar en 3 capas:
* Capa de entrada: Esta capa se encuentran los datos de entrada.
* Capa oculta: Es la encargada de procesar la entrada para obtener una predicción.
* Capa de salida: Es la predicción.

In [12]:
class Neural_Network(object):
    
    def __init__(self, input_layer,hidden_layer,output_layer):        
        self.input_layer = input_layer
        self.hidden_layer = hidden_layer
        self.output_layer = output_layer
        
        np.random.seed(853)
        #Inicialmente los pesos de la capa oculta son escogidos aleatoriamente
        #w1 es una matriz del tamano de entradas por el tamano de la capa oculta
        #w2 es una matriz del tamano de la capa oculta por el tamano de la salida
        self.w1 = np.random.randn(self.input_layer,self.hidden_layer)
        self.w2 = np.random.randn(self.hidden_layer,self.output_layer)

### Propagación hacia adelante

Este es el proceso para pasar de una entrada a una predicción por medio de los valores de la capa oculta.

In [13]:
def forward_propagation(self, x):
    #Multiplicar las entradas por los valores de la primera sinapsis 
    self.z2 = np.dot(x, self.w1)
    #El valor de aplicar la funcion de activacion a cada elemento de la matriz actual
    self.a2 = self.activation_function(self.z2)
    #Multiplicar las entradas por los valores de la segunda sinapsis
    self.z3 = np.dot(self.a2, self.w2)
    #El valor de aplicar la funcion de activacion a cada elemento de la matriz final
    #Se obtiene la prediccion
    goal = self.activation_function(self.z3) 
    return goal

### Función de activación

Permite convertir cualquier valor numerico en una probabilidad (entre 0 y 1), de esta manera podremos saber cual es la probabilidad de que una muestra X pertenezca a una clase Y.

In [14]:
def activation_function(self, z):
    return 1/(1+np.exp(-z))

### Función de costo

La función de costo lo que realiza es evaluar la precisión existente entre los valores esperados y las predicciones

In [15]:
#Permite saber que tan bien se comporta la red neuronal.
def cost_function(self, x, y):
    goal = self.forward_propagation(x)
    j = 0.5*sum((y-goal)**2)
    return j

### Propagación hacia atrás

Este es un proceso que basado en un costo obtiene la gradiente existente, la cual luego se utilizará para minimizar la función de costo, es decir, ir colina abajo (downhill). Para esto se utiliza la primera derivada de la función de costo, la misma define la pendiente de esta.

In [16]:
def activation_function_d(self,z):
    return np.exp(-z)/((1+np.exp(-z))**2)

def backpropagation(self, x, y):
    goal = self.forward_propagation(x)

    delta3 = np.multiply(-(y-goal), self.activation_function_d(self.z3))
    djdw2 = np.dot(self.a2.T, delta3)

    delta2 = np.dot(delta3, self.w2.T)*self.activation_function_d(self.z2)
    djdw1 = np.dot(x.T, delta2)  

    return djdw1, djdw2

def gradients(self, x, y):
    djdw1, djdw2 = self.backpropagation(x, y)
    return np.concatenate((djdw1.ravel(), djdw2.ravel()))

## Entrenamiento

Este es el proceso por el cual, la red neuronal "aprende" para dar mejores predicciones por medio de un conjunto de datos dado. Para esto se utiliza el método del descenso por gradiente, el problema es que muchas veces dependiendo de la complejidad de la red, no se logra llegar a una buena solución. Para reducir el impacto de este problema, se utilizará una varinte de este método llamado BFGS(Broyden–Fletcher–Goldfarb–Shanno), debido a la estimación de la curvatura (segunda derivada) la cual permite utilizar esta información para dar mejores pasos hacia abajo de la colina (downhill). Dando así mejores resultados y de manera más eficiente.


In [17]:
from scipy import optimize
min_value = optimize.minimize(self.costFunctionWrapper, params, jac=True, method='BFGS', 
                                 args=(X, y), options=options, callback=self.callback)

NameError: name 'self' is not defined

## Caso de estudio

Creación de una Red Neuronal capaz de clasificar colores en formato de tupla RGB dentro de las categorías: Negro, Azul, Café,Gris, Verde, Naranja, Rojo, Violeta, Blanco y Amarillo.

Para el entrenamiento se contaban con 646 registros, esto representa el 0,000038959 de la población.


In [None]:
646./(255.*255.*255.)

Para obtener la cantidad de nodos adecuados en la capa oculta, se evaluó  usar desde 4 hasta 70 y el mejor valor obtenido fue con 11, el cual da aproximadamente 4.512891 en la función de costo.

Para obtener las clases más predominante de una imagen se realizó:
* Cargar una imagen en formato RGB.
* Evaluar cada pixel para clasificarlo en su respectiva clase.
* Obtener la [Desviación estandar](https://es.wikipedia.org/wiki/Desviaci%C3%B3n_t%C3%ADpica)
* Determinar las clases más predominantes, se toman los colores con mayor frecuencia y si su resta es menor a la desviación estándar se considera más de una clase predominante (un máximo de 3)

In [None]:
def round_closest(x):
    return int(round(x,0))


def get_colors_count(neural_network, image_path,class_array):  
    im = Image.open(image_path)
    rgb_im = im.convert('RGB')
    width, height = im.size
    color_counts = {}
    
    for i in range(0,width):
        for j in range(0,height):
            r,g,b = rgb_im.getpixel((i,j))
            #Normalizar los valores
            r = r/255.
            g = g/255.
            b = b/255.
            index = round_closest(neural_network.forward_propagation([r,g,b])*9)
            color = class_array[index]
            if color in color_counts:
                color_counts[color]+=1
            else:
                color_counts[color]= 1
    
    return color_counts
        
#Metodo que calcula la desviacion estandar de los colores
def standard_deviation(color_counts):
    average_value = average(color_counts)
    acum = 0
    for color in color_counts:
        acum += (float(color_counts[color]) - average_value)**2
    return math.sqrt(float(acum)/float(len(color_counts)))


def average(color_counts):
    acum = 0
    for color in color_counts:
        acum += color_counts[color]
    
    return float(acum) / float(len(color_counts))

### Resultados



Para evaluar la red neuronal creada, se utilizaron las siguientes imágenes:

#### Prueba #1
![Abstracta](abstract.jpg)

Esta da los siguientes valores en cada clase:
* Black: 88913
* Red: 21532
* Orange: 15838
* Violet: 1263
* Blue: 9135
* Green: 8271
* Grey: 7749
* Brown: 3419
* Yellow: 3053
* White: 827

Color Predominante: Black


#### Prueba #2
![Azul](blue.jpg)

Esta da los siguientes valores en cada clase:
* Blue: 145752
* Brown: 51728
* Black: 35635
* Grey: 17115
* Green: 5136
* Orange: 446
* Yellow: 67
* Red: 47
* White: 38
* Violet: 36

Colores Predominantes: Blue, Green


#### Prueba #3
![Verde](green.jpg)

Esta da los siguientes valores en cada clase:
* Green: 207595
* Orange: 77228
* White: 51411
* Yellow: 49904
* Red: 13192
* Violet: 1629
* Grey: 112
* Black: 84
* Blue: 76
* Brown: 34

Color Predominante: Green

#### Prueba #4
![Multicolor](multi.jpg)

Esta da los siguientes valores en cada clase:
* Red: 276515
* Orange: 98671
* Black: 78255
* Blue: 75632
* Green: 46859
* Brown: 40614
* Grey: 15496
* Yellow: 11212
* Violet: 4182
* White: 3444

Color Predominante: Orange

#### Prueba #5
![Violeta](images/violet.jpg)

Esta da los siguientes valores en cada clase:
* Violet: 156621
* Red: 120250
* Orange: 65165
* Yellow: 523
* White: 301
* Black: 59
* Blue: 29
* Green: 25
* Brown: 17
* Grey: 10

Colores Predominantes: Red, Violet

#### Prueba #6
![Atardecer](atardecer.jpg)

Esta da los siguientes valores en cada clase:
* Red: 30203
* Orange: 152493
* Black: 12777
* Green: 977
* Brown: 38719
* Grey: 16459
* Blue: 2214
* Yellow: 1119
* White: 195
* Violet: 27966

Colores Predominantes: Orange