viernes 03 de mayo de 2019  
  
_Benjamín Hernández Cortés_ - _Juan Pablo Rojas Rojas_  
_Departamento de Ingeniería Informática (DIINF)_  
_Universidad de Santiago de Chile (USACH)_


## Laboratorio 2 - Fundamentos de Aprendizaje Profundo con Redes Neuronales
___

El presente código está orientado hacia la implementación de un perceptrón multicapa o red neuronal de múltiples capas (Multi-Layer Neural Network). En primera oportunidad, se utilizará el perceptrón para clasificar y emular compuertas lógicas AND, OR y XOR, tanto de 2 como de 4 entradas. Luego, se realizará una clasificación trabajando con el conjunto de datos [wine](https://archive.ics.uci.edu/ml/datasets/wine) provenientes de la [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/index.php) que contiene 13 atributos en total y que intentan describir clases de vinos provenientes de 3 cultivos distintos.


#### Importación de bibliotecas
---

Las bibliotecas a emplear son:
- **Numpy:** Herramienta de computación científica, que nos permitirá trabajar a través de vectores
- **Pandas:** Para la manipulación y lectura de datos
- **Matplotlib:** Para la visualización gráfica de diversos datos de interés
- **Itertools:** Como herramienta para iteración de objetos
- **Scikit-learn:** Para la obtención del dataset _wine_ y el uso de herramientas de evaluación de desempeño para los perceptrones multicapa.

In [2]:
import numpy as np
import pandas as pd
import matplotlib as mpl
import itertools as its
import sklearn as skl

from sklearn.datasets import load_wine

#### Definición de la clase TruthTableGenerator
---

La clase TruthTableGenerator permite generar tablas de verdad para 3 tipos de compuertas lógicas: AND, OR y XOR.

En cuanto a las funciones definidas, se tiene:

| **Función**  | **Descripción**  |
| ------------ | ------------ |
| `generate_table(n_inputs, logic_gate)`  |  Genera una tabla de verdad de n-variables (*n_inputs*), basada en una compuerta lógica determinada (*logic_gate*)|

In [3]:
class TruthTableGenerator():
    
    def generate_table(n_inputs, logic_gate):
        table = its.product([0,1], repeat = n_inputs)
        table = pd.DataFrame(table)
        results = []
        
        for i in range(n_inputs ** 2):
            row = table.loc[[i]].values[0]
            if logic_gate == 'AND': results.append( int(all(row)) )
            elif logic_gate == 'OR': results.append( int(any(row)) )
            elif logic_gate == 'XOR':
                tmp_result = row[0] ^ row[1]
                for j in range(2, n_inputs):
                    tmp_result = tmp_result ^ row[j]
                results.append( tmp_result )
            else: return None
        
        table['result'] = results
        return table

#### Definición de la clase Layer
---
La clase Layer permite representar una de las capas que conforma al Perceptrón Multicapa. Requiere de 3 parámetros:

| <p style='text-align: left;'>**Parámetro**</p> | <p style='text-align: left;'>**Descripción**</p> |
| ------------ | ------------ |
| `number_of_inputs` |  <p style='text-align: justify;'>Valor númerico entero. Define la cantidad de entradas que recibe la capa, la cual debe ser mayor que 0. Por defecto, se define el número de entradas como 1.</p>|
| `number_of_neurons` | <p style='text-align: justify;'>Valor numérico entero. Define la cantidad de neuronas que posee la capa, la cual debe ser mayor que 0. Por defecto, se define el número de neuronas como 1.</p> |
| `activation_function` | <p style='text-align: justify;'>Cadena de caracteres. Define la función de activación que empleará la capa, la cual puede ser sigmoide (_sigmoid_) o ReLU (_relu_).</p> |

En cuanto a las funciones definidas, se tiene:

| <p style='text-align: left;'>**Función**</p>  | <p style='text-align: left;'>**Descripción**</p> |
| ------------ | ------------ |
| `calculate_output(input_vector)` |  <p style='text-align: justify;'>Realiza una predicción para un conjunto de datos (*input_vector*), empleando los valores actuales de los pesos (*weights*) asociados a la capa.</p>|


In [23]:
class Layer:
    def __init__(self,
                 number_of_inputs = 1,
                 number_of_neurons = 1,
                 activation_function = 'sigmoid'):
        self.number_of_neurons = number_of_neurons
        self.number_of_inputs = number_of_inputs
        self.activation_function = activation_function
        self.weights = 2 * np.random.rand(self.number_of_inputs, self.number_of_neurons) - 1
        self.bias = 2 * np.random.rand(1, self.number_of_neurons) - 1
        self.input = None
        self.output = None
        self.delta = None
        self.error = None
    
    def apply_function(self, x):
        if self.activation_function == 'sigmoid': return 1 / (1 + np.exp(-x))
        elif self.activation_function == 'relu': return np.maximum(0, x)
        else: return x
    
    def apply_function_derivative(self, x):
        if self.activation_function == 'sigmoid': return x * (1 - x)
        elif self.activation_function == 'relu': return 1 * (x > 0)
        else: return x
        
    def calculate_output(self, input_vector):
        self.input = np.append(input_vector, 1)
        sum_output = np.dot(input_vector, self.weights) + self.bias
        self.output = self.apply_function(sum_output)
        return self.output
    
    
            

class MLP:
    def __init__(self,
                 data = None,
                 number_of_inputs = 1,
                 number_of_hidden_layers = 0,
                 number_of_neurons_for_each_layer = None,
                 activation_functions_for_each_layer = None):
        
        self.data = data
        self.data_nrows, self.data_ncols = data.shape
        self.number_of_hidden_layers = number_of_hidden_layers
        self.number_of_neurons_for_each_layer = number_of_neurons_for_each_layer
        self.activation_functions_for_each_layer = activation_functions_for_each_layer
        self.layers = []
        
        # Primero se crea una capa escondida (hidden layer) según la cantidad de entradas
        # definidas para el perceptrón. Si no se define un número de capas escondidas,
        # entonces solamente se creará la capa de salida (output layer), recreando a un
        # perceptrón simple.
        
        self.layers.append(
            Layer(number_of_inputs = number_of_inputs,
                  number_of_neurons = number_of_neurons_for_each_layer[0],
                  activation_function = activation_functions_for_each_layer[0])
        )
        for i in range(1, self.number_of_hidden_layers + 1):
            self.layers.append(
                Layer(number_of_inputs = number_of_neurons_for_each_layer[i-1],
                      number_of_neurons = number_of_neurons_for_each_layer[i],
                      activation_function = activation_functions_for_each_layer[i])
            )
    
    def training(self, number_of_iterations):
        for i in range(number_of_iterations):
            for j in range(self.data_nrows):
                row = np.array([self.data[j, :]])
                predicted_value = self.predict( row[:, :-1], row[:, -1] )
        return True
    
    def predict(self, input_vector, target_vector):
        output_vector = None
        for layer in self.layers:
            output_vector = layer.calculate_output(input_vector)
            input_vector = output_vector
        self.adjust_weights(target_vector)
        return output_vector
    
    def adjust_weights(self, target_vector):
        flag = True
        errors = []
        
        for i in reversed(range(len(self.layers))):
            layer = self.layers[i]
            gradient = None
            
            if layer == self.layers[-1]:
                layer.error = target_vector - layer.output
                layer.delta = layer.apply_function_derivative(layer.output) * layer.error
                
                
            else:
                next_layer = self.layers[i+1]
                layer.error = next_layer.delta * next_layer.weights.T
                layer.delta = layer.apply_function_derivative(layer.output) * layer.error
            
            gradient = np.dot(layer.delta, layer.input)
            """
            print("1)",layer.error)
            print("2)",layer.delta)
            print("3)",layer.input)
            """
            
            """
            print("4)",layer.weights)
            print("5.1)",gradient[:, :-1].T)
            print("5.2)",gradient[:, -1].T)
            """
            layer.weights += gradient[:, :-1].T
            #layer.bias -= gradient[:, -1].T
            
                
def sklearn_to_df(sklearn_dataset):
    df = pd.DataFrame(sklearn_dataset.data, columns=sklearn_dataset.feature_names)
    df['target'] = pd.Series(sklearn_dataset.target)
    return df

    

a = sklearn_to_df(load_wine())
b = np.array(TruthTableGenerator.generate_table(n_inputs=2, logic_gate='XOR'))

perceptron = MLP(data = b,
                 number_of_inputs=2,
                 number_of_hidden_layers=1,
                 number_of_neurons_for_each_layer=[2,1],
                 activation_functions_for_each_layer=['sigmoid', 'sigmoid'])

perceptron.training(10000)

data = np.array(b)
for i in range(data.shape[0]):
    input_vector = data[i,:-1]
    target_vector = data[i,-1]
    prediction = perceptron.predict(input_vector, target_vector)
    print("======\n input_vector -> {}\n target_vector -> {}\n prediction was -> {}\n =======".format(input_vector, target_vector, prediction))


ValueError: shapes (2,1) and (3,) not aligned: 1 (dim 1) != 3 (dim 0)