# Tarea 1: Deep Learning

## Objetivos:
### El objetivo de esta tarea es poder demostrar el conocimiento adquirido en las clases 1-5, tutoriales 1-3 y el laboratorio formativo 1.

## Instrucciones:
- Para esta tarea debe completar las celdas faltantes, además de tomar decisiones sobre ciertos parámetros.
- Tendrán ya creada para ustedes un conjunto de entradas y salidas deseadas para una función, \( F(x,y) = x^2 + y^2 \), el objetivo principal es que dado un valor, la red sea capaz de predecir el resultado correcto con un umbral de precisión de x%, donde la nota será por puntos en relación a la precisión y error.

Por ejemplo, si de 100 predicciones la red creada tiene un 80% de precisión para |y_gorro - y_teoria| <= 0.1, tienes 15pts de 100, cuanto mayor sea la precisión, mayor la nota hasta 80/100 pts.

Los últimos 20 pts serán evaluados con base a las decisiones tomadas por ustedes, por esto en la última celda de tests es importante justificar las decisiones tomadas, sea la cantidad de capas ocultas, épocas, tasa de aprendizaje, etc.


### Formato de los datos
- Los datos se presentan con 2 valores de entrada y uno de salida: `input_1`, `input_2` y un valor de salida `output`.
- En total hay 1000 entradas (1000 `input_1`, 1000 `input_2`, 1000 `output`).


In [4]:
import numpy as np
import random


class Sigmoid:
    def derivative(self, x):
        return x * (1 - x)
    
    def __call__(self, x):
        return 1 / (1 + np.exp(-x))
    
class Linear:
    def derivative(self, x):
        return 1
    
    def __call__(self, x):
        return x

In [5]:
class Neuron:
    def __init__(self, weights, bias, activation =Sigmoid()):
        self.weights = weights
        self.bias = bias
        self.activation = activation
        self.output = 0
        self.inputs = []
        self.error = 0

    def feedforward(self, inputs):
        self.inputs = inputs
        total = np.dot(self.weights, inputs) + self.bias
        self.output = self.activation(total)
        return self.output
    
    def backpropagate_error(self, error):
        self.error = self.activation.derivative(self.output) * error

In [6]:
class NeuralNetwork:
    def __init__(self, input_red, output, h_layers, learning_rate=0.1):
        self.learning_rate = learning_rate
        self.layers = []
        self.input = input_red
        self.__init__layers(h_layers, output)
   

    
    def __init__layers(self, h_layers, output):
        for indice_layer in range(len(h_layers)):
            
                layer = []
                for cantidad_de_neuronas in range(h_layers[indice_layer]):
                    if indice_layer == 0:
                        neurona = Neuron(
                            [random.uniform(-1, 1) for _ in range(self.input)], random.uniform(-1, 1)
                        )
                    else:
                        neurona = Neuron(
                            [random.uniform(-1, 1) for _ in range(h_layers[indice_layer-1])], random.uniform(-1, 1)
                        )
                    layer.append(neurona)
                self.layers.append(layer)
                
        self.layers.append([Neuron([random.uniform(-1, 1) for _ in range(h_layers[-1])], random.uniform(-1, 1),Linear() ) for _ in range(output)])
    

    def feedforward(self, inputs):
        for indice_capas in range(len(self.layers)):
            outputs = []
            for indice_neurona in range(len(self.layers[indice_capas])):
                outputs.append(self.layers[indice_capas][indice_neurona].feedforward(inputs))
            inputs = outputs # para la proxima capa recibir lo que retorna la capa que acabamos de pasar
        return outputs
            
        
    def train(self, inputs, targets):
        outputs = self.feedforward(inputs)
        errors = [targets[i] - outputs[i] for i in range(len(outputs))]
    
        for indice_layers in range(len(self.layers)-1, -1, -1):
            layer = self.layers[indice_layers]
            next_layer = self.layers[indice_layers+1] if indice_layers != len(self.layers)-1 else None
            for indice_neurona in range(len(layer)):
                neuron = layer[indice_neurona]
                if next_layer is None:
                    neuron.backpropagate_error(errors[indice_neurona])
                else:
                    error = 0
                    for n in next_layer:
                        error += n.error * n.weights[indice_neurona]
                    neuron.backpropagate_error(error)    

        for indice_layers in range(len(self.layers)):
            for indice_neurona in range(len(self.layers[indice_layers])):
                
                neuron = self.layers[indice_layers][indice_neurona]
                
                for indice_peso in range(len(neuron.weights)):
                    neuron.weights[indice_peso] += self.learning_rate * neuron.error * neuron.inputs[indice_peso]
                neuron.bias += self.learning_rate * neuron.error
                
                
        error_final = sum([0.5*e**2 for e in errors]) / len(errors)  
        return error_final


In [7]:
import random
import numpy as np

# Generate random x, y values
random.seed("01101100 01100101 01101110 01101001 01101110")

# Generate training data for f(x, y) = x^2 + y^2
X = [[random.uniform(-1, 1), random.uniform(-1, 1)] for _ in range(1000)]
Y = [[x[0]**2 + x[1]**2] for x in X]

epocas = 1000

# El nombre de la rede debe ser rede_profunda
# your code here
rede_profunda = NeuralNetwork(2, 1, [6], learning_rate=0.10)

for i in range(epocas):
    error = 0
    for j in range(len(X)):
        error += rede_profunda.train(X[j], Y[j])
        
    if i % 100 == 0:
        print("error:", error)
print(error)


error: 114.0226849550647
error: 0.8900553902214026
error: 0.3572561857143793
error: 0.11448775775946252
error: 0.03181165486168669
error: 0.01008797253047009
error: 0.004084393294926748
error: 0.0024677550377867636
error: 0.0020305562256822153
error: 0.0019029589408319154
0.0018574169118528293


Describe the task here!
# Describa todas las decisiones tomadas para tu solución
# Esto incluye la cantidad de épocas, tasa de aprendizaje, capas ocultas, capas de entrada y capas de salida.


Describe the task here!

Por supuesto, el número de variables de entrada son 2 (x,y). La capa de salida es 1, porque tenemos una función f(x) por calcular. Ahora, luego de realizar varias iteraciones, modificando el número de capas ocultas

**Capa de Entrada (Input Layer):** Debe tener dos nodos, uno para _x_ y otro para _y_, ya que son las variables de entrada del problema.

**Capas Ocultas (Hidden Layers):** Hice el experimento con distintas profundidas de red. 5, 10, 50 y 100.

**Tasa Aprendizaje (Learning Rate):** Hice 2 experimentos: Learning rate= 0.1 y 0,01.

**Cantidad de épocas (Epochs):** Validé haciendo 1.000 épocas y también con 10.000 épocas.


**Capa de Salida (Output Layer):** Debe tener un solo nodo, ya que se trata de una tarea de regresión donde se busca predecir un valor continuo. 

### EXPERIMENTO 2

Ahora, haremos una iteración utilizando 5 capas ocultas y un learning_rate=0,1

In [6]:
rede_profunda_2 = NeuralNetwork(2, 1, [5], learning_rate=0.10)

for i in range(epocas):
    error = 0
    for j in range(len(X)):
        error += rede_profunda_2.train(X[j], Y[j])
        
    if i % 100 == 0:
        print("error:", error)
print(error)

error: 104.34546518521425
error: 0.8160745529066794
error: 0.20726737645496113
error: 0.05702474986530924
error: 0.019274255903704213
error: 0.00873892349639936
error: 0.0056849611185332515
error: 0.004693762265776018
error: 0.004289713620337629
error: 0.004067710507577359
0.003913283011101918


Es muy interesante ver cómo el error disminuyó muchísimo frente al primer entrenamiento, con tan solo 5 capas ocultas. Lo fundamental en este punto fue cambiar el learning rate, pasando de 0.01 como teniamos en el primer ejercicio a 0.1. Esto nos mejora dramáticamente el error.

### EXPERIMENTO 3

Ahora, hagamos otra iteración, pero utilizando 10 capas ocultas

In [7]:
rede_profunda_3 = NeuralNetwork(2, 1, [10], learning_rate=0.10)

for i in range(epocas):
    error = 0
    for j in range(len(X)):
        error += rede_profunda_3.train(X[j], Y[j])
        
    if i % 100 == 0:
        print("error:", error)
print(error)

error: 119.74169862099197
error: 0.0861739367756577
error: 0.018917005719773432
error: 0.008236012051640026
error: 0.006093916163588921
error: 0.0055488434271350395
error: 0.005324201583815287
error: 0.0051766870957579555
error: 0.005056192025934864
error: 0.004949932237601425
0.004854174934252139


Es interesante ver que el error en este caso es el doble del ejercicio anterior, aun cuando tiene el doble de capas ocultas. 

### EXPERIMENTO 4

Analicemos qué pasa si aumentamos aun más el learning rate. Ubiquemoslo en valor de 0.5

In [8]:
rede_profunda_4 = NeuralNetwork(2, 1, [5], learning_rate=0.50)

for i in range(epocas):
    error = 0
    for j in range(len(X)):
        error += rede_profunda_4.train(X[j], Y[j])
        
    if i % 100 == 0:
        print("error:", error)
print(error)

error: 136.07019369351497
error: 0.017361470778126276
error: 0.015372716649336558
error: 0.014111118601683278
error: 0.013154974393255216
error: 0.01238476317736002
error: 0.011745699336103347
error: 0.011205153948852766
error: 0.010741203719633339
error: 0.010338210703893944
0.009987936537037757


Vemos que este resultado no es mejor que la iteración 2.

### EXPERIMENTO 5

Ahora, ¿qué pasa si utilizamos 7 capas ocultas? Veámoslo

In [9]:
rede_profunda_5 = NeuralNetwork(2, 1, [7], learning_rate=0.10)

for i in range(epocas):
    error = 0
    for j in range(len(X)):
        error += rede_profunda_5.train(X[j], Y[j])
        
    if i % 100 == 0:
        print("error:", error)
print(error)

error: 110.44354021464189
error: 0.33214392277675914
error: 0.06714143907397059
error: 0.021192924287174324
error: 0.009538392257777915
error: 0.0061489649002293804
error: 0.005051076780698592
error: 0.004616230150177905
error: 0.00439140413142121
error: 0.004245636264817948
0.0041374641663321585


Sigue siendo mejor la red neuronal con 5 capas. Hagamos las últimas 2 iteraciones. Con 4 capas ocultas y con 6 capas ocultas.

### EXPERIMENTO 6

In [10]:
rede_profunda_6 = NeuralNetwork(2, 1, [4], learning_rate=0.10)

for i in range(epocas):
    error = 0
    for j in range(len(X)):
        error += rede_profunda_6.train(X[j], Y[j])
        
    if i % 100 == 0:
        print("error:", error)
print(error)

error: 109.07644675375703
error: 0.08864600448017054
error: 0.011585064116305761
error: 0.007185701289161453
error: 0.006663299942689649
error: 0.006420673961315447
error: 0.006224819279692547
error: 0.006053262351389201
error: 0.0059000565693123775
error: 0.005761742457151848
0.005636993479762014


### EXPERIMENTO 7

In [11]:
rede_profunda_7 = NeuralNetwork(2, 1, [6], learning_rate=0.10)

for i in range(epocas):
    error = 0
    for j in range(len(X)):
        error += rede_profunda_7.train(X[j], Y[j])
        
    if i % 100 == 0:
        print("error:", error)
print(error)

error: 95.002954217172
error: 0.1642673870102209
error: 0.016326122784823573
error: 0.0058830560762635
error: 0.004663471229708665
error: 0.004417990550121172
error: 0.004301867370329085
error: 0.004214062765853403
error: 0.0041385870087954635
error: 0.00407119276608194
0.004010535733060646


Luego de realizar iteraciones con las capas ocultas y el learning rate, encontramos que la combinación que nos optimiza el error de entrenamiento es: 2 nodos como capa de entrada, 1 nodo como capa de salida, 6 capas ocultas. ¿Qué pasa si con estos mismos parámetros aumentamos la cantidad de épocas a 10.000?

### EXPERIMENTO 8

In [12]:
epocas_2 = 10000

rede_profunda_8 = NeuralNetwork(2, 1, [6], learning_rate=0.10)

for i in range(epocas_2):
    error = 0
    for j in range(len(X)):
        error += rede_profunda_8.train(X[j], Y[j])
        
    if i % 1000 == 0:
        print("error:", error)
print(error)

error: 111.6118788344365
error: 0.0033439582995977977
error: 0.00307843007803871
error: 0.0028642788225394598
error: 0.0026854443808723345
error: 0.002532962460271005
error: 0.002400939793899451
error: 0.0022852274723439946
error: 0.002182781791907328
error: 0.00209130324724898
0.002009092530359553


### RESULTADO DEFINITIVO

Luego de realizar varias iteraciones, nos quedamos con la red neuronal que tiene las siguientes características:

**Capa de Entrada (Input Layer):** Debe tener dos nodos, uno para _x_ y otro para _y_, ya que son las variables de entrada del problema.

**Capas Ocultas (Hidden Layers):** El resultado que nos generó menor error de entrenamiento fue con 6 capas ocultas.

**Tasa Aprendizaje (Learning Rate):** El valor que nos generó menor error de entrenamiento fue con un learning rate = 0.1.

**Cantidad de épocas (Epochs):** El valor que nos generó menor error de entrenamiento fue con 10.000 épocas.

**Capa de Salida (Output Layer):** Debe tener un solo nodo, ya que se trata de una tarea de regresión donde se busca predecir un valor continuo. 

Dicha combinación, nos genera un error de entrenamiento = 0.002