<a href="https://colab.research.google.com/github/mcstllns/DeepLearning/blob/main/P02_primerasredes.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Bienvenido a colab

En este cuaderno vamos a construir nuestras primeras redes neuronales, vete fijándote en el código y en las explicaciones que se adjuntan porque luego tendrás que hacer un ejercicio en moodle.

Vamos a empezar por las redes más asequibles, los __perceptrones multicapa__, exactamente iguales que los que hemos estado utilizando en [playground](https://playground.tensorflow.org/).

La tarea es identica a la realizada en playground pero ahora en vez de ser un sandbox completamente opaco vamos a programar nuestras redes.

__No te frustres__, a veces escribir código es frustrante porque te da la sensación de que unas veces funciona y otras no. Los ordenadores son deterministas, no tienen opiniones ni les caes mal; si antes te ha funcionado y ahora no es porque hay algo diferente, sigue intentándolo y si ves que no lo consigues consulta con un compañero o con el profesor.

En general, los ejercicios siempre están basados en cosas que han sido explicadas, cuando haya un ejercicio que no te salga, relee los materiales y fíjate despacio en el código previo, es posible que la solución la tengas a la vista. Si aún así no encuentras la solución pregunta a tus compañeros y __no dudes en contactar conmigo__.

Lo primero que vamos a hacer es cargar un montón de paquetes y librerías de python que vamos a necesitar para que se calculen las redes. No te preocupes por esta parte, no es necesario entender qué o cómo lo hace, simplemente ejecútala. Lo que hace este código es:
1. Carga los paquetes: numpy, tensorflow2, panda, matplolib, keras y sklearn. Son paquetes básicos para el trabajo con datos y los paquetes relacionados con Deep Learning.
1. Construímos una función llamada _miplot_ que nos va a servir para visualizar los datos

Para ejecutar un código puedes pinchar en la flecha de la celda o usar _Ctr+Enter_ en el teclado.


In [None]:
# importamos las librerias que se van a necesitar

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense

import numpy as np
from sklearn.datasets import make_blobs
from sklearn.datasets import make_circles
from sklearn.datasets import make_moons

from matplotlib import pyplot
from pandas import DataFrame

print(tf.__version__)

# ----------------------------------------------------------------
# definimos una funcion para dibujar los datos
def miplot(X, y):
    df = DataFrame(dict(x1=X[:, 0], x2=X[:, 1], label=y))
    colors = {0: 'red', 1: 'blue', 2: 'green', 3: 'black'}
    fig, ax = pyplot.subplots()
    grouped = df.groupby('label')
    for key, group in grouped:
        group.plot(ax=ax, kind='scatter', x='x1', y='x2', label=key, color=colors[key])
    pyplot.show()

Una vez hecho lo anterior podemos comprobar si funciona bien, vamos a generar unos datos similares a los de playground.

La función __make_blobs__ crea "pelotas" (clusters de datos) generadas aleatoriamente, vamos a crear dos pelotas y visualizarlas.

En __X__ se almacenan las coordenadas de x1 y x2, y en __y__ se almacena si una determinada fila pertenece al grupo 0 (rojo) o al 1 (azul). 

Por así decirlo __X__ es una matriz de 100x2 que contiene las variables independientes o predictoras e __y__ es un vector (100x1) que contiene la variable dependiente o la categoría que hay que pronosticar.

In [None]:
X, y = make_blobs(centers=2, cluster_std=0.8)
miplot(X,y)

In [None]:
# podemos visualizar el contenido de X solo escribiendo su nombre y ejecutandolo
# fijate que son coordenadas con x1 y x2
X

In [None]:
# lo mismo con y
# fijate que son valores de 0 y 1 (grupo rojo y azul)
y

Vamos a crear una red neuronal usando __Keras__ para predecir si un dato pertenece al grupo 0 o al 1.

Es una red sencilla, una única capa con una única neurona (ya sabemos que eso es suficiente), fíjate en el código y en los comentarios:

In [None]:
model = Sequential()  # se define red

model.add(Dense(1, activation='sigmoid', input_dim=2))  # creamos la primera capa oculta, esta tiene como entrada dos variables (input_dim=2)
                                                        # la función de activacion es una sigmoide (activation='sigmoid')
                                                        # tiene una única neurona (1)

model.add(Dense(1, activation='sigmoid'))     # creamos la capa de salida, una sigmoide
                                              # al ser una clasificacion binaria la capa de salida siempre tiene solo 1 neurona

model.summary()  # nos hace un resumen del modelo, interesante el recuento de parametros

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])  # contruye la red que hemos definido
      # estos parametros no los toques por ahora, ya los veremos mas adelante
      # basicamente estamos definiendo la función de coste y el tipo de optimizador

Pues ya se ha creado la red, más fácil es imposible. Dos cosas que hay que tener en cuenta y que a veces confunden en Keras:

1. No se define la capa de entrada, sino que en la primera capa oculta se dice qué datos van a entrar.
1. Sí se define la última capa, la de salida

Y ahora lo que queda es aplicar nuestra red a los datos que hemos creado antes

In [None]:
model.fit(X, y, epochs=100)  # se ejecuta el proceso de aprendizaje, 100 interaciones (epochs)

In [None]:
test_loss, test_acc = model.evaluate(X, y)  # se evalua la precision de la red

Ya lo veremos más adelante pero en resumen:
1. loss: valor de la función de coste. Fíjate cómo va disminuyendo según van sucediéndose las épocas (reducimos el error)
1. accuracy: Es la precisión en la clasificación. Va aumentando hasta llegar a 1.0 (el 100%)

__Ya está!__

Ya hemos creado y calculado nuestra primera red de Deep Learning, consiguiendo un 100% de éxito.

Ahora lo que nos quedaría es hacer un plot para ver lo bien que estamos clasificando

In [None]:
# guardamos en una variable llamada yp las predicciones hechas por la red con model.predict

yp = (model.predict(X) > 0.5).astype("int32")
miplot(X,yp.flatten())  # dibujamos esas predicciones

Si comparamos el dibujo del inicio y este vemos que son prácticamente idénticos, hemos conseguido reproducir exáctamente los dos grupos de datos.



---
Lo anterior está bien para empezar, pero ahora toca pensar y generalizar lo aprendido.

Haz los siguientes ejercicios y sube las respuestas a moodle

# Ejercicio 1

Con la función __make_circles__ podemos crear clusters de datos circulares como los que teníamos en playground.
1. Genera unos datos circulares 
1. Construye una red que maximice la clasificación

In [None]:
#para ayudar un poco te pongo el codigo para crear los datos

X,y = make_circles(noise=0.2, factor=0.5, random_state=1)
miplot(X,y)

# Ejercicio 2

Con la función __make_moons__ podemos crear clusters de datos en espiral como los que teníamos en playground.
1. Genera unos datos circulares 
1. Construye una red que maximice la clasificación

Recuerda que solo con x1 y x2 no es suficiente, por eso te doy el código para incluir en __X__ los dos senos

Recuerda también que con una sola capa no se podía resolver, introduce una nueva capa en el modelo

In [None]:
X,y = make_moons(noise=0.3, random_state=0)
miplot(X,y)

X = np.concatenate((X,np.sin(X)), axis=1) # no te preocupes por este codigo, simplemente metemos los senos de
                                          # x1 y x2 en la matriz X

X # puedes comprobar que ahora tiene 4 variables: x1, x2, sin(x1), sin(x2)

---

# Si te apetece

Si te apetece puedes "_jugar_" con los parámetros de las funciones de creación de datos para generar datos más distintos y comprobar si tus redes también pueden clasificarlos