# Fundamentos
En este bloque se encontraran los fundamentos y conceptos básicos necesarios para el desarrollo de redes neuronales en el área de Deep Learning. Todos los contenidos teóricos proporcionados en este bloque han sido recogidos del libro "_Deep Learning with Python_" del autor François Chollet

## Fundamentos I. ¿Qué es el Deep Learning?
Este primer cuaderno será más teórico que el resto y se centrará en explicar qué es el Deep Learning (**DL**) y las características que la diferencian del resto de tipos de técnicas de Inteligencia Artificial (**IA**). Además, también se explicará el funcionamiento de las redes neuronales y la forma en la que son empleadas.

### 1. IA Clásica vs Machine Learning
Antes de explicar qué es el Deep Learing, debemos explicar el contexto en el que se encuentra y cómo se relaciona con estas otras técnicas de Inteligencia Artificial. De manera anticipada, podemos decir que el Deep Learning es una subárea del Machine Learning (**ML**), siendo este un paradigma totalmente distinto al usado en el desarrollo clásico de Inteligencia Artificial.
El paradigma clásico por el que se logra Inteligencia Artificial siempre ha sido el desarrollo de algoritmos que dados un conjunto de reglas y de datos, se obtiene una respuesta. Por otro lado, el enfoque propuesto por el Machine Learning, en lugar de enseñarle lo que sabemos al programa (el conjunto de reglas), buscamos que el programa aprenda por sí mismo lo que tiene que hacer.

![IA Clasica vs Machine Learning](img/clasica_vs_machine_learning.png)

Ilustremos esta diferencia con un ejemplo, supongamos que estamos tratando de realizar un programa que encuentre el camino entre dos puntos en una malla, es decir, encontrar un camino desplazándose arriba, abajo, izquierda o derecha. Queremos que el programa sea capaz de encontrar un camino entre la posición inicial y la posición destino o final, y que solo se pueda mover en las cuatro direcciones básicas (arriba, abajo, izquierda y derecha). En el paradigma clásico tendríamos que codificar todas las reglas por las que se rigen los movimientos y aplicar o desarrollar un algoritmo de búsqueda de caminos que permitiese encontrar el camino deseado. Por otro lado, si seguimos el enfoque del Machine Learning, tendríamos que proporcionarle al programa los distintos datos de entrada como pudieran ser el punto inicial y final, y una serie de ejemplos de problemas resueltos de diferentes instancias del problema. Posteriormente, el algoritmo usaría esos datos de ejemplo para aprender la forma en la que se encuentran los caminos dentro de la malla e inferir las reglas del mundo en el que se está moviendo.

Como podemos ver en el ejemplo, un sistema o _modelo_ de Machine Learning es entrenado en lugar de programado como en el enfoque clásico. Al modelo se le presentan tantos ejemplos como sean posibles de resoluciones del problema a resolver para que aprenda la estructura o modelo estadístico que sigue y que finalmente sea capaz de encontrar las reglas o el modelo para automatizar la tarea para la que ha sido creado.

### 2. ¿Cómo aprende el Machine Learning?
Como se ha mencionado en el punto anterior, la técnica de Machine Learning necesita aprender una representación de los datos del problema para poder solucionar el problema de la mejor manera posible. Esto lleva a plantearse la siguiente pregunta: _¿Cómo aprende un modelo de Machine Learing?_
Para que un modelo de Machine Learning aprenda se necesitan tres elementos fundamentales:
1. **Conjunto de Datos de Entrada (Dataset)**: son los datos de entrada que el sistema necesita para realizar su función, estos pueden ser archivos sonido, imágenes, flujos de datos, etc.
2. **Ejemplos de Datos de Salida**: son los resultados esperados del conjunto de datos de entrada, es decir, sirven para que el sistema vea el resultado que debería proporcionar para una entrada concreta.
3. **Una Función de Coste (Loss Function)**: esta es posiblemente una de las partes más importantes de un modelo de Machine Learning, esta función permite cuantificar cómo de bien el sistema ha aproximado un resultado para un conjunto de datos de entrada concretos. En otras palabras, esta función compara el resultado obtenido con el esperado y nos proporciona una valoración. Un ejemplo de función de coste sería el **Error Cuadrático Medio**. Se dice que esta función es tan importante ya que el valor proporcionado es usado para controlar el proceso de aprendizaje.

Utilizando estos tres elementos, el sistema aprende ha realizar una representación de los datos de entrada. De forma muy simplificada, podríamos decir que el objetivo de los modelos de Machine Learning es encontrar la representación correcta de los datos de entrada.

### 3. Deep Learning
El Deep Learning es una subárea del Machine Learning que aprende la representación de los datos de entrada pero enfocándose en hacerlo mediante un sistema de capas de representación en el que cada capa aprende un nivel de respresentación más significativo que el de la capa anterior. El "_deep_" de Deep Learing no guarda ninguna relación con que aprenda de forma más profunda o alcance un nivel conocimiento más alto de los datos, en realidad hace referencia al número de niveles o _capas_ utilizadas para aprender la representación de los datos. Los sistemas de Deep Learning actuales están formados por cientos o miles de capas mientrás que los enfoques de Machine Learing suelen involucrar sólo una o dos capas de representación.

Estas representaciones de capas son conocidas como **Redes Neuronales**, que son literalmente capas de neuronas apiladas y conectadas entre sí una tras otra. 

Resumiendo lo que hemos visto hasta ahora, sabemos que el Machine Learning trata sobre tomar unos datos de entrada relacionados con el problema que queremos resolver y conectarlos o enlazarlos de alguna forma con unos resultados concretos, y esta forma de enlazarlos se consigue a través de ejemplos de datos de entrada y de salida. Cada vez que tratamos de conectar los datos se mide cómo de bien se han conectado y en base a esto ajustamos los parámetros del modelo para mejorar esta conexión. 

#### 3.1 ¿Cómo funciona el Deep Learning?
En esta sección hablaremos más en profundidad de todos los aspectos del aprendizaje del Deep Learning y cómo contribuye cada uno al preceso de aprendizaje.

Las capas de neuronas son los fundamentos del modelo y se encargan de transformar los datos. Los datos que recibe cada neurona de la capa son almacenados junto con el peso o importancia de cada uno, es decir, la transformación que realiza la neurona se encuentra parametrizada. Siguiendo por este camino, podríamos decir que el proceso de aprendizaje se basa en encontrar los pesos correctos para cada neurona del modelo. Aunque esto nos presenta un problema: en un modelo podemos tener perfectamente millones de pesos que ajustar y debemos tener en cuenta que modificar un peso afectará también al resto. Antes de continuar debemos hacer una aclaración bastante importante, aunque las redes neuronales sean un conjunto de neuronas conectadas entre sí, es mucho más eficiente para el desarrollo pensar que las redes están compuestas por capas de neuronas que aunque tengan pesos diferentes, todas las neuronas reciben las mismas entradas y realizan las mismas operaciones.

![Capas y Pesos](img/capas_y_pesos.png)
Para controlar y facilitar este proceso de aprendizaje, se introduce la **Función de Coste** que nos permite medir cómo de diferente es el resultado obtenido del esperado. Utilizando los resultados proporcionados por esta función es posible saber cuanto nos hemos desviado del oobjetivo y cómo de grandes deben de ser las modificaciones para alcanzar el ajuste correcto.

![Funcion de Coste](img/funcion_de_coste.png)

Por último, para realizar el ajuste de los parámetros del modelo debemos utilizar un _optimizador_ que implemente el **Algoritmo de Backpropagation**. Este algoritmo es el más importante de todo el aprendizaje de redes neuronales ya que es el que realiza la acción de "aprender". En el siguiente cuaderno se explicará con mayor detalle los aspectos de este algoritmo.

![Optimizador](img/optimizador.png)

Por lo tanto, el proceso general de aprendizaje en un sistema de Deep Learing sería:
1. Cargar el modelo de la red con sus pesos iniciales.
2. Abastecer el modelo con datos de prueba junto con sus resultado.
3. Comparar los resultados obtenidos con los esperados usando la **Función de Coste**
4. Enviar los resultados de la función de coste al optimizador
5. El optimizador actualiza los pesos o _parámetros_ del modelo

Este proceso de aprendizaje se repite el tantas veces hasta que se alcancen unos criterios de aceptación del modelo, hasta que se acaben los datos de entrenamiento o hata llegar a un límite de iteraciones. También se debe mencionar que existen diversas técnicas para facilitar este proceso y permitir al modelo aprender de una forma adecuada.