# 1 - Fundamentos básicos

**Sumario**

1. Introducción
2. Fundamentos básicos de Machine Learning
3. Fundamentos básicos de Deep Learning
4. Herramientas básicas para el desarrollo de modelos
5. Introducción a Scikit-learn

## 1.1 - Introducción

Una de las capacidades más importantes de los seres vivos es la de **aprender**, ya que esta les permite adaptarse a las necesidades del entorno con el objetivo de aumentar sus posibilidades de supervivencia. De este modo, **los seres vivos adquieren nuevas habilidades y/o conocimientos, modifican lo aprendido previamente o lo mejoran mediante la interacción con su entorno**. Es decir, los seres vivos siguen un proceso de adaptación al entorno, en muchos casos de manera autónoma, mediante un proceso de aprendizaje y **con el objetivo de maximizar su capacidad de supervivencia**.

**Este proceso de adaptación es mucho más complejo en los seres humanos**, pues no solo se limita al entorno y a sus interacciones con él, sino que también influyen ciertos factores relacionados con valores, principios morales y reglas sociales que ejercen un impacto significativo sobre las diferentes habilidades, destrezas, conocimientos y/o conductas que estos son capaces de aprender.

### 1.1 - Algoritmos tradicionales

Esta poderosa capacidad de los seres humanos para construir modelos de comportamiento en base a la información que obtienen del entorno les llevó al diseño de **algoritmos**, los cuales **reproducen comportamientos mediante una serie de reglas estáticas**:

<img src="images_1/algoritmo_tradicional.png" width="600" data-align="center">

* **Datos**. Son los datos de entrada suministrados al algoritmo para generar una respuesta.

* **Reglas estáticas**. Son las que rigen el comportamiento del algoritmo y que han sido definidas por un experto que posee un conocimiento avanzado del comportamiento que se quiere replicar. Este conjunto de reglas suele estar incluido en la estructura del algoritmo, de modo que suele ser complicado de modificar, pues implicaría la modificación del algoritmo.

* **Resultado**. La respuesta del algoritmo.

Este acercamiento presenta **muchas dificultades para adaptarse a nuevas situaciones** si estas no han sido previstas por los expertos a la hora de definir las diferentes reglas que utiliza el algoritmo. 

Dos tipos de tareas donde observamos las limitaciones de los algoritmos tradicionales son: 

* **Tareas en las cuales es dificil especificar nuestro conocimiento en forma de reglas**.
    * Reconocimiento facial
    * Sintetización de voz
    * Diágnóstico médico
    
<img src="images_1/mars_rover.jpg" width="300" data-align="center">
 
* **Tareas en las que no tenemos conocimiento experto**.
    * Exploración espacial
    * Navegación bajo el agua
    
<img src="images_1/stereo_spectrum.png" width="300" data-align="center">


### 1.2 - Algoritmos de aprendizaje automático

Este tipo de limitaciones dieron lugar a diferentes áreas de investigación con el objetivo de imitar los modelos de aprendizaje humano:

* **Aprendizaje inductivo**. Consiste en construir modelos a partir de un proceso de generalización mediante ejemplos simples.

* **Aprendizaje deductivo** o analítico que consiste en construir modelos a partir de un proceso deductivo mediante la identificación de una descripción general a partir de un conjunto de ejemplos los cuales son explicados de forma específica y completa.

* **Aprendizaje analógico** que consiste en construir modelos que permiten generar soluciones a problemas nuevos mediante la búsqueda de similitudes con problemas previamente resueltos.

* **Aprendizaje conexionista** que consiste en construir modelos basados en las conexiones de entidades sencillas.

----

**Nota:** Hoy en dia cuando nos referimos a aprendizaje automatico o Machine Learning, solemos referirnos a implicitamente a la modalidad inductiva.

----

<img src="images_1/algoritmo_aprendizaje.png" width="600" data-align="center">

* **Datos**. Son los datos de entrada suministrados al algoritmo de aprendizaje automático para construir el modelo.

* **Modelo**.La representación del comportamiento/patrón extraido a partir de los datos y del feedback generado por sus propias respuestas. 

* **Resultado**. La respuesta del modelo a los datos introducidos.

* **Feedback**. La respuesta del entorno ante el resultado generado por el algoritmo. Cuanto mejor represente el modelo la tarea, mejor será el feedback del entorno. Es lo que le permite aprender y modificar su comportamiento adecuadamente.

Este cambio de paradigma supuso **la aparición de diferentes tipos de familias de algoritmos que abordaban diferentes tipos de problemas**:

* **Algoritmos de aprendizaje supervisado**
    * Datos de aprendizaje + resultados esperados (etiquetas)
* **Algoritmos de aprendizaje no-supervisado**
    * Datos de aprendizaje (sin etiquetas)
* **Algoritmos de aprendizaje por refuerzo**
    * Observaciones y recompensas periódicas a medida que el algoritmo toma acciones secuenciales en un entorno

A su vez, surgieron gran cantidad de **tipos de modelos con los que abordar estos problemas de aprendizaje**:

* Árboles de decision
* Máquinas de vectores de soporte
* Modelos probabilísticos gráficos (e.g., Naïve Bayes)
* Modelos lineales generalizados (e.g., regresión lineal, regresión logística)
* **Redes neuronales**
* etc.


### 1.3 - Redes neuronales

Una red neuronal es un modelo simplificado que emula el modo en que el cerebro humano procesa la información: Funciona simultaneando un número elevado de unidades de procesamiento interconectadas que parecen versiones abstractas de neuronas.

Las familia de modelos de las redes neuronales ha evolucionado enormemente desde las primeras versiones del **perceptrón** [Minsky, 1969; Schmidhuber, 2015] hasta los complejos modelos construidos mediante la utilización del **aprendizaje profundo (Deep Learning en inglés)** conforme a millones de datos y complejas estructuras basadas en redes de neuronas [Mitchell, 1997].

La gran evolución experimentada por las redes de neuronas de tipo profundo, ha posibilitado la aparición de un área de especialización específica dentro del aprendizaje automático:

<img src="images_1/aprendizaje_automatico_globo.png" width="300" data-align="center">

Las redes neuronales profundas han demostrado una **gran capacidad para resolver tareas complejas** y se utilizan actualmente en gran cantidad de ambitos. Por ejemplo:

* **Movilidad**. Identificación de rutas más eficientes por carretera que minimicen el número de embotellamientos en las principales arterias de las ciudades, disminuyendo el tiempo, el consumo y/o la contaminación.

* **Agricultura**. Identificación de las áreas de cultivo más adecuadas para cada tipo de producto, de sus fechas de recogida en base al momento óptimo de maduración y de los posibles problemas durante el proceso de crecimiento mediante la detección de enfermedades (visión artificial).

* **Medios de comunicación**. Personalización de la publicidad y de las recomendaciones mediante la utilización de datos multimodales referentes a los usuarios y las usuarias.

Sin embargo, **dada la complejidad de su arquitectura** y de las operaciones matemáticas que se producen en su interior, **resulta extremadamente difícil construir una explicación fácilmente comprensible de por qué la red toma las decisiones que toma** en base a la configuración que ha aprendido a partir de los ejemplos de entrenamiento. 

Esta “debilidad” explica que las redes neuronales profundas no se puedan utilizar (o se deban se utilizar en conjunción con humanos) en aquellos ambitos donde la toma de decisiones del modelo podría influir significativamente sobre la salud o el bienestar de los mismos. Por ejemplo:

* **Diagnóstico medico**. Las predicciones del modelo son analizadas por uno o varios médico que son los que toman la decisión final.

* **Banca**. Los modelos de riesgo deben ser modelos completamente interpretables (por regulación gubernamental).

## 2 - Fundamentos básicos de Machine Learning

## 3 - Fundamentos básicos de Deep Learning

## 4 - Herramientas básicas para el desarrollo de modelos

## 5 - Introducción a scikit-learn