# ¿Qué es Aprendizaje Automático?

*“Definimos Aprendizaje Automático como un conjunto de métodos que pueden detectar
automáticamente patrones en los datos y luego utilizarlos para predecir alguna fecha o para
realizar otro tipo de toma de decisiones bajo incertidumbre ( como plantear como recopilar
más datos)” Kevin Murphy (Research Google)*

La frase anterior resumen lo que se puede entender como *Aprendizaje Automático, Machine Learning o Estadística del Aprendizaje*. Formalmente Aprendizaje Automático es un subcampo de Inteligencia Artificial.


![Imagen_1](Figuras/Diagrama.png)
<p>
    <center>Figura 1. Diagrama del libro **Deep Learning** de *Ian Goodfellow, Yoshua Bengio y Aaron Courville*, con el cual representan la relación entre los campos de Inteligencia Artificial, Machine Learning y Deep Learning. </center>
</p>

A grandes razgos lo que se busca es que un conjunto de algoritmos puedan tomar decisiones sin que alguién le dicte reglas o conjunto de ellos sean capaces de tomar decisiones de manera automática. El otro aspecto importante es que el sistema, algoritmos o conjunto de algoritmos sean capaces de seguir operando ante datos **"desconocidos"**; es decir que pueda **"generalizarse"** su aprendizaje.

Un ejemplo de lo que significa el parrafo anterior y el diagrama es el siguiete:

* Se tienen un conjunto de correos, textos.
* Se tienen un subconjunto de correos detectados como correos de publicidad, mensajes no deseados o spam.
* Se quiere detectar solo con el texto cuándo un correo es clasificado como spam.

Un modo de proceder es el siguiente: 

* Se toman los correos y se procesan como textos, para extraer las palabras que permitan distinguir entre un correo normal y uno que no lo es.
* Se entrena,se hacen pruebas con una submuestra de correos para validar que el algoritmo funcionó y qué eficiencia tuvo.
* Se elige el algoritmo o modelo, se ejecuta sobre todo el niverso de correos y se usa para clasificar futuros correos.

![Clasificador](Figuras/Resultados_del_clasificador.png)
<p>
    <center>Figura 2. Ejemplo del resultado de un clasificador de Spam, la recta en color negro muestra la separación entre los correos que se clasifican como *spam/no spam* de 2500 correos. Los datos de los correos se encuentran en la dirección [http://spamassassin.apache.org/old/](http://spamassassin.apache.org/old/).  </center>
</p>


En general los datos sobre los cuales se aplicará algún algoritmo se tratará como una matriz de datos, donde cada fila de la matriz es considerada como una *muestra de datos* y cada columna como una *variable*.

Ejemplo, un conjunto de datos con 1500 muestras y 10 variables se visualizará como una matriz de $\mathbb{R}^{1500 \times 10}$:


$$\mathbf{X} = \begin{bmatrix}
    x_{1}^{(1)} & x_{2}^{(1)} & x_{3}^{(1)} & \dots  & x_{10}^{(1)} \\
    x_{1}^{(2)} & x_{2}^{(2)} & x_{3}^{(2)} & \dots  & x_{10}^{(2)} \\
    \vdots & \vdots & \vdots & \ddots & \vdots \\
    x_{1}^{(1500)} & x_{2}^{(1500)} & x_{3}^{(1500)} & \dots  & x_{10}^{(150)}
\end{bmatrix}.
$$

En lo siguiente la matriz de datos se ve como una tabla (DataFrame en Pandas) o un arreglo (array en Numpy).

# Tipos de aprendizajes

ML se divide en dos tipos de algoritmos de aprendizaje, **Aprendizaje Supervisado** (regresión y clasificación) y **No Supervizado** (Cluster, análisis de Componentes Principales). Hay un tercer campo, **Aprendizaje por Reforzamiento**, pero no se aboradá en el tutorial.

## Aprendizaje Supervizado

El aprendizaje supervizado a grandes razgos lo conforman 3 piezas, el siguiente diagrama lo describe:

![Esquema_ML](Figuras/ML_Esquema.png)

El diagrama anterior visto como una relación matemática se podría expresar como:

$$Y=h(X)+ \epsilon $$

La variable **`Y`** representa a datos que buscamos "predecir" con el conjunto de datos en **`X`**, así que los datos  **`Y`** pueden ser categorías (como aceptado/ no aceptado) o pueden ser datos numéricos que pueden ser considerados como números reales $\mathbb{R}$.

El el primer caso se indica que es un problema de **Clasificación** y en el segundo que es un problema de **Regresión**.

## Clasificación

Para el caso de la clasificación  $$y \in \{1,2,..,C\} $$ donde ${C}$ es el número de clases o categorías. Cuando ${C=2}$ se dice que es una **clasificación binaria** y cuando ${C>2}$ se dice que es **clasificación multiple**. 
   
 Alguno ejemplos son:
 
* Spam/No Spam 
* Enfermos/ No Enfermos
* Asignación de Crédito/No Asignación de Crédito
* Clasificación de Textos
* Clasificación de Imagenes
 
 

## Regresión 

Para este caso la variable de "salida" se considera continua; es decir que $ y \in \mathbb{R}$, en general asociamos este tipo de modelos con la idea hacer alguna *predicción* para algún fenómeno o situación.

* Predicir la cantidad de robos la siguiente semana.
* Predecir la cantidad de dinero en la cuenta de un cliente.
* Predecir las ventas de un negocio.
* Predecir la demanda de horas de servicio de un proyecto.

La siguiente imagen muestra un ejemplo del tipo de visualizaciones que tenemos de los problemas que involucran una regresión.


## Aprendizaje No Supervizado

Si omitimos ${Y}$ en el diagrama anterior, solo nos quedan los datos de entrada ${X}$ y ${h}$. En este caso consideramos que el problema que se tienen es un problema de aprendizaje no supervizado. En este tipo de casos lo que se busca es descubrir posibles relaciones entre las variables. 

Entre el tipo de situaciones donde resulta útil este tipo de técnicas es en problemas como :

* Segmentación de Clientes
* Reducción de dimensiones de la muestra de datos.
* Estimacion de la densidad de las variables para ayudar a clasificar la muestra de datos.
* Creación de indicadores.
* Detección de similitudes entre clientes.

## Los dos familias de algoritmos pueden trabajar juntas.

En muchas casos, se hace uso de combinación de técnicas de uno u otro tipo de algoritmos. Un ejemplo sencillo es el siguiente: 

$$ X \longrightarrow  Reduccion \enspace de\enspace Dimensiones \longrightarrow  Algoritmo \enspace Supervizado$$

**Nota:** Para combinar varios algoritmos y etapas de selección y pre-procesamiento, se hace uso de [*pipeline*](http://scikit-learn.org/stable/modules/generated/sklearn.pipeline.Pipeline.html#sklearn.pipeline.Pipeline).