# ¿Qué es Machine Learning?

Fundamentalmente, el aprendizaje automático implica construir modelos matemáticos para ayudar a entender los datos.
"Aprendizaje" entra en la contienda cuando le damos a estos modelos parámetros ajustables que pueden adaptarse a los datos observados; De esta manera, se puede considerar que el programa está "aprendiendo" de los datos.
Una vez que estos modelos se han ajustado a los datos vistos anteriormente, se pueden usar para predecir y comprender aspectos de los datos recientemente observados.

## categorías de ML

 En el nivel más fundamental, el aprendizaje automático se puede clasificar en dos tipos principales: aprendizaje supervisado y aprendizaje no supervisado.

El **aprendizaje supervisado** implica modelar de alguna manera la relación entre las características medidas de los datos y alguna etiqueta asociada con los datos; Una vez que se determina este modelo, se puede usar para aplicar etiquetas a datos nuevos y desconocidos. Esto se subdivide en tareas de clasificación y de regresión: en la clasificación, las etiquetas son categorías discretas, mientras que en la regresión, las etiquetas son cantidades continuas.

El **aprendizaje no supervisado** implica modelar las características de un conjunto de datos sin hacer referencia a ninguna etiqueta. Estos modelos incluyen tareas como la agrupación y la reducción de dimensionalidad.

## Ejemplo de aplicaciones

### clasificación:

Analizaremos una tarea de clasificación simple, en la que se le asigna un conjunto de puntos etiquetados y desea utilizarlos para clasificar algunos puntos sin etiquetar.

Imagina que tenemos los datos que se muestran en esta figura:

En la figura tenemos datos bidimensionales: representadas por las posiciones *(x,y)* de los puntos en el plano.
Además, tenemos una de las dos etiquetas de clase para cada punto, aquí representadas por los colores de los puntos.
A partir de estas características y etiquetas, nos gustaría crear un modelo que nos permita decidir si un nuevo punto debe etiquetarse como "azul" or "rojo."

Existen varios modelos posibles para una tarea de clasificación de este tipo, pero aquí usaremos uno extremadamente simple. Supondremos que los dos grupos se pueden separar trazando una línea recta a través del plano entre ellos.
Aquí, el modelo es una versión cuantitativa de la declaración  "una linea recta que separa las clases", ientras que los parámetros del modelo son los números particulares que describen la localización y orientación de los datos.
Los valores óptimos para estos parámetros del modelo se aprenden de los datos (este es el "aprendizaje" en el aprendizaje automático), que a menudo se denomina **entrenamiento del modelo**.

La siguiente figura representa un modelo entrenado:

![](figures/05.01-classification-2.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Classification-Example-Figure-2)

Ahora que este modelo ha sido entrenado, se puede generalizar a datos nuevos, sin etiquetar.
 En otras palabras, podemos tomar un nuevo conjunto de datos, dibujar esta línea de modelo a través de él y asignar etiquetas a los nuevos puntos basados en este modelo.
Esta etapa se suele llamar **predicción**. Vea la siguiente figura::

![](figures/05.01-classification-3.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Classification-Example-Figure-3)

### Regression

A diferencia de las etiquetas discretas de un algoritmo de clasificación.

Considere los datos que se muestran en la siguiente figura, que consiste en un conjunto de puntos cada uno con una etiqueta continua:

![](figures/05.01-regression-2.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Regression-Example-Figure-2)

![](figures/05.01-regression-3.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Regression-Example-Figure-3)

![](figures/05.01-regression-4.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Regression-Example-Figure-4)

### Clusterizado (clustering): etiquetas sobre datos no etiquetados

Un caso común de aprendizaje no supervisado es el "agrupamiento", en el que los datos se asignan automáticamente a un número determinado de grupos discretos.
Por ejemplo, podríamos tener algunos datos bidimensionales como los que se muestran en la siguiente figura:

![](figures/05.01-clustering-1.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Clustering-Example-Figure-2)

Dada esta entrada, un modelo de agrupación utilizará la estructura intrínseca de los datos para determinar qué puntos están relacionados.
Usando el algoritmo **k-means** muy rápido e intuitivo, encontramos los clusters que se muestran en la siguiente figura:

![](figures/05.01-clustering-2.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Clustering-Example-Figure-2)

k-means se ajusta a un modelo que consiste en k centros de cluster; se supone que los centros óptimos son aquellos que minimizan la distancia de cada punto desde su centro asignado.

### Reducción de dimensionalidad

Reducción de la dimensionalidad: las etiquetas u otra información se deducen de la estructura del conjunto de datos en sí.
Generalmente busca extraer una representación de datos de baja dimensión que de alguna manera conserva las cualidades relevantes del conjunto de datos completo.

Por ejemplo:

![](figures/05.01-dimesionality-1.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Dimensionality-Reduction-Example-Figure-1)

La siguiente figura muestra resultados de un algoritno Isomap,  un algoritmo de aprendizaje manifold:

![](figures/05.01-dimesionality-2.png)
[figure source in Appendix](06.00-Figure-Code.ipynb#Dimensionality-Reduction-Example-Figure-2)

Observe que los colores (variables) cambian uniformemente a lo largo de la espiral, lo que indica que el algoritmo detectó de hecho la estructura que vimos a simple vista.
Al igual que con los ejemplos anteriores, el poder de los algoritmos de reducción de dimensionalidad se vuelve más claro en los casos de dimensiones superiores.
Por ejemplo, podríamos desear visualizar relaciones importantes dentro de un conjunto de datos que tiene 100 o 1,000 características.
Visualizar datos de 1.000 dimensiones es un desafío, una forma en que podemos hacerlo más manejable es usar una técnica de reducción de dimensionalidad para reducir los datos a dos o tres dimensiones.

<!--NAVIGATION-->
< [Machine Learning](05.00-Machine-Learning.ipynb) | [Contents](Index.ipynb) | [Introducing Scikit-Learn](05.02-Introducing-Scikit-Learn.ipynb) >

<a href="https://colab.research.google.com/github/jakevdp/PythonDataScienceHandbook/blob/master/notebooks/05.01-What-Is-Machine-Learning.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory"></a>
