# ¿Que es un modelo?

**Datos de entrenamiento -> MODELOS -> Datos validacion -> Predicción**

Un modelo es una representación abstracta, conceptual o matemática de un componente, un sistema, un proceso o una tarea.

Los modelos son interpretaciones que intentan conceptualizar o dar un sentido a los datos observados. En términos estadísticos, con los modelos se pretende generalizar el comportamiento de la población global a partir del estudio de un conjunto de muestras. Los modelos son muy útiles para realizar predicciones. 

El modelo recibe datos de entrada, y ofrece un dato o varios de salida. Esa salida, también conocida como *predicción* del modelo, es la respuesta o solución que el modelo ofrece para los datos recibidos a la entrada. 

El **Machine Learning** como su nombre indica, permite un aprendizaje automático del modelo que mejor se ajusta a los datos suministrados. Se trata de encontrar el modelo más representativo, es decir, el que mejor rendimiento presenta en la realización de la tarea.

Al inicio del proceso de aprendizaje, la máquina no conoce cuál es el modelo a seguir. Por ello, al inicio del
aprendizaje, la maquina plantea una ***hipótesis*** (modelo inicial) de cómo resolver la tarea. Probablemente, la hipótesis inicial sea incorrecta, o tenga poco rendimiento, y haya que hacer correcciones de la misma. Si se tiene alguna idea o intuición previa de cómo resolver la tarea, la hipótesis puede tratarse de una aproximación inicial al modelo buscado, que poco a poco se irá ***ajustando*** con eln aprendizaje.

A medida que la maquina aprende, el modelo es modificado (ajustado), para aumentar el rendimiento con que realiza la tarea en cuestión. Para medir el rendimiento del modelo, se observa su salida frente a datos conocidos como datos de validación. Cuando se alcanza un rendimiento razonable, se dice que el aprendizaje ha terminado y se da el modelo por aprendido. Ya no hablaríamos de hipótesis, sino de ***modelo***. Ese modelo aprendido es el que se guardará y se empleará para resolver la tarea de forma automática en el futuro.

# Tipos de aprendizaje y tipos de modelos

## Tipos de aprendizaje
El proceso de aprendizaje en una máquina es iterativo, es decir, consiste en la repetición de ciclos, y depende de los datos de ejemplo de los que se disponga. Mediante la observación iterativa de múltiples ejemplos la máquina o programa, en cada ciclo, adquiere experiencia en la realización de una tarea, y trata de aprender de sus errores para corregir su modo de realizar la tarea y así mejorar su rendimiento en el ciclo siguiente.

El proceso de aprendizaje a menudo es llamado ***entrenamiento***, debido a la naturaleza iterativa del proceso, en el que la mejora es progresiva, y la experiencia es adquirida con numerosos "intentos" de realizacion de la tarea.

Dependiendo de la tarea a resolver y de los datos disponibles para abordarla, se puede elegir entre diferentes tipos de aprendizaje. Estos son: **aprendizaje supervisado, aprendizaje no supervisado, y aprendizaje por refuerzo**.

### 1. Aprendizaje Supervisado
El aprendizaje supervisado es aquel en el que el proceso de mejora del rendimiento es guiado por la comparación de la predicción que ofrece el modelo con respecto a la solución o salida real que se espera obtener.

Para realizar este tipo de entrenamiento es necesario disponer de ejemplos tanto de datos de entradas como de sus correspondientes salidas. En otras palabras, se necesitan ejemplos para los cuales ya conozcamos el resultado o salida real.

Por ejemplo, si queremos entrenar, con un aprendizaje supervisado, un modelo que determine si en una fotografía aparece el cielo o no, necesitaremos múltiples fotografías de ejemplo (unas con cielo y otras sin él) y además las etiquetas correspondientes, es decir, debemos pasarle al algoritmo de aprendizaje la solución para cada imagen, o lo que es lo mismo la información de si tiene cielo o no.

Lo que finalmente se espera del modelo es que ofrezca predicciones similares a las etiquetas tomadas como referencia.

En conclusión, el aprendizaje supervisado necesita conjuntos de datos etiquetados, es decir, le tenemos que decir al modelo qué es lo que queremos que aprenda.

Dependiendo del tipo de etiqueta, dentro del aprendizaje supervisado existen dos tipos de modelos: 
- los de **regresión**, dónde la etiqueta es una variable continua 
- los de **clasificación**, dónde la etiqueta es discreta. 

Apuntes MJ:
- Se genera un modelo predictivo basado en datos de entrada/salida. 
- Tenemos datos previamente etiquetados/clasificados (conocimiento a priori)




### 2. Aprendizaje No Supervisado
A diferencia del aprendizaje supervisado, en el no supervisado no se sigue una referencia de la que aprender. El aprendizaje no supervisado emplea datos que no han sido etiquetados ya que no trata de predecir un determinado valor a la salida. Este tipo de entrenamiento se emplea para resolver tareas consistentes en el análisis de los datos para estructurarlos o agruparlos por afinidad.

Este tipo de aprendizaje no se emplea para predecir una salida a partir de los datos de entrada. No predice una solución, ni clasifica los datos de entrada con una etiqueta, sino que **extrae nuevo conocimiento a cerca de los datos de entrada, los organiza, agrupa, o incluso simplifica, extrayendo la información fundamental de los mismos**.

Algunos ejemplos de modelos que emplean aprendizaje no supervisado son los de:
- **agrupación (clustering)**
- los de **detección de anomalías**
- los **asociativos**
- los de **reducción de la dimensionalidad**


Apuntes MJ:
- Ajustan su modelo predictivo con los datos de entrada.
- No tenemos datos previamente etiquetados/clasificados


## Tipos de modelos
### 1. Regresión (aprendizaje supervisado)
Los modelos de regresión crean un mapa entre las variables de entrada y una función continua, por lo tanto, permiten predecir una salida que toma valores reales continuos. Los modelos de regresión se entrenan mediante aprendizaje supervisado.

Un tipo de regresión ampliamente empleado es la **regresión lineal**, donde la función que relaciona la salida con la o las entradas es lineal. En el caso concreto de tener una única variable de entrada, la ecuación que define la salida del modelo en función de la entrada sería la de una línea recta.

Un ejemplo de problema de regresión sería el de predecir el precio de venta de una vivienda en función de su tamaño, a partir de datos de ventas previas.


### 2. Clasificacion (aprendizaje supervisado)
Los modelos de clasificación mapean las variables de entrada en categorías discretas (también llamadas clases), es decir, clasifican una determinada muestra a partir de las variables de entrada tomadas. Estos modelos predicen una salida que toma valores discretos. Estos valores discretos son las etiquetas correspondientes a cada una de las clases posibles. Los modelos de clasificación se entrenan con aprendizaje supervisado.

Tipos de clasificacion:
- Si el número de clases posibles es sólo de dos, hablamos de un modelo de **clasificación binaria**, como el que se muestra en - Si el número de clases es mayor que dos, se trata de una **clasificación multiclase**.

El ejemplo anterior de predicción del precio de una vivienda se puede transformar en un problema de clasificación haciendo que la salida del modelo sea si la vivienda se vende por más o menos del precio pedido. Se trata de una clasificación de las casas en dos categorías discretas basada en el precio.


### 3. Clustering (aprendizaje no supervisado)
El clustering es la agrupación de los datos basada en las relaciones entre las variables de entrada que se toman de los datos. Estos modelos no atienden a ningún tipo de etiqueta o referencia, por lo que se trata de métodos de aprendizaje no supervisado.

Un ejemplo de problema de clustering sería el caso en el que tenemos una colección de 2000 encuestas sobre la economía de una región y se busca una manera de agrupar las encuestas automáticamente en un número pequeño de grupos de encuestas similares, relacionadas por diferentes variables como la frecuencia de algunas palabras o longitud de los párrafos.


### 4. Detección de Anomalías
Los detectores de anomalías se basan en la asunción de que la mayoría de los datos tomados tienen un comportamiento o valores normales. Los modelos de detección de anomalías no requieren de etiquetas de los datos, ya que modelan la distribución de probabilidad de todos los datos de entrada. 

Si llegan datos, que, de acuerdo con el modelo, presentan poca probabilidad, estas muestras serán considerados como anómalas.

Un ejemplo de problema de detección de anomalías sería el caso en el que se identifica un producto defectuoso por los valores anómalos de algunas de sus características, que difieren mucho del resto (la mayoría) de productos en buenas condiciones.


### 5. Aprendizaje Asociativo
Los modelos asociativos, como su nombre indica, asocian una nueva muestra con otras previamente estudiadas por similitud (similar al clustering), y además si las muestras previas fueron etiquetadas con anterioridad (han sido clasificadas), esa etiqueta también es asociada a la nueva muestra. Puede entenderse como una combinación de clustering y  clasificación. En la 

Por ejemplo, un caso de aprendizaje asociativo sería el realizado por un doctor que a lo largo de años de experiencia forma asociaciones entre características de pacientes y diagnósticos de enfermedades confirmados. Si un nuevo paciente aparece, se basa en sus características para asociar una posible enfermedad, de acuerdo con la similitud con los pacientes previos. Difiere de un problema de clasificación, donde se buscaría una función que directamente relacionase las características del paciente con distintas enfermedades.


### 6. Reducción de dimensionalidad
Los métodos de reducción de dimensionalidad seleccionan o combinan las variables tomadas de los datos para reducir el número de las mismas. La reducción de dimensionalidad suele ser un paso previo al entrenamiento de otros modelos. Las razones para tratar de disminuir la dimensionalidad de los datos de entrada son múltiples: reducir el tiempo de entrenamiento de los algoritmos, mejorar el rendimiento del modelo o facilitar la representación visual de los datos.

Los algoritmos de reducción de dimensionalidad emplean métodos estadísticos y matemáticos para transformar la base de datos original en una nueva con menos dimensiones. El inconveniente es que en el proceso se pierde algo de información. Sin
embargo, para minimizar la relevancia de la información perdida, estos métodos realizan un análisis de componentes, es decir, un análisis de las variables de entrada disponibles. A partir de ese análisis seleccionan solamente las variables principales o
más características, como el método **PCA (Principal Component Analysis)**.

# Resumen de tipos de Aprendizaje
![image.png](attachment:image.png)

# Scikit-Learn

Libreria para realizar el análisis predictivo de datos. Permite implementar multitud de técnicas de Machine
Learning, tanto con aprendizaje supervisado, como no supervisado. Algunas de las tareas que permite implementar son:
- **regresión** (lineal, polinómica y logística)
- **clasificación** (máquinas de vectores de soporte, árboles de decisión, bosques aleatorios, clasificadores bayesianos)
- **agrupamiento** (clustering)
- **reducción de dimensionalidad**
- **detección de anomalías**

Mirar la web, hay mucha info: https://scikit-learn.org/stable/

![image.png](attachment:image.png)![image-2.png](attachment:image-2.png)
