<a href="https://colab.research.google.com/github/GustavoBD-Dev/AnalyticalModelsWithPythonCourse/blob/Session-5/14_TypesOfMachineLearning.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Tipos de aprendizaje automático: supervisado, no supervisado, por refuerzo**

El aprendizaje automático se divide en tres tipos principales: **supervisado**, **no supervisado** y **por refuerzo**. Cada uno se utiliza para resolver diferentes tipos de problemas y se implementa de manera distinta en la práctica.

####**1. Aprendizaje Supervisado**
En el aprendizaje supervisado, el modelo se entrena utilizando un conjunto de datos etiquetados, donde la entrada y la salida esperada son conocidas. El objetivo es que el modelo aprenda a predecir la salida correcta para nuevas entradas basándose en el patrón aprendido.

**Ejemplo de Clasificación:**

```python
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# Dataset de ejemplo (características simples)
X = [[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]]
y = [0, 0, 1, 1, 1]

# Dividir en conjunto de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear y entrenar un modelo de clasificación
clf = RandomForestClassifier()
clf.fit(X_train, y_train)

# Predecir en el conjunto de prueba
y_pred = clf.predict(X_test)

# Evaluar la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print(f'Precisión del modelo: {accuracy}')
```

**Mejores Prácticas:**
- Asegurar que el conjunto de datos esté bien etiquetado.
- Utilizar técnicas de validación cruzada para evaluar el rendimiento del modelo.
- Evitar el sobreajuste con regularización o utilizando modelos más simples.

####**2. Aprendizaje No Supervisado**
En el aprendizaje no supervisado, el modelo trabaja con datos no etiquetados. El objetivo es encontrar patrones o estructuras ocultas en los datos, como agrupaciones o reducción de dimensionalidad.

**Ejemplo de Agrupamiento (Clustering):**

```python
from sklearn.cluster import KMeans
import numpy as np

# Dataset de ejemplo
X = np.array([[1, 2], [2, 3], [10, 11], [12, 13], [30, 30]])

# Aplicar K-means con 2 clusters
kmeans = KMeans(n_clusters=2)
kmeans.fit(X)

# Etiquetas de los clusters
labels = kmeans.labels_
print(f'Asignación de clusters: {labels}')
```

**Mejores Prácticas:**
- Seleccionar el número adecuado de clusters mediante métodos como el codo o la silueta.
- Estandarizar o normalizar los datos para mejorar el rendimiento de los algoritmos.
- Visualizar los resultados para interpretar mejor los patrones descubiertos.

####**3. Aprendizaje por Refuerzo**
El aprendizaje por refuerzo se basa en un agente que aprende a tomar decisiones mediante prueba y error, recibiendo recompensas o castigos por las acciones que toma. Es común en problemas de toma de decisiones y control.

**Ejemplo Simple de Aprendizaje por Refuerzo (Bandido Multiarmado):**

```python
import numpy as np

# Probabilidades de recompensa para tres máquinas tragamonedas
probabilidades = [0.2, 0.5, 0.75]

# Simular 1000 tiradas
n_tiradas = 1000
recompensas = np.zeros(len(probabilidades))

for i in range(n_tiradas):
    # Seleccionar la máquina con la mayor recompensa acumulada
    maquina = np.argmax(recompensas)
    
    # Generar recompensa basada en la probabilidad de la máquina seleccionada
    recompensa = np.random.rand() < probabilidades[maquina]
    
    # Actualizar la recompensa acumulada
    recompensas[maquina] += recompensa

print(f'Recompensas acumuladas: {recompensas}')
```

**Mejores Prácticas:**
- Definir adecuadamente las recompensas para guiar al agente hacia el comportamiento deseado.
- Explorar diferentes estrategias de balanceo entre exploración y explotación.
- Implementar técnicas de aprendizaje profundo para manejar espacios de estados complejos.

###**Consideraciones Indispensables**
- **Supervisado:** Requiere grandes cantidades de datos etiquetados, lo que puede ser costoso o difícil de obtener.
- **No Supervisado:** Puede ser difícil de evaluar ya que no hay una "respuesta correcta" a la que comparar los resultados.
- **Por Refuerzo:** Es computacionalmente intensivo y requiere una gran cantidad de interacciones con el entorno para aprender de manera efectiva.

##**Ejercicios:**

In [None]:
from google.colab import drive
drive.mount('/content/drive')

file_id = '1GxFpnjaEPauGQ0PRe-YTzjhDaCwd-wTN'
raw_url = f'https://drive.google.com/uc?id={file_id}&export=download'

import pandas as pd
data = pd.read_csv(raw_url)

print(data.head())

df=data.copy()

Mounted at /content/drive
   User_ID Product_ID Gender   Age  Occupation City_Category  \
0  1000001  P00069042      F  0-17          10             A   
1  1000001  P00248942      F  0-17          10             A   
2  1000001  P00087842      F  0-17          10             A   
3  1000001  P00085442      F  0-17          10             A   
4  1000002  P00285442      M   55+          16             C   

  Stay_In_Current_City_Years  Marital_Status  Product_Category_1  \
0                          2               0                   3   
1                          2               0                   1   
2                          2               0                  12   
3                          2               0                  12   
4                         4+               0                   8   

   Product_Category_2  Product_Category_3  Purchase  
0                 NaN                 NaN      8370  
1                 6.0                14.0     15200  
2                 

###**Ejercicio 1: Clasificación Supervisada**
**Objetivo:** Implementar un modelo de clasificación supervisada utilizando un algoritmo simple como K-Nearest Neighbors (KNN).

###**Ejercicio 2: Regresión Supervisada**
Objetivo: Desarrollar un modelo de regresión lineal para predecir la columna Purchase.

###**Ejercicio 3: Clustering No Supervisado**
**Objetivo:** Agrupar los datos utilizando K-Means para identificar patrones ocultos en la compra de productos.

###**Ejercicio 4: Reducción de Dimensionalidad No Supervisada**
**Objetivo:** Aplicar PCA para reducir la dimensionalidad de las variables numéricas.

###**Ejercicio 5: Implementación Básica de Aprendizaje por Refuerzo**
**Objetivo:** Introducir conceptos básicos de aprendizaje por refuerzo con un ejemplo sencillo utilizando Q-Learning en un entorno simulado.

###**Ejercicio 6: Clasificación de Productos con Aprendizaje Supervisado**
**Objetivo:** Clasificar los productos en categorías utilizando un árbol de decisión.

###**Ejercicio 7: Clustering Jerárquico No Supervisado**
**Objetivo:** Aplicar clustering jerárquico para descubrir estructuras jerárquicas en los datos.

###**Ejercicio 8: Evaluación de un Modelo de Clasificación Supervisada**
**Objetivo:** Utilizar matrices de confusión y otros indicadores para evaluar un modelo de clasificación.

###**Ejercicio 9: Normalización de Datos para un Algoritmo de Clustering**
**Objetivo:** Preparar los datos mediante normalización para mejorar el rendimiento de un modelo de clustering.