# MACHINE LEARNING

El Machine Learning (ML) es una rama de la inteligencia artificail que permite a los sistemas aprender automáticamente a partir de los datos, sin ser explícitamente programador para cada tarea. A diferencia de los métodos tradicionales, el ML se basa en extraer patrones y relaciones entre las variables de entrada (*features*) y las de salida (*target*), para luego <b>predecir, clasificar o estimar</b> nuevos valores.

Su objetivo principal es desarrollar modelos que sean capaces de <b>generalizar</b>, es decir, que funcionen bien no solo con los datos de entrenamiento, sino también con datos nuevos y desconocidos.

#### <b>Tipos de aprendizaje en Machine Learning</b>

El Machine Learning se divide en tres grandes tipos de aprendizaje, en función del tipo de datos disponibles y del objetivo del modelo:

1. Aprendizaje supervisado

    * Se dispone de un conjunto de datos con etiquetas conocidas (target).

    * El modelo aprende a predecir una salida a partir de ejemplos ya etiquetados.

    * Ejemplos:

        * Regresión: predecir un valor continuo (precio, temperatura, beneficio).

        * Clasificación: predecir una categoría (fraude/no fraude, sí/no, tipo de cliente).


2. <b>Aprendizaje no supervisado

    * No existen etiquetas conocidas.

    * El modelo busca patrones ocultos o agrupaciones naturales en los datos.

    * Ejemplos:

        * Clustering: agrupar clientes por comportamiento (K-Means, DBSCAN).

        * Reducción de dimensionalidad: simplificar datos (PCA). </b>

3. Aprendizaje por refuerzo

* Un agente aprende por recompensas o penalizaciones, tomando decisiones secuenciales.

* Menos usado en este módulo, más presente en IA avanzada (robótica, juegos, control automático).

## 1. Introducción al Aprendizaje NO supervisado

El aprendizaje no supervisado abarca técnicas curo objetivo es descubir patrones ocultos en los datos sin conocer etiquetas (target).

A direcenia del aprendizaje supervisado, aquí el modelo no predice nada: explora, organizar, resumo o transforma la estructura interna del dataset.

Sus objetivos principales incluyen;

* Reducir dimensionalidad para simplificar los datos manteniendo su información relevante.
* Agrupar observaciones similares (clustering)
* Explorar relaciones, patrones y estructuras no evidentes.
* Preparar features más compactas y útiles para modelos posteriores,

En este módulo veremos dos métodos fundamentales:

1. PCA - Reducción de dimensionalidad
2. K-Means - Clustering

## 2. Reducción de Dimensionalidad: PCA

### 2.1 ¿Qué es PCA?

El Análisis de Componentes Principales (PCA) es una técnica que transforma las variables originales en un nuevo conjunto de variables llamadas componentes principales, que:

* Son combinaciones lineales de las variables originales.

* Están ordenadas según la cantidad de varianza que explican.

* Permiten representar los datos en un espacio reducido, perdiendo la menor información posible.

### 2.2 Objetivos del PCA
* Reducir dimensiones para simplificar modelos y acelerar cálculos.

* Visualizar datos en 2D o 3D.

* Filtrar ruido manteniendo solo la información relevante.

* Eliminar correlaciones entre variables.

* Mejorar modelos supervisados generando features más compactas.

### 2.3 Flujo general del PCA

1. Estándar los datos (si tienen escalas distintas).

2. Ajustar el modelo PCA especificando cuántas componentes queremos.

3. Transformar los datos al nuevo espacio reducido.

4. (Opcional) Reconstruir para evaluar la pérdida de información.

5. Analizar la varianza explicada y elegir el número óptimo de componentes.

### 2.4 Código base para PCA

```python
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

# 1. Seleccionar las variables numéricas
X = df.select_dtypes(include=['int64', 'float64'])

# 2. Estandarizar (recomendado)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 3. Ajustar PCA (ejemplo: 2 componentes)
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)

# 4. DataFrame con componentes principales
df_pca = pd.DataFrame(X_pca, columns=['PC1', 'PC2'])
df_pca.head()
```

### 2.5 Varianza explicada y selección del número de componentes

```python
pca_full = PCA().fit(X_scaled)

var_explicada = pca_full.explained_variance_ratio_
var_acum = pca_full.explained_variance_ratio_.cumsum()

pd.DataFrame({
    'Componente': range(1, len(var_explicada) + 1),
    'Varianza_explicada': var_explicada,
    'Varianza_acumulada': var_acum
})
```

<b>Interpretación:</b>

Elegimos `n_components` donde la varianza acumulada alcance un umbral (por ejemplo, 90% o 95%).

### 2.6 Reconstrucción de los datos (PCA como filtro de ruido)

```python
# Ajustar PCA con más componentes
pca_filter = PCA(n_components=10)
X_reduced = pca_filter.fit_transform(X_scaled)

# Reconstrucción (aproximación del original)
X_reconstructed = pca_filter.inverse_transform(X_reduced)
```

<b>Interpretación:</b>

La reconstrucción pierde detalles de alta frecuencia → permite eliminar ruido.

## 3. Clustering: K-Means

### 3.1 ¿Qué es K-Means?

K-Means es un algoritmo que agrupa los datos en k clústeres según su similaridad.
Funciona encontrando centroides que minimizan la distancia a los puntos asignados a cada grupo.

### 3.2 Objetivos de K-Means

* Descubrir grupos naturales en los datos.

* Analizar comportamiento o estructura interna.

* Segmentar clientes, productos u observaciones similares.

* Crear features adicionales para modelos supervisados (cluster membership).

* Realizar compresión en imágenes o señales.

### 3.3 Flujo general del K-Means

Seleccionar número inicial de clústeres k.

Ajustar el modelo con fit_predict.

Obtener etiquetas de clúster y centroides.

Evaluar mediante inertia o silhouette score.

Analizar resultados (segmentación, interpretación de grupos).

### 3.4 Código base de K-Means

```python
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler

# 1. Seleccionar variables numéricas
X = df.select_dtypes(include=['int64', 'float64'])

# 2. Escalado (importante para clustering)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 3. Ajustar modelo K-Means
kmeans = KMeans(n_clusters=3, random_state=42)
labels = kmeans.fit_predict(X_scaled)

# 4. Añadir los clusters al DataFrame original
df['cluster'] = labels
df.head()
```

### 3.5 Determinar el valor óptimo de k (Elbow Method)

```python
inertias = []
Ks = range(2, 11)

for k in Ks:
    km = KMeans(n_clusters=k, random_state=42).fit(X_scaled)
    inertias.append(km.inertia_)

pd.DataFrame({
    'k': Ks,
    'inercia': inertias
})
```

<b>Interpretación:</b>

Buscamos el “codo”, donde la reducción de inercia empieza a ser marginal.


### 3.6 Evaluación del clustering (Silhouette Score)

```python
from sklearn.metrics import silhouette_score

score = silhouette_score(X_scaled, labels)
print("Silhouette Score:", score)
```
<b>Interpretación:</b>
* Valores cercanos a 1 → clústeres bien separados.
* Valores cercanos a 0 → clústeres muy mezclados.
* Valores negativos → asignación incorrecta.

### 3.7 Centroides del modelo

```python
centroides = kmeans.cluster_centers_
centroides_df = pd.DataFrame(centroides, columns=X.columns)
centroides_df
```

<b>Interpretación:</b>

Cada centroide representa el “perfil medio” de ese clúster.

## 4. Integración PCA + K-Means

En datasets con muchas variables:

* Primero PCA → reduce dimensionalidad y elimina ruido.
* Después K-Means → agrupa mejor al trabajar en un espacio más limpio.

Flujo genérico combinado

```python
# 1. Variables numéricas
X = df.select_dtypes(include=['int64', 'float64'])

# 2. Escalado
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 3. PCA (elegir número de componentes)
pca = PCA(n_components=5)
X_pca = pca.fit_transform(X_scaled)

# 4. K-Means sobre el espacio reducido
kmeans = KMeans(n_clusters=3, random_state=42)
labels = kmeans.fit_predict(X_pca)

df['cluster'] = labels
```

<b> Ventajas: </b>
* Menor ruido.
* Clústeres más estables.
* Menor coste computacional.