<a href="https://colab.research.google.com/github/dtoralg/IE_Calidad_ML/blob/main/Ejercicios/Modulo%203/Modulo_3_A_Formulario.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Guía de Modelos de Machine Learning en Control de Calidad

Esta guía proporciona información esencial sobre los modelos de Machine Learning que se utilizan en los ejercicios del Módulo 3.

### Índice
1. [Introducción a los Modelos de Machine Learning](#section1)
2. [Regresión Lineal](#section2)
3. [Regresión Logística](#section3)
4. [Clasificación con k-NN](#section4)
5. [Árboles de Decisión](#section5)
6. [Segmentación con k-Means](#section6)
7. [Reducción de Dimensionalidad con PCA](#section7)
8. [Visualización de Resultados](#section8)
9. [Consideraciones Finales](#section9)


## 1. Introducción a los Modelos de Machine Learning

El Módulo 3 aborda diferentes técnicas de Machine Learning aplicadas a control de calidad industrial. Cada modelo tiene aplicaciones específicas, desde la predicción hasta la clasificación y segmentación.

Los modelos estudiados incluyen:
- **Regresión Lineal** para predicción de valores continuos.
- **Regresión Logística** para clasificación binaria.
- **k-NN (k-Nearest Neighbors)** para clasificación basada en proximidad.
- **Árboles de Decisión** para clasificación estructurada.
- **k-Means Clustering** para segmentación de productos.
- **PCA (Análisis de Componentes Principales)** para reducción de dimensionalidad.

## 2. Regresión Lineal

La regresión lineal es un modelo predictivo que busca la relación entre una variable dependiente y una o más variables independientes.

**Ejemplo de código para entrenar un modelo de Regresión Lineal:**

In [None]:
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
import pandas as pd

# Cargar datos
df = pd.read_csv('ruta/del/dataset.csv')

# Definir variables
X = df[['var1', 'var2']]
y = df['target']

# Dividir datos
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Entrenar modelo
modelo = LinearRegression()
modelo.fit(X_train, y_train)

# Predicción
y_pred = modelo.predict(X_test)

## 3. Regresión Logística

La regresión logística es un modelo utilizado para clasificación binaria.

**Ejemplo de código para entrenar un modelo de Regresión Logística:**

In [None]:
from sklearn.linear_model import LogisticRegression

# Entrenar modelo de Regresión Logística
modelo = LogisticRegression()
modelo.fit(X_train, y_train)

# Predicción
y_pred = modelo.predict(X_test)

## 4. Clasificación con k-Nearest Neighbors (k-NN)

k-NN clasifica nuevos datos en función de la proximidad con los datos de entrenamiento.

**Ejemplo de código para implementar k-NN:**

In [None]:
from sklearn.neighbors import KNeighborsClassifier

# Entrenar modelo k-NN
modelo = KNeighborsClassifier(n_neighbors=5)
modelo.fit(X_train, y_train)

# Predicción
y_pred = modelo.predict(X_test)

## 5. Árboles de Decisión

Los árboles de decisión clasifican los datos dividiéndolos en reglas jerárquicas.

**Ejemplo de código para implementar un Árbol de Decisión:**

In [None]:
from sklearn.tree import DecisionTreeClassifier

# Entrenar modelo de Árbol de Decisión
modelo = DecisionTreeClassifier()
modelo.fit(X_train, y_train)

# Predicción
y_pred = modelo.predict(X_test)

## 6. Segmentación con k-Means

El algoritmo k-Means agrupa los datos en clústeres en función de su similitud.

**Ejemplo de código para aplicar k-Means:**

In [None]:
from sklearn.cluster import KMeans

# Entrenar modelo k-Means
modelo = KMeans(n_clusters=3, random_state=42)
modelo.fit(X_train)

# Asignar clústeres
clusters = modelo.predict(X_test)

## 7. Reducción de Dimensionalidad con PCA

PCA permite reducir la cantidad de variables sin perder información relevante.

**Ejemplo de código para aplicar PCA:**

In [None]:
from sklearn.decomposition import PCA

# Aplicar PCA para reducir a 2 componentes
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_train)

# Ver la varianza explicada
print(pca.explained_variance_ratio_)

## 8. Visualización de Resultados

Los gráficos ayudan a interpretar mejor los resultados de los modelos.

**Ejemplo de código para visualizar resultados:**

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

# Gráfico de dispersión de PCA
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y_train)
plt.xlabel('Componente 1')
plt.ylabel('Componente 2')
plt.title('PCA')
plt.show()