<a href="https://colab.research.google.com/github/dtoralg/IE_Calidad_ML/blob/main/Ejercicios/Diccionario_ML_Ejemplos_Mejorado.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Diccionario Esencial de Python para Machine Learning
Este cuaderno recopila y explica las instrucciones más comunes necesarias para resolver ejercicios de Ciencia de Datos y Machine Learning con Python.

Está dividido en bloques temáticos:
- A. Carga y exploración de datos
- B. Visualización
- C. Modelos de Machine Learning
- D. Evaluación

Cada sección explica:
- Qué hace cada instrucción
- Cuándo utilizarla
- Ejemplos breves comentados

## A. Cargar y explorar datos

### Leer un archivo CSV
```python
import pandas as pd
df = pd.read_csv("ruta/del/archivo.csv")
```
Se usa al principio para cargar datos desde un archivo externo (CSV, Excel...).


### Ver las primeras filas del dataset
```python
df.head()
```
Permite examinar las primeras filas y entender la estructura de los datos.


### Resumen estadístico de las variables numéricas
```python
df.describe()
```
Calcula la media, desviación, máximo, mínimo y cuartiles.


### Ver nombres de columnas
```python
df.columns
```
Muestra las columnas disponibles en el DataFrame.


### Contar clases o categorías en una columna
```python
df["Fault_Type"].value_counts()
```
Ayuda a identificar si hay clases desbalanceadas en un problema de clasificación.


## B. Visualización

### Histograma de una variable numérica
```python
import seaborn as sns
import matplotlib.pyplot as plt

sns.histplot(df["Temperature"], kde=True)
plt.show()
```
Muestra la distribución de una variable continua (como temperatura o presión).


### Gráfico de barras para una variable categórica
```python
sns.countplot(x="Fault_Type", data=df)
plt.show()
```
Muy útil para ver cuántos ejemplos hay por clase.


### Matriz de confusión
```python
from sklearn.metrics import confusion_matrix
import seaborn as sns

cm = confusion_matrix(y_test, y_pred)
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
plt.xlabel("Predicción")
plt.ylabel("Valor real")
plt.title("Matriz de Confusión")
plt.show()
```
Compara lo que el modelo ha predicho con la realidad, útil para clasificación.


## C. Modelos de Machine Learning

### Crear y entrenar un modelo de Random Forest
```python
from sklearn.ensemble import RandomForestClassifier

model = RandomForestClassifier()
model.fit(X_train, y_train)
```
Modelo robusto para clasificación, especialmente con datos tabulares.


### Crear y entrenar una regresión logística
```python
from sklearn.linear_model import LogisticRegression

model = LogisticRegression(max_iter=1000)
model.fit(X_train, y_train)
```
Modelo lineal básico, útil como punto de partida para clasificación binaria.


### Hacer predicciones
```python
y_pred = model.predict(X_test)
```
Usa el modelo entrenado para hacer predicciones con nuevos datos.


## D. Evaluación del rendimiento del modelo

### Reporte de métricas
```python
from sklearn.metrics import classification_report

print(classification_report(y_test, y_pred))
```
Incluye precisión, recall, F1-score y soporte para cada clase.


### Calcular F1 Macro
```python
from sklearn.metrics import f1_score

f1_score(y_test, y_pred, average='macro')
```
Promedia el F1-score de cada clase por igual, útil con clases desbalanceadas.
