# Clase 01: Introducción al Machine Learning

## Notebook de Ejemplo

Este notebook muestra la estructura básica de un análisis de ML.

## 1. Importar librerías

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configuración de visualización
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('husl')

# Configuración de pandas
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)

# Para reproducibilidad
np.random.seed(42)

## 2. Cargar datos

In [None]:
from sklearn.datasets import load_iris

# Cargar dataset Iris
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target
df['species'] = df['target'].map({0: 'setosa', 1: 'versicolor', 2: 'virginica'})

print(f"Shape del dataset: {df.shape}")
df.head()

## 3. Análisis Exploratorio de Datos (EDA)

In [None]:
# Información general
print("Información del dataset:")
df.info()

print("\nEstadísticas descriptivas:")
df.describe()

In [None]:
# Distribución de clases
print("Distribución de especies:")
print(df['species'].value_counts())

# Visualización
plt.figure(figsize=(8, 5))
df['species'].value_counts().plot(kind='bar')
plt.title('Distribución de Especies en Iris Dataset')
plt.xlabel('Especie')
plt.ylabel('Cantidad')
plt.xticks(rotation=0)
plt.show()

## 4. Visualización de Features

In [None]:
# Pairplot
sns.pairplot(df, hue='species', diag_kind='kde')
plt.suptitle('Pairplot del Dataset Iris', y=1.02)
plt.show()

## 5. Preparación de Datos

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Separar features y target
X = df.drop(['target', 'species'], axis=1)
y = df['target']

# Split train/test
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

print(f"Train set: {X_train.shape}")
print(f"Test set: {X_test.shape}")

# Escalar features
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

print("\nDatos escalados exitosamente")

## 6. Modelo Simple

In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report

# Entrenar modelo
model = LogisticRegression(random_state=42)
model.fit(X_train_scaled, y_train)

# Predicciones
y_pred = model.predict(X_test_scaled)

# Evaluación
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy:.4f}")
print("\nClassification Report:")
print(classification_report(y_test, y_pred, target_names=iris.target_names))

## 7. Conclusiones

En este notebook vimos:
- Carga de datos
- Análisis exploratorio
- Visualización
- Preparación de datos
- Entrenamiento y evaluación de un modelo simple

### Próximos pasos
- Probar otros algoritmos
- Optimizar hiperparámetros
- Realizar feature engineering
- Validación cruzada