# üìù Ejercicios: Introducci√≥n a Machine Learning

**M√≥dulo 1: Machine Learning with Python**

---

## üéØ Objetivos

Estos ejercicios te ayudar√°n a consolidar lo aprendido sobre:
- NumPy y operaciones con arrays
- Pandas y manipulaci√≥n de datos
- Visualizaci√≥n con Matplotlib
- Primer modelo de Machine Learning

---

## üìã Instrucciones

1. Lee cuidadosamente cada ejercicio
2. Escribe tu c√≥digo en las celdas proporcionadas
3. Ejecuta y verifica tus resultados
4. Si te atascas, revisa el notebook de pr√°ctica guiada
5. **¬°No veas las soluciones hasta haberlo intentado!**

---

## ‚öôÔ∏è Configuraci√≥n Inicial

In [None]:
# Importar bibliotecas necesarias
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Configuraci√≥n de visualizaci√≥n
%matplotlib inline
plt.style.use('seaborn-v0_8-darkgrid')
plt.rcParams['figure.figsize'] = (10, 6)

# Semilla para reproducibilidad
np.random.seed(42)

print("‚úÖ Bibliotecas importadas correctamente")

---

## Ejercicio 1: Operaciones con NumPy (‚≠ê)

### Contexto:
Tienes las ventas mensuales (en miles de d√≥lares) de una tienda durante un a√±o.

### Tareas:
1. Crea un array con las ventas: `[45, 52, 48, 61, 55, 58, 62, 70, 65, 68, 72, 80]`
2. Calcula:
   - Media de ventas
   - Mediana
   - Desviaci√≥n est√°ndar
   - Ventas m√≠nimas y m√°ximas
3. Calcula el incremento porcentual del primer al √∫ltimo mes
4. Crea un nuevo array con las ventas normalizadas (restar la media y dividir por la desv. est√°ndar)

In [None]:
# Tu c√≥digo aqu√≠


---

## Ejercicio 2: An√°lisis de Datos con Pandas (‚≠ê‚≠ê)

### Contexto:
Tienes datos de estudiantes con sus calificaciones en diferentes materias.

### Datos:

In [None]:
# Ejecuta esta celda para crear el DataFrame
datos_estudiantes = {
    'Nombre': ['Ana', 'Luis', 'Carlos', 'Mar√≠a', 'Pedro', 'Laura', 'Jos√©', 'Carmen', 'Miguel', 'Sara'],
    'Matem√°ticas': [85, 78, 92, 88, 76, 95, 82, 90, 84, 91],
    'F√≠sica': [82, 75, 88, 85, 79, 92, 80, 87, 83, 89],
    'Qu√≠mica': [88, 80, 90, 92, 82, 94, 85, 91, 86, 93],
    'Horas_Estudio': [15, 10, 20, 18, 12, 22, 14, 19, 16, 21]
}

df_estudiantes = pd.DataFrame(datos_estudiantes)
print(df_estudiantes)

### Tareas:

1. Calcula el promedio de cada estudiante (promedio de las 3 materias) y agr√©galo como una nueva columna llamada `'Promedio'`
2. Encuentra el estudiante con el mejor promedio
3. Filtra los estudiantes con promedio mayor a 85
4. Calcula la correlaci√≥n entre `Horas_Estudio` y `Promedio`
5. Ordena el DataFrame por `Promedio` de mayor a menor

In [None]:
# Tu c√≥digo aqu√≠ - Tarea 1: Calcular promedio


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 2: Mejor estudiante


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 3: Filtrar estudiantes


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 4: Correlaci√≥n


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 5: Ordenar


---

## Ejercicio 3: Visualizaci√≥n con Matplotlib (‚≠ê‚≠ê)

### Contexto:
Usando el DataFrame de estudiantes del ejercicio anterior.

### Tareas:

1. Crea un **gr√°fico de barras** mostrando el promedio de cada estudiante
2. Crea un **scatter plot** de `Horas_Estudio` vs `Promedio` y agrega una l√≠nea de tendencia
3. Crea un **histograma** de los promedios con 5 bins
4. Crea una figura con 2x2 subplots mostrando:
   - Gr√°fico de barras del promedio
   - Scatter de Horas_Estudio vs Promedio
   - Histograma de promedios
   - Gr√°fico de l√≠nea mostrando las calificaciones de Matem√°ticas de todos los estudiantes

In [None]:
# Tu c√≥digo aqu√≠ - Tarea 1: Gr√°fico de barras


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 2: Scatter plot con tendencia
# Pista: usa np.polyfit() y np.poly1d() para la l√≠nea de tendencia


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 3: Histograma


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 4: Subplots 2x2


---

## Ejercicio 4: Modelo de Machine Learning (‚≠ê‚≠ê‚≠ê)

### Contexto:
Vamos a crear un modelo que prediga las ventas de un producto bas√°ndose en el gasto en publicidad.

### Datos:

In [None]:
# Ejecuta esta celda para generar los datos
np.random.seed(42)

# Gasto en publicidad (miles de d√≥lares)
gasto_publicidad = np.random.uniform(10, 100, 100)

# Ventas = 50 + 3 * publicidad + ruido
ventas = 50 + 3 * gasto_publicidad + np.random.normal(0, 20, 100)

# Crear DataFrame
df_marketing = pd.DataFrame({
    'Gasto_Publicidad': gasto_publicidad,
    'Ventas': ventas
})

print("Dataset de Marketing:")
print(df_marketing.head())
print(f"\nTotal de registros: {len(df_marketing)}")

### Tareas:

1. **Exploraci√≥n**:
   - Calcula estad√≠sticas descriptivas
   - Crea un scatter plot de Gasto_Publicidad vs Ventas
   - Calcula la correlaci√≥n entre ambas variables

2. **Preparaci√≥n de datos**:
   - Separa features (X) y target (y)
   - Divide en train (80%) y test (20%)

3. **Entrenamiento**:
   - Crea un modelo de Regresi√≥n Lineal
   - Entr√©nalo con los datos de entrenamiento
   - Muestra el coeficiente y el intercepto

4. **Evaluaci√≥n**:
   - Haz predicciones en el conjunto de prueba
   - Calcula RMSE y R¬≤
   - Crea un gr√°fico mostrando:
     * Los puntos reales (scatter)
     * La l√≠nea de regresi√≥n

5. **Predicci√≥n**:
   - ¬øCu√°ntas ventas esperar√≠as con un gasto de $50,000 en publicidad?

In [None]:
# Tu c√≥digo aqu√≠ - Tarea 1: Exploraci√≥n


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 2: Preparaci√≥n


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 3: Entrenamiento


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 4: Evaluaci√≥n


In [None]:
# Tu c√≥digo aqu√≠ - Tarea 5: Predicci√≥n


---

## Ejercicio 5: Proyecto Mini - An√°lisis de Temperatura (‚≠ê‚≠ê‚≠ê)

### Contexto:
Tienes datos de temperatura de una ciudad durante varios d√≠as y quieres analizar patrones.

### Datos:

In [None]:
# Ejecuta esta celda para generar los datos
np.random.seed(42)

# 90 d√≠as de datos
dias = np.arange(1, 91)

# Temperatura con tendencia estacional (simulando primavera)
temperatura_base = 15 + 0.2 * dias  # Incremento gradual
variacion_diaria = 5 * np.sin(dias * 2 * np.pi / 7)  # Variaci√≥n semanal
ruido = np.random.normal(0, 2, 90)
temperatura = temperatura_base + variacion_diaria + ruido

df_temperatura = pd.DataFrame({
    'Dia': dias,
    'Temperatura_C': temperatura
})

print("Dataset de Temperatura:")
print(df_temperatura.head(10))

### Tareas:

**Parte 1: An√°lisis Exploratorio**
1. Calcula:
   - Temperatura media, m√≠nima y m√°xima
   - Desviaci√≥n est√°ndar
2. Crea un gr√°fico de l√≠nea mostrando la temperatura a lo largo del tiempo
3. Agrega una l√≠nea horizontal para la temperatura media

**Parte 2: An√°lisis Estad√≠stico**
1. Crea una columna `'Semana'` agrupando cada 7 d√≠as
2. Calcula la temperatura promedio por semana
3. Crea un gr√°fico de barras con el promedio semanal

**Parte 3: Predicci√≥n**
1. Entrena un modelo de regresi√≥n lineal para predecir temperatura bas√°ndose en el d√≠a
2. Eval√∫a el modelo (RMSE y R¬≤)
3. Predice la temperatura para los d√≠as 91, 92, 93, 94, 95
4. Crea un gr√°fico mostrando:
   - Datos hist√≥ricos (puntos azules)
   - Predicciones (puntos rojos)
   - L√≠nea de tendencia

**Parte 4: Insights**
1. ¬øLa temperatura est√° aumentando o disminuyendo?
2. ¬øQu√© tan confiable es el modelo para predicciones futuras?
3. ¬øQu√© limitaciones tiene este modelo?

In [None]:
# Parte 1: An√°lisis Exploratorio


In [None]:
# Parte 2: An√°lisis Estad√≠stico


In [None]:
# Parte 3: Predicci√≥n


**Parte 4: Responde aqu√≠ tus insights:**

1. Tendencia de temperatura:
   - [Tu respuesta aqu√≠]

2. Confiabilidad del modelo:
   - [Tu respuesta aqu√≠]

3. Limitaciones:
   - [Tu respuesta aqu√≠]

---

## üéØ Autoevaluaci√≥n

Antes de ver las soluciones, verifica:

### Ejercicio 1: NumPy
- [ ] Calcul√© correctamente todas las estad√≠sticas
- [ ] Entiendo qu√© es la normalizaci√≥n
- [ ] Puedo explicar el incremento porcentual

### Ejercicio 2: Pandas
- [ ] Cre√© la columna de promedio correctamente
- [ ] Puedo filtrar datos con condiciones
- [ ] Entiendo qu√© significa la correlaci√≥n

### Ejercicio 3: Visualizaci√≥n
- [ ] Mis gr√°ficos tienen t√≠tulos y etiquetas
- [ ] Puedo crear diferentes tipos de gr√°ficos
- [ ] Entiendo cu√°ndo usar cada tipo

### Ejercicio 4: ML Modelo Simple
- [ ] Divid√≠ correctamente train/test
- [ ] Entren√© y evalu√© el modelo
- [ ] Puedo interpretar RMSE y R¬≤

### Ejercicio 5: Proyecto
- [ ] Complet√© todas las partes
- [ ] Mis gr√°ficos son informativos
- [ ] Puedo explicar las limitaciones

---

## üöÄ Pr√≥ximos Pasos

1. **Si completaste todo**: ¬°Excelente! Revisa las soluciones para ver enfoques alternativos
2. **Si te atascaste**: Est√° bien, revisa el material te√≥rico y la pr√°ctica guiada
3. **Si quieres m√°s**: Intenta modificar los ejercicios con tus propios datos

---

## üí° Tips Finales

- üìä La visualizaci√≥n es clave: siempre grafica tus datos
- üîç Explora antes de modelar: entiende tus datos primero
- üß™ Experimenta: cambia par√°metros y observa
- üìñ Lee errores con calma: Python te dice qu√© est√° mal
- üí™ La pr√°ctica hace al maestro: ¬°sigue practicando!

---

**¬°Mucha suerte con los ejercicios! üéì**