# 🧪 Ejercicios: Inspección y Limpieza de Datos con Pandas
Este notebook contiene ejercicios prácticos para aprender a inspeccionar y limpiar datos usando `pandas`.

## 📥 1. Cargar el dataset
Simulamos un dataset llamado `pacientes.csv`. Puedes copiar este bloque en un archivo `.csv` o usar `io.StringIO` para probar.

In [None]:
import pandas as pd
from io import StringIO

data = '''Nombre,Edad,Comuna,Diagnóstico,Fecha Atencion,Presión
Ana,34,Ñuñoa,Hipertensión,2024-01-10,130
Luis,,Maipú,Hipertensión,2024-01-12,
Claudia,29,Santiago,Diabetes,2024-01-10,110
Pedro,55,Ñuñoa,,2024-01-14,145
Ana,34,Ñuñoa,Hipertensión,2024-01-10,130'''

df = pd.read_csv(StringIO(data))
df

## 🔍 2. Inspección básica del dataset

In [None]:
df.head()  # Ver las primeras filas
df.info()  # Ver estructura
df.shape   # Dimensiones del DataFrame
df.isnull().sum()  # Cantidad de valores nulos por columna
df['Diagnóstico'].unique()  # Valores únicos en diagnóstico

## 🧽 3. Limpieza de datos

In [None]:
# Eliminar duplicados
df = df.drop_duplicates()

# Rellenar edad con promedio
df['Edad'] = df['Edad'].fillna(df['Edad'].mean())

# Rellenar diagnóstico faltante
df['Diagnóstico'] = df['Diagnóstico'].fillna('Sin información')

# Convertir fecha a tipo datetime
df['Fecha Atencion'] = pd.to_datetime(df['Fecha Atencion'])

# Crear columna de presión alta
df['Presión Alta'] = df['Presión'].apply(lambda x: 'Sí' if x > 135 else 'No')

df

## 🔎 4. Filtro de registros

In [None]:
# Pacientes con hipertensión y presión > 135
df_filtrado = df[(df['Diagnóstico'] == 'Hipertensión') & (df['Presión'] > 135)]
df_filtrado

## ✅ 5. Desafío final: resumen por comuna

In [None]:
# Promedio de edad y presión por comuna
df.groupby('Comuna')[['Edad', 'Presión']].mean()