# 🧪 Solución del ejercicio: Análisis de Medicamentos en el Hospital

In [None]:
import pandas as pd
from datetime import datetime

df = pd.read_csv('datos_medicamentos.csv')

## 🧼 Paso 2: Limpieza

In [None]:
df.drop_duplicates(inplace=True)
df['fecha_inicio'] = pd.to_datetime(df['fecha_inicio'])
df['fecha_fin'] = pd.to_datetime(df['fecha_fin'])
df['fecha_fin'].fillna(pd.Timestamp.today().normalize(), inplace=True)
df = df[df['dosis_mg'].notna() & (df['dosis_mg'] > 0)]

## 📊 Paso 3: Análisis general

In [None]:
print('Tratamientos únicos:', len(df))
print('Pacientes únicos:', df['paciente_id'].nunique())
print('Top 5 medicamentos:')
print(df['nombre_medicamento'].value_counts().head(5))
print('Unidades con más pacientes:')
print(df.groupby('unidad')['paciente_id'].nunique().sort_values(ascending=False))

## 🧠 Paso 4: Cálculo de métricas clínicas

In [None]:
df['duracion_dias'] = (df['fecha_fin'] - df['fecha_inicio']).dt.days
df['dosis_total_mg'] = df['dosis_mg'] * df['frecuencia_dia'] * df['duracion_dias']
print('Dosis promedio por medicamento:')
print(df.groupby('nombre_medicamento')['dosis_total_mg'].mean())
print('Paciente con mayor dosis total acumulada:')
print(df.groupby('paciente_id')['dosis_total_mg'].sum().idxmax())

## 🛠️ Paso 5: Resolución de problemas

In [None]:
print('Unidad con mayor consumo total de medicamentos (mg):')
print(df.groupby('unidad')['dosis_total_mg'].sum().sort_values(ascending=False))
print('Medicamento con mayor variabilidad en duración:')
print(df.groupby('nombre_medicamento')['duracion_dias'].std().sort_values(ascending=False).head(1))
print('Tratamientos con duración mayor a 90 días:')
print(df[df['duracion_dias'] > 90])