🧩 Fase 6 – Visualización de Datos
Usar matplotlib y pandas para mostrar:
    1.	Gráfico de barras: número de pacientes atendidos por servicio.
    2.	Gráfico circular: distribución por sexo.
    3.	Histograma: distribución de edades.
    4.	Reporte tabular: promedio de montos por distrito.

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
from pathlib import Path

# 1️⃣ Definir rutas
data_path = Path.cwd() / "../database/pacientes_clean.csv"
reports_path = Path.cwd() / "../reports"
reports_path.mkdir(parents=True, exist_ok=True)

# 2️⃣ Cargar los datos limpios
df = pd.read_csv(data_path)
print("✅ Datos cargados correctamente:")
print(df.head())

# 3️⃣ Gráfico de barras: número de pacientes por servicio
servicios = df["servicio"].value_counts()
plt.figure(figsize=(10, 6))
servicios.plot(kind="bar", color="skyblue", edgecolor="black")
plt.title("Número de Pacientes Atendidos por Servicio")
plt.xlabel("Servicio")
plt.ylabel("Cantidad de Pacientes")
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.savefig(reports_path / "grafico_pacientes_por_servicio.png", dpi=300)
plt.close()

# 4️⃣ Gráfico circular: distribución por sexo
sexos = df["sexo"].value_counts()
plt.figure(figsize=(6, 6))
sexos.plot(kind="pie", autopct='%1.1f%%', startangle=90,
           colors=["#66b3ff", "#ff9999", "#99ff99"])
plt.title("Distribución de Pacientes por Sexo")
plt.ylabel("")
plt.tight_layout()
plt.savefig(reports_path / "grafico_distribucion_por_sexo.png", dpi=300)
plt.close()

# 5️⃣ Histograma: distribución de edades
plt.figure(figsize=(8, 5))
plt.hist(df["edad"], bins=15, color="lightgreen", edgecolor="black")
plt.title("Distribución de Edades de los Pacientes")
plt.xlabel("Edad")
plt.ylabel("Frecuencia")
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.tight_layout()
plt.savefig(reports_path / "histograma_edades.png", dpi=300)
plt.close()

# 6️⃣ Reporte tabular: promedio de montos por distrito
reporte = df.groupby("distrito")["monto"].mean().reset_index().sort_values(by="monto", ascending=False)
print("\n📋 Promedio de montos por distrito:")
print(reporte)

# Guardar el reporte en la carpeta reports
reporte_file = reports_path / "reporte_promedio_monto_distrito.csv"
reporte.to_csv(reporte_file, index=False, encoding="utf-8")

print("\n💾 Todos los reportes fueron guardados en la carpeta:", reports_path)

✅ Datos cargados correctamente:
  id_paciente          nombre  edad sexo     distrito     servicio  \
0      P00176  Miguel Mendoza  13.0   ND        Surco  Cardiología   
1      P02212      Ana Torres  28.0   ND  Desconocido   Emergencia   
2      P00242     José Flores  41.0    F  Desconocido      Rayos X   
3      P01022  María Castillo  30.0    F   Miraflores   Vacunación   
4      P01961      SIN NOMBRE  73.0    F   San Isidro      Rayos X   

  fecha_atencion   monto  
0     2021-01-27  871.25  
1     2025-09-15  550.05  
2     2024-12-31  463.93  
3     2024-04-13  113.47  
4     2024-07-19  827.46  

📋 Promedio de montos por distrito:
      distrito       monto
4        Lince  538.334420
5   Miraflores  522.667393
7        Surco  519.714780
6   San Isidro  510.717697
1        Comas  501.872663
2  Desconocido  493.293000
3    La Molina  491.596072
0       Callao  479.061513

💾 Todos los reportes fueron guardados en la carpeta: c:\Users\John_\documents\CentroMédico_2025\scripts\.