# üè• Salud y Farmac√©utico: calidad, trazabilidad, acceso
KPIs: readmisi√≥n, tiempos de espera, abastecimiento, adherencia.

## Casos de uso
- Integraci√≥n HL7/FHIR, interoperabilidad
- Optimizaci√≥n de camas y urgencias
- Farmacovigilancia y cadenas de fr√≠o
- Modelos de propensi√≥n a adherencia y abandono

In [1]:
# C√°lculo simple de tiempos promedio en urgencias
import statistics as st
esperas = [15, 20, 45, 30, 25]
st.mean(esperas), st.median(esperas)

(27, 25)

## Arquitectura
- Conectores FHIR/HL7, limpieza y seudonimizaci√≥n
- Lakehouse con privacidad diferencial en research
- APIs para trazabilidad y dashboards cl√≠nicos

## üíº Valor para el negocio en Salud
- Menos readmisiones y tiempos de espera ‚Üí mejor calidad y costo por paciente.
- Abastecimiento √≥ptimo de f√°rmacos e insumos ‚Üí menos quiebres y mermas.
- Cadena de fr√≠o y trazabilidad ‚Üí cumplimiento y confianza.


In [2]:
# Pr√°ctica: tiempos de espera antes y despu√©s (toy)
import statistics as st
espera_base = [15, 20, 45, 30, 25, 35, 40]
espera_mejora = [12, 18, 32, 24, 22, 28, 30]
print('Promedio base:', round(st.mean(espera_base),1), 'min')
print('Promedio mejorado:', round(st.mean(espera_mejora),1), 'min')
print('Reducci√≥n %:', round(100*(st.mean(espera_base)-st.mean(espera_mejora))/st.mean(espera_base),1))


Promedio base: 30 min
Promedio mejorado: 23.7 min
Reducci√≥n %: 21.0


## üèóÔ∏è Arquitectura y privacidad
- Ingesta HL7/FHIR con limpieza y seudonimizaci√≥n.
- Lakehouse con zonas de acceso y privacidad diferencial en research.
- APIs para trazabilidad (cadenas de fr√≠o) e interoperabilidad.


In [3]:
# Visual: comparaci√≥n de esperas (toy)
import plotly.express as px
import pandas as pd
vis = pd.DataFrame({
    'grupo':['base']*len(espera_base)+['mejora']*len(espera_mejora),
    'minutos':espera_base+espera_mejora
})
fig = px.box(vis, x='grupo', y='minutos', title='Tiempos de espera: base vs mejora')
fig.show()


## ‚úÖ Checklist de estrategia de negocio y datos
- Objetivo salud (calidad, acceso, costo por paciente): ‚Ä¶
- KPIs: readmisi√≥n, espera, abastecimiento, adherencia.
- Palancas: interoperabilidad HL7/FHIR, trazabilidad, anal√≠tica operativa.
- Datos: cl√≠nicos/operativos; seudonimizaci√≥n y minimizaci√≥n PII.
- Gobierno: dominios, contratos, privacidad diferencial.
- SLOs: latencia tableros, disponibilidad, costo.
- ROI/supuestos: ‚Ä¶
- Riesgos: regulatorios, seguridad, sesgos.


## üîó Puente Estrategia ‚Üî Ingenier√≠a de Datos
- OKR: Tiempo de espera -20%, readmisi√≥n -10% ‚Üí KPI negocio: espera, readmisi√≥n ‚Üí KPI datos: interoperabilidad (FHIR), calidad y privacidad ‚Üí Capacidades: ingesta HL7/FHIR + DQ + seudonimizaci√≥n ‚Üí Decisi√≥n: asignaci√≥n de recursos y protocolos ‚Üí Impacto: costo por paciente‚Üì.

```
[Registros cl√≠nicos]‚Üí[FHIR/HL7]‚Üí[Calidad+Privacidad]‚Üí[M√©tricas espera]‚Üí[Umbral]‚Üí[Asignaci√≥n de recursos]‚Üí[Œî costo]
```


In [4]:
# contrato_de_datos (salud)
contrato_datos = {
    "objetivo_negocio": "Tiempo de espera -20%",
    "kpi_negocio": "Minutos de espera",
    "kpi_datos": {"interoperabilidad": "FHIR OK", "privacidad": "PII tokenizada"},
    "dataset": ["citas", "urgencias", "insumos"],
    "propietario": "Dominio Cl√≠nico",
    "slo": {"freshness_min": "<=15"},
    "decision": "Asignaci√≥n de personal y camas",
    "impacto_economico_usd": 120000,
}
print(contrato_datos)


{'objetivo_negocio': 'Tiempo de espera -20%', 'kpi_negocio': 'Minutos de espera', 'kpi_datos': {'interoperabilidad': 'FHIR OK', 'privacidad': 'PII tokenizada'}, 'dataset': ['citas', 'urgencias', 'insumos'], 'propietario': 'Dominio Cl√≠nico', 'slo': {'freshness_min': '<=15'}, 'decision': 'Asignaci√≥n de personal y camas', 'impacto_economico_usd': 120000}


## üìã Caso de uso: Optimizaci√≥n de urgencias con datos interoperables

**Contexto de negocio:** Un hospital tiene tiempos de espera promedio de 45 min en urgencias, con picos de 2h. Objetivo: reducir a <30 min para mejorar NPS y evitar sanciones regulatorias.

**Problema sin ingenier√≠a de datos:**
- Sistemas de citas, urgencias y camas desconectados.
- Registros cl√≠nicos en formatos propietarios (no FHIR).
- Planificaci√≥n de personal basada en hist√≥ricos de hace 6 meses.

**Soluci√≥n con ingenier√≠a de datos:**
1. Ingesta HL7/FHIR: normalizaci√≥n de registros de citas, urgencias, camas e insumos.
2. Pipeline de calidad: validaci√≥n de PII, seudonimizaci√≥n autom√°tica.
3. Modelo de predicci√≥n de demanda: forecasting de llegadas por hora/d√≠a con features de estacionalidad.
4. Dashboard en tiempo real: ocupaci√≥n de camas, personal disponible, pacientes en espera.
5. Privacidad diferencial en datasets de investigaci√≥n.

**Resultado:**
- Tiempo de espera: 45 min ‚Üí 28 min promedio.
- Ocupaci√≥n de camas: visible en tiempo real vs. lag de 4h.
- Cumplimiento regulatorio: auditores pueden validar privacidad con linaje completo.
- Ahorro anual: $800k (mejor uso de recursos + menos sanciones).


In [5]:
# Ejercicio: pipeline de calidad con seudonimizaci√≥n
import pandas as pd
import hashlib

# Simular registros cl√≠nicos con PII
pacientes = pd.DataFrame({
    'dni': ['12345678', '87654321', '11223344'],
    'nombre': ['Juan P√©rez', 'Ana Garc√≠a', 'Carlos L√≥pez'],
    'diagnostico': ['Hipertensi√≥n', 'Diabetes', 'Asma'],
    'espera_min': [35, 50, 20],
})

# Seudonimizaci√≥n (protecci√≥n de privacidad)
def seudonimizar(texto):
    return hashlib.sha256(texto.encode()).hexdigest()[:16]

pacientes_anonimo = pacientes.copy()
pacientes_anonimo['dni'] = pacientes_anonimo['dni'].apply(seudonimizar)
pacientes_anonimo['nombre'] = pacientes_anonimo['nombre'].apply(seudonimizar)

print("Datos originales (NO publicables):")
print(pacientes.head())
print("\nDatos seudonimizados (aptos para analytics):")
print(pacientes_anonimo.head())
print(f"\n‚úÖ Tiempo de espera promedio: {pacientes_anonimo['espera_min'].mean():.1f} min")
print("üí° Lineage rastrea que estos datos vienen de registros protegidos")


Datos originales (NO publicables):
        dni        nombre   diagnostico  espera_min
0  12345678    Juan P√©rez  Hipertensi√≥n          35
1  87654321    Ana Garc√≠a      Diabetes          50
2  11223344  Carlos L√≥pez          Asma          20

Datos seudonimizados (aptos para analytics):
                dni            nombre   diagnostico  espera_min
0  ef797c8118f02dfb  090fd624fefeeda8  Hipertensi√≥n          35
1  e24df920078c3dd4  a18fbef32bea8e51      Diabetes          50
2  4f9f10b304cfe9b2  fc377fa3a02cad5b          Asma          20

‚úÖ Tiempo de espera promedio: 35.0 min
üí° Lineage rastrea que estos datos vienen de registros protegidos


---

## üß≠ Navegaci√≥n

**‚Üê Anterior:** [üí≥ Finanzas y Banca: riesgo, fraude, rentabilidad](03_finanzas_banca.ipynb)

**Siguiente ‚Üí:** [‚ö° Energ√≠a y Recursos Naturales: continuidad, costos y seguridad ‚Üí](05_energia_recursos_naturales.ipynb)

**üìö √çndice de Negocio LATAM:**
- [üéØ Estrategia de Datos en LATAM: de la visi√≥n al ROI](01_estrategia_datos_latam.ipynb)
- [üõí Retail y Consumo Masivo: demanda, surtido y p√©rdidas](02_retail_consumo_masivo.ipynb)
- [üí≥ Finanzas y Banca: riesgo, fraude, rentabilidad](03_finanzas_banca.ipynb)
- [üè• Salud y Farmac√©utico: calidad, trazabilidad, acceso](04_salud_farmaceutico.ipynb) ‚Üê üîµ Est√°s aqu√≠
- [‚ö° Energ√≠a y Recursos Naturales: continuidad, costos y seguridad](05_energia_recursos_naturales.ipynb)
- [üì∂ Telecomunicaciones: churn, ARPU y calidad de red](06_telecomunicaciones.ipynb)
- [üè≠ Industria y Manufactura: OEE, calidad y throughput](07_industria_manufactura.ipynb)
- [üöö Log√≠stica y Transporte: costo por entrega, SLA, ocupaci√≥n](08_logistica_transporte.ipynb)
- [üåæ Agro y Alimentos: rendimiento, calidad y trazabilidad](09_agro_alimentos.ipynb)
- [üèõÔ∏è Sector P√∫blico y Gobierno: transparencia, servicio y eficiencia](10_sector_publico_gobierno.ipynb)

**üéì Otros Niveles:**
- [Nivel Junior](../nivel_junior/README.md)
- [Nivel Mid](../nivel_mid/README.md)
- [Nivel Senior](../nivel_senior/README.md)
- [Nivel GenAI](../nivel_genai/README.md)
- [Negocio LATAM](../negocios_latam/README.md)
