## Ejercicio 4

### **Teoría**
#### **Defina y responda:**


 **3. Considere un escenario con 1M de agentes con:**

 **a. Versión homogénea:** 3 rasgos (idénticos para todos los agentes)

**b. Versión heterogénea**: 5 rasgos únicos por agente

**c. Responda:**

Calcule y compare los requisitos de memoria para ambas versiones.
- Los cálculos se realizaron asumiendo que cada rasgo se almacena como un valor de punto flotante de 64 bits (8 bytes).
    - **Versión homogénea:** Como los 3 rasgos son idénticos para todos los agentes, solo se almacenarán una vez. Es por eso que la memoria total será de $3 \text{ rasgos } * 8 \text{ bytes } = 24$. **24 bytes** es extremadamente eficiente, ya que no hay duplicación y los agentes simplemente se referencian los valores compartidos.

    - **Versión heterogénea:** En este caso, los rasgos son únicos por cada agente. Por lo que la memoria total para los **1M** de agentes sería de $10^6 \text{ agentes } * 5 \text{ rasgos } * 8 \text{ bytes } = \bold{40,000,000} \text{ bytes (40 MB)}$

    - **Comparación:** la versión heterogénea requiere demasiada memoria comparada a la homogénea (**40 MB** vs **24 bytes**). Esto se debe a la duplicación por agente en la heterogénea, lo que puede llevar a problemas al momento de escadas en simulaciones grandes.

Identifique qué rasgos de los agentes podrían simplificarse de forma segura para mejorar el rendimiento sin perder dinámicas críticas.
- Para mejorar el rendimiento de los agentes se podría ser discretizar las variables **contínuas** como la `Edad`, `Movilidad`, `Inmunidad`.

<br>

**4. Dadas las curvas resultante de dos simulaciones que se muestran abajo, considere que cada una de estas:**

**a. Resultado A:** Muestra eventos de superpropagación claros (modelado discreto de tiempo)
- Los picos se dan precisamente en intervalos semanales.
- No hay infecciones reportadas entre los días **6-7** o **13-14**
- Distribución de rasgos del agente:
    1. Edad – Discreta - [0-17, 18-65, 65+]
    2. Movilidad – Continua - 0.1–5.0 (Contactos diarios)

**b. Resultado B:** Muestra patrones de transmisión uniformes (Modelo de tiempo continuo)
-  Los picos se producen a intervalos irregulares (días 3.2, 8.7 y 14.1).
- Transmisión de bajo nivel entre brotes importantes.
- Distribución de rasgos del agente
    1. Edad – Continua – **0-100 años**
    2. Inmunidad – Continua – **0.0-1.0 score de protección**

**c. Reponda:**
- Para el resultado A:
    1. ¿Por qué los intervalos perfectos de 7 días sugieren un modelado de tiempo discreto?
        - En un modelo discreto, las actualizaciones de estado ocurren en pasos fijos, sincronizando eventos artificialmente. Esto produce picos exactos en múltiplos de 7, ya que las transmisiones se van a ir acumulando y resolviendo solo al final de cada paso, en lugar de fluir continuamente.
    2. ¿Cómo podría esto distorsionar la dinámica de transmisión en el mundo real?
        - En el mundo real las transmisiones ocurren en tiempo contínuo, que además son influenciadas por eventos aleatorios y asincrónicos. El tiempo discreto podría exagerar picos sincronizados, como hacer que todos los contagios esperan a ser curados hasta el fin de semana, subestimar propagación gradual y ocultar variabilidad entre la semana, todo esto llevaría a tener predicciones inexactas sin reflejar brotes reales constantes.
- Para el resultado B:
    1. ¿Qué evidencia indica un procesamiento continuo?
    - Se puede decir que los eventos ocurrieron en tiempo real gracias a los picos irregulares como en días decimales (3.2, 8.7, 14.1), además de la transmisión de bajo nivel entre ellos. Estos cambios permiten actualizaciones asincrónicas y acumulaciones no sincronizadas.
    2. ¿Por qué las infecciones entre picos son visibles aquí, pero no en el Resultado A?
- Análisis adicional:
    - El resultado A muestra picos de tamaño idéntico a pesar de las diferentes puntuaciones de movilidad. ¿Es esto realista? ¿Por qué?
    - El resultado B muestra algunos eventos superpropagadores (el pico del día 8.7 es tres veces mayor que otros). ¿Qué rasgo(s) podría(n) explicar esto?
- Proponga:
    1. Una prueba de sensibilidad temporal para el resultado A (p. ej., repetir la ejecución con intervalos de 12 horas frente a 24 horas).
    2. Una prueba de aleatorización de rasgos para el resultado B para aislar los efectos de inmunidad frente a la edad


## **Práctica**

Para esta parte se necesita que analice datos de simulación desconocidos para determinar:
- Si se utiliza modelado temporal discreto o continuo
- ¿Qué rasgos del agente influyeron más en los resultados?
- Cómo validar los hallazgos

Para ello considere lo siguiente:

**Paso 1: Inspección de datos**
Instrucciones:
- Cargue el conjunto de datos proporcionado (esta en el script dado load_data.py) que contiene:
    - timestamps: Matriz de tiempos de observación (enteros o decimales)
    - new_infections: Recuentos de casos diarios/semanales
    - agent_attributes: Tabla con columnas como edad, ocupación y estado de vacunación
- Genere estos gráficos:
    - Gráfico de series temporales: Infecciones vs. tiempo (marque los intervalos de tiempo)
    - Distribución de rasgos: Histogramas de los atributos clave del agente
- Responda:
    - ¿Los recuentos de infecciones se informan a intervalos regulares (por ejemplo, diarios) o irregulares?
    - ¿Observa intervalos sin infecciones entre los períodos de informe?

**Paso 2: Identificación del modelo temporal**
- Análisis del pseudocódigo:

```bash
if timestamps are all integers:
    likely_discrete_time = True
if infection_counts show periodic spikes at fixed intervals:
    evidence_for_discrete_time += 1
if small_infections_occur_between_peaks:
    evidence_for_continous_time += 1
```

- Calcular la diferencia temporal entre picos de infección
- Comprobar si existe transmisión de bajo nivel entre picos
- Responda:
    - ¿Podrían los patrones observados ser artefactos del modelo temporal?

**Paso 3: Análisis del Impacto de Rasgos**
- Agrupar las tasas de infección por:
    - Grupos de edad (0-18, 19-65, 65+)
    - Categorías ocupacionales
    - Estado de vacunación
- Calcule:
    - Tasas de ataque (infecciones/población) por grupo
    - Riesgos relativos entre grupos
- Pseudocódigo:

```bash
for each trait in agent_attributes:
    group_data = infections.groupby(trait).sum()
    plot(group_data / population_per_group)
```

- Responda:
    - ¿Qué rasgo muestra la mayor correlación con el riesgo de infección?
    - ¿Existen efectos de interacción (p. ej., personas mayores + no vacunadas)?

**Paso 4: Pruebas de validación**
- Diseñar pruebas de sensibilidad:
    - Para sospechas en tiempo discreto: Reagregar los datos en diferentes ventanas temporales.
    - Para efectos de rasgos: Mezclar aleatoriamente los rasgos y comparar los resultados.
- Proponer datos reales necesarios para la validación:
    - Informes de casos reales por grupo demográfico.
    - Datos de movilidad de teléfonos móviles.
- Responda:
    - ¿Cómo distinguiría a los verdaderos supercontagiadores de los artefactos de modelado?