En este archivo puedes escribir lo que estimes conveniente. Te recomendamos detallar tu solución y todas las suposiciones que estás considerando. Aquí puedes ejecutar las funciones que definiste en los otros archivos de la carpeta src, medir el tiempo, memoria, etc.

In [1]:
from rich import print

file_path = "../farmers-protest-tweets-2021-2-4.json"

He decidido medir el tiempo y la memoria en ambos ejecicios de optimizacion. esto me ha permitido visualizar el trade-off que estoy ejerciendo por una metodologia u otra.

En casos generales he observado que si me enfoco en optimizar el tiempo aumenta el consumo de memoria y en el caso contrario si me enfoco en reducir el consumo de memoria aumenta el tiempo de procesamiento.

Algunas consideraciones generales que he tenido en cuenta:

### Justificación de DuckDB para optimización por tiempo
- **Procesamiento en memoria**: DuckDB opera en memoria (OLAP) y acelera consultas por el tipo de procesamiento.
- **SQL optimizado**: Ejecuta consultas con optimizaciones automáticas.
- **Formatos directos**: Lee/Analiza archivos (CSV, Parquet, JSON) sin ingestión previa, reduciendo pasos intermedios.
- **Escalabilidad vertical**: Aprovecha todos los núcleos del CPU para operaciones paralelas.
- **Caché automático**: Almacena resultados intermedios para reutilización en consultas recurrentes.


### Justificación de estructuras nativas y librerías para optimización por memoria
- **Generadores de Python**: Procesan datos en flujo (yield), cargando solo lo necesario en memoria.
- **defaultdict**: Reduce memoria al evitar verificaciones de clave existente.
- **Counter**: Optimiza conteos frecuentes con hash tables internas, minimizando uso de memoria frente a alternativas manuales.
- **ujson**: Serializa/deserializa JSON más rápido que json estándar. Esta escrito en C.

------

DuckDB prioriza velocidad, mientras que las estructuras nativas y generadores sacrifican velocidad por un perfil de memoria ajustado.

En el caso de la medicion de memoria a fondo con profile he decidido no utilizarlo para no mostrar en los logs ese analisis, pero se puede ir por este lado utilizando el decorador `@profile` importandolo con `from memory_profiler import profile`

# Q1

## Time

In [2]:
from q1_time import q1_time

In [3]:
# Ejecutar la función
resultados = q1_time(file_path)

# Mostrar resultados
print("\nRESULTADOS TIEMPO:")
print(resultados)

> Nota: Al utilizar jupyter notebook para ejecutar estos scripts he visto que el uso de tiempo y memoria puede verse afectado. Es interesante lanzar el script de manera individual sin levantar el kernel de jupyter notebook.

Resultado al ejecutar el script por fuera del notebook:

```sh

           📊 Métricas de Tiempo            
┏━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┓
┃ Fase                   ┃        Duración ┃
┡━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━┩
│ Conexión y preparación │ 2.0970 segundos │
│ Lectura del archivo    │ 2.1014 segundos │
│ Análisis y consulta    │ 0.0391 segundos │
│ TOTAL                  │ 6.3936 segundos │
└────────────────────────┴─────────────────┘
       💾 Métricas de Memoria (MB)        
┏━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━┳━━━━━━━━━┓
┃ Fase                ┃  Valor ┃       Δ ┃
┡━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━╇━━━━━━━━━┩
│ Memoria base        │  56.13 │         │
│ Después de conexión │  63.22 │   +7.09 │
│ Después de lectura  │ 554.29 │ +491.07 │
│ Después de consulta │ 557.23 │   +2.94 │
│ Consumo máximo      │ 557.23 │         │
└─────────────────────┴────────┴─────────┘

```

## Memory

In [4]:
from q1_memory import q1_memory


In [5]:
resultados = q1_memory(file_path)

print("\nRESULTADOS MEMORIA:")
print(resultados)

> Como dije arriba, ejecutar este script por fuera del notebook mejora significativamente el uso de memoria

```sh

📊 Métricas de Tiempo            
┏━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┓
┃ Fase                   ┃        Duración ┃
┡━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━┩
│ Conexión y preparación │ 1.0399 segundos │
│ Lectura del archivo    │ 5.2299 segundos │
│ Análisis y consulta    │ 0.0082 segundos │
│ TOTAL                  │ 7.3152 segundos │
└────────────────────────┴─────────────────┘
      💾 Métricas de Memoria (MB)       
┏━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━┳━━━━━━━━┓
┃ Fase                ┃ Valor ┃      Δ ┃
┡━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━╇━━━━━━━━┩
│ Memoria base        │ 51.57 │        │
│ Después de conexión │  0.00 │ -51.57 │
│ Después de lectura  │ 57.25 │ +57.25 │
│ Después de consulta │ 57.26 │  +0.01 │
│ Consumo máximo      │ 57.26 │        │
└─────────────────────┴───────┴────────┘

```

# Q2

## Time

## Memory

# Q3

## Time

## Memory