# Desafío LATAM Airlines para Ingenieros de Datos

Se resuelve el primer requerimiento con  función ```q1``` que servirá de línea base para luego hacer las optimizaciones por tiempo de ejecucción y uso de memoria: 

> Requerimiento: Obtener las top 10 fechas donde hay más tweets. Mencionar el usuario (username) que más publicaciones tiene por cada uno de esos días.

In [None]:
#!pip install -r requirements.txt

### q1 (Linea Base)

La función definida en q1.py crea dos diccionarios diferentes que se utilizan para obtener el conteo de tweets por fecha y luego el conteo de tweets por username por cada fecha.

In [2]:
%load_ext memory_profiler

from src.q1 import q1
from memory_profiler import profile

file_path = "./data/farmers-protest-tweets-2021-2-4-2.json"

In [2]:
q1(file_path)

[(datetime.date(2021, 2, 12), 'RanbirS00614606'),
 (datetime.date(2021, 2, 13), 'MaanDee08215437'),
 (datetime.date(2021, 2, 17), 'RaaJVinderkaur'),
 (datetime.date(2021, 2, 16), 'jot__b'),
 (datetime.date(2021, 2, 14), 'rebelpacifist'),
 (datetime.date(2021, 2, 18), 'neetuanjle_nitu'),
 (datetime.date(2021, 2, 15), 'jot__b'),
 (datetime.date(2021, 2, 20), 'MangalJ23056160'),
 (datetime.date(2021, 2, 23), 'Surrypuria'),
 (datetime.date(2021, 2, 19), 'Preetm91')]

In [9]:
%timeit q1(file_path)

2.84 s ± 113 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [4]:
%memit q1(file_path)

peak memory: 73.86 MiB, increment: 2.05 MiB


### q1_time (Optimización del tiempo de ejecución)

Optimiza el tiempo de ejecución usando Counter que está hecho en C y están precisamente diseñados para este tipo de tareas.

In [1]:
from src.q1_time import q1_time

In [3]:
q1_time(file_path)

[(datetime.date(2021, 2, 12), 'RanbirS00614606'),
 (datetime.date(2021, 2, 13), 'MaanDee08215437'),
 (datetime.date(2021, 2, 17), 'RaaJVinderkaur'),
 (datetime.date(2021, 2, 16), 'jot__b'),
 (datetime.date(2021, 2, 14), 'rebelpacifist'),
 (datetime.date(2021, 2, 18), 'neetuanjle_nitu'),
 (datetime.date(2021, 2, 15), 'jot__b'),
 (datetime.date(2021, 2, 20), 'MangalJ23056160'),
 (datetime.date(2021, 2, 23), 'Surrypuria'),
 (datetime.date(2021, 2, 19), 'Preetm91')]

In [4]:
%timeit q1_time(file_path)

2.85 s ± 69.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [5]:
%memit q1_time(file_path)

peak memory: 69.16 MiB, increment: 6.98 MiB
