# Latam Challenge

### Suposiciones

- Se pueden realizar las funciones auxiliares que se deseen, siempre y cuando se mantenga el nombre de la función original en cada archivo.

## Ejercicios

In [17]:
import cProfile
import pstats

from q1_time import q1_time
from q1_memory import q1_memory

from q2_time import q2_time
from q2_memory import q2_memory

from q3_time import q3_time
from q3_memory import q3_memory

%load_ext memory_profiler

file_path = "farmers-protest-tweets-2021-2-4.json"

The memory_profiler extension is already loaded. To reload it, use:
  %reload_ext memory_profiler


### Q1 Time

Se recorre el archivo extrayendo las fechas y los usernames a memoria. 

Se pasan a un dataframe de pandas y se calculan las métricas utilizando el poder de paralelización de pandas al aplicar funciones al conjunto de los datos.

Se recorre el archivo una única vez llevando a memoria solo la data requerida.


Posibles mejoras:
- Splittear el archivo y paralelizar la lectura y procesamiento. Se considera overkill en esta instancia.

#### Execution

In [18]:
q1_time(file_path)

[(datetime.date(2021, 2, 12), 'RanbirS00614606'),
 (datetime.date(2021, 2, 13), 'MaanDee08215437'),
 (datetime.date(2021, 2, 17), 'RaaJVinderkaur'),
 (datetime.date(2021, 2, 16), 'jot__b'),
 (datetime.date(2021, 2, 14), 'rebelpacifist'),
 (datetime.date(2021, 2, 18), 'neetuanjle_nitu'),
 (datetime.date(2021, 2, 15), 'jot__b'),
 (datetime.date(2021, 2, 20), 'MangalJ23056160'),
 (datetime.date(2021, 2, 23), 'Surrypuria'),
 (datetime.date(2021, 2, 19), 'Preetm91')]

#### Memory

In [19]:
%memit q1_time(file_path)

peak memory: 163.58 MiB, increment: 5.67 MiB


#### Performance Profile Stats

In [20]:
# Uncomment the following lines to check time usage
# Warning: It will create files in the current directory

# cProfile.run('q1_time(file_path)', filename='q1_time.prof')
# p = pstats.Stats('q1_time.prof')
# p.sort_stats('time').print_stats(10)

#### Q1 Memory

Se recorre el archivo extrayendo las ocurrencias para cada fecha.

Se filtran las 10 fechas con más ocurrencias.

Se itera una vez por cada fecha el archivo para obtener los tweets de cada usuario en dicha fecha.

El objetivo es sólo usar la mínima memoria indispensable (tweets de cada usuario para una determinada fecha).

Se realiza a costa de recorrer varias veces el archivo.


#### Execution

In [21]:
q1_memory(file_path)

[(datetime.date(2021, 2, 12), 'RanbirS00614606'),
 (datetime.date(2021, 2, 13), 'MaanDee08215437'),
 (datetime.date(2021, 2, 17), 'RaaJVinderkaur'),
 (datetime.date(2021, 2, 16), 'jot__b'),
 (datetime.date(2021, 2, 14), 'rebelpacifist'),
 (datetime.date(2021, 2, 18), 'neetuanjle_nitu'),
 (datetime.date(2021, 2, 15), 'jot__b'),
 (datetime.date(2021, 2, 20), 'MangalJ23056160'),
 (datetime.date(2021, 2, 23), 'Surrypuria'),
 (datetime.date(2021, 2, 19), 'Preetm91')]

#### Memory

In [25]:
%memit q1_memory(file_path)

peak memory: 158.11 MiB, increment: 0.00 MiB


#### Performance Profile Stats

In [22]:
# Uncomment the following lines to check memory usage
# Warning: It will create files in the current directory

# cProfile.run('q1_memory(file_path)', filename='q1_memory.prof')
# p = pstats.Stats('q1_memory.prof')
# p.sort_stats('time').print_stats(10)

#### Q2 Time

Se recorre el archivo linea por linea, leyendo el contenido del tweet, extrayendo los emojis y agregando las ocurrencias a un diccionario.
Luego se parsea el diccionario para obtener aquellos con mayores métricas.

#### Execution

In [23]:
q2_time(file_path)

[('🙏', 7286),
 ('😂', 3072),
 ('🚜', 2972),
 ('🌾', 2363),
 ('🇮', 2096),
 ('🇳', 2094),
 ('🏻', 2080),
 ('🤣', 1668),
 ('🏽', 1218),
 ('👇', 1108)]

#### Memory

In [11]:
%memit q2_time(file_path)

peak memory: 152.50 MiB, increment: 0.00 MiB


#### Performance Profile Stats

In [None]:
# Uncomment the following lines to check time usage
# Warning: It will create files in the current directory

# cProfile.run('q2_time(file_path)', filename='q2_time.prof')
# p = pstats.Stats('q2_time.prof')
# p.sort_stats('time').print_stats(10)

#### Q2 Memory

El procedimiento es similar al de Q1 Time con una mínima optimización mediante un iterador/generador para recorrer los emojis.

#### Execution

In [26]:
q2_memory(file_path)

[('🙏', 7286),
 ('😂', 3072),
 ('🚜', 2972),
 ('🌾', 2363),
 ('🇮', 2096),
 ('🇳', 2094),
 ('🏻', 2080),
 ('🤣', 1668),
 ('🏽', 1218),
 ('👇', 1108)]

#### Memory

In [12]:
%memit q2_memory(file_path)

peak memory: 152.50 MiB, increment: 0.00 MiB


#### Performance Profile Stats

In [None]:
# Uncomment the following lines to check memory usage
# Warning: It will create files in the current directory

# cProfile.run('q2_memory(file_path)', filename='q2_memory.prof')
# p = pstats.Stats('q2_memory.prof')
# p.sort_stats('time').print_stats(10)

#### Q3 Time

Del enunciado y entendimiento del ejercicio se interpreta que la dinámica es similar al ejercicio anterior, sólo que en lugar de buscar emojis, se buscan mentions (@).
Se procede de manera similar a Q2 Time.

#### Execution

In [27]:
q3_time(file_path)

[('narendramodi', 2261),
 ('Kisanektamorcha', 1836),
 ('RakeshTikaitBKU', 1639),
 ('PMOIndia', 1422),
 ('RahulGandhi', 1125),
 ('GretaThunberg', 1046),
 ('RaviSinghKA', 1015),
 ('rihanna', 972),
 ('UNHumanRights', 962),
 ('meenaharris', 925)]

#### Memory

In [13]:
%memit q3_time(file_path)

peak memory: 151.58 MiB, increment: 0.00 MiB


#### Performance Profile Stats

In [None]:
# Uncomment the following lines to check time usage
# Warning: It will create files in the current directory

# cProfile.run('q3_time(file_path)', filename='q3_time.prof')
# p = pstats.Stats('q3_time.prof')
# p.sort_stats('time').print_stats(10)

#### Q3 Memory

Del enunciado y entendimiento del ejercicio se interpreta que la dinámica es similar al ejercicio anterior, sólo que en lugar de buscar emojis, se buscan mentions (@).
Se procede de manera similar a Q2 Memory.

#### Execution

In [28]:
q3_memory(file_path)

[('narendramodi', 2261),
 ('Kisanektamorcha', 1836),
 ('RakeshTikaitBKU', 1639),
 ('PMOIndia', 1422),
 ('RahulGandhi', 1125),
 ('GretaThunberg', 1046),
 ('RaviSinghKA', 1015),
 ('rihanna', 972),
 ('UNHumanRights', 962),
 ('meenaharris', 925)]

#### Memory

In [14]:
%memit q3_memory(file_path)

peak memory: 149.74 MiB, increment: 0.00 MiB


#### Performance Profile Stats

In [None]:
# Uncomment the following lines to check memory usage
# Warning: It will create files in the current directory

# cProfile.run('q3_memory(file_path)', filename='q3_memory.prof')
# p = pstats.Stats('q3_memory.prof')
# p.sort_stats('time').print_stats(10)