En este archivo puedes escribir lo que estimes conveniente. Te recomendamos detallar tu solución y todas las suposiciones que estás considerando. Aquí puedes ejecutar las funciones que definiste en los otros archivos de la carpeta src, medir el tiempo, memoria, etc.

In [1]:
file_path = "farmers-protest-tweets-2021-2-4.json"

In [2]:
from memory_profiler import memory_usage
from q1_memory import q1_memory
from q1_time import q1_time
from q2_memory import q2_memory
from q2_time import q2_time
from q3_memory import q3_memory
from q3_time import q3_time

In [3]:
# Ejecuta una función y retorna el máximo de MB de memoria usada y el valor de retorno de la función.
def profile_function(func, *args, **kwargs):
    mem_usage, return_value = memory_usage((func, args, kwargs), retval=True, max_usage=True)
    return mem_usage, return_value

> Notas

- Se usan rangos específicos para la búsqueda de emoji (ver código de q2)
- Se asumen los tags a usuarios de twitter como un @ seguido de hasta 15 caracteres alfanuméricos y underscore (_)
- Para las comparaciones de tiempos de ejecución se usan solamente los tiempos de ejecución de las celdas del Jupyter Notebook


## Top 10 de fechas con más tweets y usuario con más tweets

### Eficiencia: Memoria

La función q1_memory optimiza el uso de memoria leyendo el json elemento por elemento, no carga todo el archivo en memoria.

Algoritmo:

1. Lee el elemento del diccionario y si es una fecha nueva la agrega a un nuevo diccionario de fechas asignandole el valor 1 al conteo, si la fecha ya existe en el diccionario de fechas aumenta su valor en 1.
2. Por cada fecha encontrada, se almacena un diccionario anidado con los usuarios y su conteo.
3. Se ordena el listado de fechas segun la cantidad de tweets y se obtiene el top 10.
4. Se ordena el listado de usuarios para cada fecha y se obtiene el usuario con más tweets.

In [4]:
max_mem, result = profile_function(q1_memory, file_path)
print(f"Maximo memoria: {max_mem} MiB")
print(f"Top 10 fechas y usuarios: {result}")

Maximo memoria: 76.3203125 MiB
Top 10 fechas y usuarios: [(datetime.date(2021, 2, 12), 'RanbirS00614606'), (datetime.date(2021, 2, 13), 'MaanDee08215437'), (datetime.date(2021, 2, 17), 'RaaJVinderkaur'), (datetime.date(2021, 2, 16), 'jot__b'), (datetime.date(2021, 2, 14), 'rebelpacifist'), (datetime.date(2021, 2, 18), 'neetuanjle_nitu'), (datetime.date(2021, 2, 15), 'jot__b'), (datetime.date(2021, 2, 20), 'MangalJ23056160'), (datetime.date(2021, 2, 23), 'Surrypuria'), (datetime.date(2021, 2, 19), 'Preetm91')]


### Eficiencia: Tiempo

La función q1_time optimiza el tiempo de ejecución quitando operaciones como la verificación de claves en los diccionarios y el conteo se realiza en un solo lazo.

Algoritmo:

1. Lee el elemento del diccionario y usa default_dcit para guardar la fecha y los usuarios.
2. Por cada fecha encontrada, se almacena un diccionario anidado con los usuarios y su conteo.
3. Se ordena el listado de fechas segun la cantidad de tweets y se obtiene el top 10.
4. Se ordena el listado de usuarios para cada fecha y se obtiene el usuario con más tweets.

In [5]:
max_mem, result = profile_function(q1_time, file_path)
print(f"Maximo memoria: {max_mem} MiB")
print(f"Top 10 fechas y usuarios: {result}")

Maximo memoria: 76.51171875 MiB
Top 10 fechas y usuarios: [(datetime.date(2021, 2, 12), 'RanbirS00614606'), (datetime.date(2021, 2, 13), 'MaanDee08215437'), (datetime.date(2021, 2, 17), 'RaaJVinderkaur'), (datetime.date(2021, 2, 16), 'jot__b'), (datetime.date(2021, 2, 14), 'rebelpacifist'), (datetime.date(2021, 2, 18), 'neetuanjle_nitu'), (datetime.date(2021, 2, 15), 'jot__b'), (datetime.date(2021, 2, 20), 'MangalJ23056160'), (datetime.date(2021, 2, 23), 'Surrypuria'), (datetime.date(2021, 2, 19), 'Preetm91')]


## Top 10 de emojis más usados

La función q2_memory optimiza el uso de memoria leyendo el json elemento por elemento, no carga todo el archivo en memoria.

Algoritmo:

1. Lee el elemento del diccionario y compara los caracteres del string de contenido comparando con rangos de caracteres de emojis.
2. Se almacenan los conteos en un diccionario que usa el emoji como llave
3. Se ordena el diccionario resultante y se extrae el top 10.

### Eficiencia: Memoria

In [6]:
max_mem, result = profile_function(q2_memory, file_path)
print(f"Maximo memoria: {max_mem} MiB")
print(f"Top 10 emojis más usados: {result}")

Maximo memoria: 75.43359375 MiB
Top 10 emojis más usados: [('🙏', 7286), ('😂', 3072), ('🚜', 2972), ('✊', 2411), ('🌾', 2363), ('🏻', 2080), ('❤', 1779), ('🏽', 1218), ('👇', 1108), ('💚', 1040)]


### Eficiencia: Tiempo

La función q2_time optimiza el tiempo de ejecucuón usando la librería Counter y usando una expresión regular para capturar los emojis en el string de contenido.

Algoritmo:

1. Lee el elemento del diccionario y compara los caracteres del string de contenido comparando con rangos de caracteres de emojis.
2. Se almacenan los conteos en un diccionario que usa el emoji como llave
3. Se ordena el diccionario resultante y se extrae el top 10.

In [7]:
max_mem, result = profile_function(q2_time, file_path)
print(f"Maximo memoria: {max_mem} MiB")
print(f"Top 10 emojis más usados: {result}")

Maximo memoria: 73.515625 MiB
Top 10 emojis más usados: [('🙏', 7286), ('😂', 3072), ('🚜', 2972), ('✊', 2411), ('🌾', 2363), ('🏻', 2080), ('❤', 1779), ('🏽', 1218), ('👇', 1108), ('💚', 1040)]


## Top 10 de usuarios más influyentes

### Eficiencia: Memoria

La función q3_memory optimiza el uso de memoria leyendo el json elemento por elemento.

Algoritmo:

1. Lee el elemento del diccionario y compara con el formato de un tag de nombre de usuario de twitter.
2. Se almacenan los conteos en un diccionario que usa el usuario como llave
3. Se ordena el diccionario resultante y se extrae el top 10.

In [8]:
max_mem, result = profile_function(q3_memory, file_path)
print(f"Maximo memoria: {max_mem} MiB")
print(f"Top 10 usuarios más influyentes: {result}")

Maximo memoria: 74.98828125 MiB
Top 10 usuarios más influyentes: [('@narendramodi', 2261), ('@Kisanektamorcha', 1836), ('@RakeshTikaitBKU', 1641), ('@PMOIndia', 1422), ('@RahulGandhi', 1125), ('@GretaThunberg', 1046), ('@RaviSinghKA', 1015), ('@rihanna', 972), ('@UNHumanRights', 962), ('@meenaharris', 925)]


### Eficiencia: Tiempo

La función q3_time optimiza el uso de tiempo usando la librería Counter y sus funciones incluídas para optimiza el conteo y el ordenamiento para extraer el top 10.

Algoritmo:

1. Lee el elemento del diccionario y compara con el formato de un tag de nombre de usuario de twitter.
2. Se almacenan los conteos en un diccionario que usa el usuario como llave
3. Se ordena el diccionario resultante y se extrae el top 10.

In [9]:
max_mem, result = profile_function(q3_time, file_path)
print(f"Maximo memoria: {max_mem} MiB")
print(f"Top 10 usuarios más influyentes: {result}")

Maximo memoria: 75.0546875 MiB
Top 10 usuarios más influyentes: [('@narendramodi', 2261), ('@Kisanektamorcha', 1836), ('@RakeshTikaitBKU', 1641), ('@PMOIndia', 1422), ('@RahulGandhi', 1125), ('@GretaThunberg', 1046), ('@RaviSinghKA', 1015), ('@rihanna', 972), ('@UNHumanRights', 962), ('@meenaharris', 925)]
