In [None]:
from time import time
from zipfile import ZipFile
import os

file_path = "farmers-protest-tweets-2021-2-4.json"
if not os.path.exists(file_path):
    with ZipFile("../tweets/tweets.json.zip", 'r') as zObject:
        zObject.extractall('.')

# Q1 (Top 10 fechas con mas tweets)
A continuacion se presentan los algoritmos para la obtención del top 10 fechas con mas tweets del data set.

**Q1 time: Enfoque en tiempo de ejecución**

Para mejorar el tiempo de ejecución se leen todas las lineas de una vez, pero cabe anotar que no se usa pandas por como esta estructurado el archivo, pues se sabe que emplear esta biblioteca mejoraría el tiempo de ejecución significativamente.

In [None]:
from q1_time import q1_time

#Determinacion del tiempo de ejecución
tiempo_in = time()
print(f"Tiempo de ejecución:, {time() - tiempo_in}")

#Resultado
result = q1_time(file_path)
print("Resultado:", result)

**Q1 memory: Enfoque en tiempo de ejecución**

Para disminuir el uso de memoria al ejecutar el código se emplean diccionarios para contar el numero de tweets por dia y usuario, y se procede con iteraciones linea por linea para encontrar los tweets.

In [None]:
from q1_memory import q1_memory
#Determinacion del tiempo de ejecución
tiempo_in = time()
print(f"Tiempo de ejecución:, {time() - tiempo_in}")

#Resultado (El tiempo de ejecución se obtiene al usar 'memory profiler')
resultado = q1_memory(file_path)
print("Resultado:", resultado)


# Q2 (Top 10 emojis más usados)
A continuacion se presentan los algoritmos para la obtención del top 10 emojis más usados del data set. En ambos casos se usa la biblioteca 'emoji' para buscar los emojis tras analizar el archivo.

**Q2 time: Enfoque en tiempo de ejecución**

Para mejorar el tiempo de ejecución se procede de manera similar que en Q1, se carga todo el archivo de una vez, y luego se analiza en base al contenido del tweet buscando caracteres del tipo emoji.

In [None]:
from q2_time import q2_time

#Determinacion del tiempo de ejecución
tiempo_in = time()
print(f"Tiempo de ejecución:, {time() - tiempo_in}")

#Resultado
result = q2_time(file_path)
print("Resultado:", result)

**Q2 memory: Enfoque en tiempo de ejecución**

Para disminuir el uso de memoria al ejecutar el código se emplea la biblioteca 'collections' y su módulo'Counter', además se itera linea a linea los tweets para este mismo propósito.

In [None]:
from q2_memory import q2_memory
#Determinacion del tiempo de ejecución
tiempo_in = time()
print(f"Tiempo de ejecución:, {time() - tiempo_in}")

#Resultado (El tiempo de ejecución se obtiene al usar 'memory profiler')
resultado = q2_memory(file_path)
print("Resultado:", resultado)

## Q3 (Top 10 histórico de usuarios más influyentes en función del conteo de las menciones)
A continuacion se presentan los algoritmos para la obtención del top 10 histórico de usuarios más influyentes en función del conteo de las menciones, en ambos casos se usaron 'collections' y su módulo 'Counter', asi mismo 'typing' con 'List' y 'Tuple'.

**Q3 time: Enfoque en tiempo de ejecución**

Para mejorar el tiempo de ejecución se hace uso de un 'Counter' para almacenar el numero de apariciones (menciones) de un 'username'. Se itera todo el archivo usando 'json.loads' y se verifica para tweets donde no hayan menciones (NoneType).

In [None]:
from q3_time import q3_time

#Determinacion del tiempo de ejecución
tiempo_in = time()
print(f"Tiempo de ejecución:, {time() - tiempo_in}")

#Resultado
result = q3_time(file_path)
print("Resultado:", result)

**Q3 memory: Enfoque en tiempo de ejecución**

Para disminuir el uso de memoria al ejecutar el código nuevamente se emplea la biblioteca 'collections' y su módulo'Counter', asi tambien 'typing' con 'List' y 'Tuple'. A diferencia de en el quest enfocado en mejorar el tiempo de ejecución, esta vez la lectura será linea por linea.


In [None]:
from q3_memory import q3_memory
#Determinacion del tiempo de ejecución
tiempo_in = time()
print(f"Tiempo de ejecución:, {time() - tiempo_in}")

#Resultado (El tiempo de ejecución se obtiene al usar 'memory profiler')
resultado = q3_memory(file_path)
print("Resultado:", resultado)