# Challenge Latam Airlines

El archivo JSON original aparecía corrupto y el intento de cargar el archivo completo resultaba en un JSONDecodeError, luego de revisarlo esto podía deberse a que correspondían a objetos JSON concatenados sin separarse correctamente, para facilitar el análisis la versión que estaré utilizando recibió la siguiente transformación previamente:

In [None]:
input_file_path = 'farmers-protest-tweets-2021-2-4.json'

with open(input_file_path, 'r', encoding='utf-8') as infile, open(file_path, 'w', encoding='utf-8') as outfile:
    for line in infile:
        try:
            # Intenta cargar cada línea como un objeto JSON
            json_object = json.loads(line)
            # Escribe el objeto JSON en el archivo de salida con una nueva línea
            json.dump(json_object, outfile)
            outfile.write('\n')
        except json.JSONDecodeError:
            # Ignora las líneas que no son JSON válidos
            continue

Desde este punto el archivo farmers-protest-tweets-2021-2-4.json, corresponde al archivo transformado.

## Desarrollo y ejecuciones de las funciones

In [1]:
file_path = "farmers-protest-tweets-2021-2-4.json"

In [2]:
import time
import pandas as pd
import json
import os
import re
import memory_profiler

from memory_profiler import memory_usage
from q1_time import q1_time
from q1_memory import q1_memory
from q2_time import q2_time
from q2_memory import q2_memory
from q3_time import q3_time
from q3_memory import q3_memory

### q1_time - Medir tiempo de ejecución y uso de memoria para q1_time

In [3]:
# Medir tiempo de ejecución y uso de memoria para q1_time
start_time = time.time()
result_q1_time = q1_time(file_path)
end_time = time.time()

print(f"Tiempo de ejecución de q1_time: {end_time - start_time} segundos")
mem_usage_q1_time = memory_usage((q1_time, (file_path,)))
print(f"Uso de memoria de q1_time: {max(mem_usage_q1_time)} MB")

# Resultados de la función
print("Resultados de q1_time:")
print(result_q1_time)

Tiempo de ejecución de q1_time: 28.1361083984375 segundos
Uso de memoria de q1_time: 1324.6015625 MB
Resultados de q1_time:
[('2021-02-12', 'RanbirS00614606'), ('2021-02-13', 'MaanDee08215437'), ('2021-02-17', 'RaaJVinderkaur'), ('2021-02-16', 'jot__b'), ('2021-02-14', 'rebelpacifist'), ('2021-02-18', 'neetuanjle_nitu'), ('2021-02-15', 'jot__b'), ('2021-02-20', 'MangalJ23056160'), ('2021-02-23', 'Surrypuria'), ('2021-02-19', 'Preetm91')]


### q1_memory - Medir tiempo de ejecución y uso de memoria para q1_memory


In [4]:
# Medir tiempo de ejecución y uso de memoria para q1_memory
start_time = time.time()
result_q1_memory = q1_memory(file_path)
end_time = time.time()
print(f"Tiempo de ejecución de q1_memory: {end_time - start_time} segundos")
mem_usage_q1_memory = memory_usage((q1_memory, (file_path,)))
print(f"Uso de memoria de q1_memory: {max(mem_usage_q1_memory)} MB")

# Resultados de la función
print("Resultados de q1_memory:")
print(result_q1_memory)

Tiempo de ejecución de q1_memory: 6.572534561157227 segundos
Uso de memoria de q1_memory: 486.59375 MB
Resultados de q1_memory:
[('2021-02-12', 'RanbirS00614606'), ('2021-02-13', 'MaanDee08215437'), ('2021-02-17', 'RaaJVinderkaur'), ('2021-02-16', 'jot__b'), ('2021-02-14', 'rebelpacifist'), ('2021-02-18', 'neetuanjle_nitu'), ('2021-02-15', 'jot__b'), ('2021-02-20', 'MangalJ23056160'), ('2021-02-23', 'Surrypuria'), ('2021-02-19', 'Preetm91')]


### q2_time - Medir tiempo de ejecución y uso de memoria para q2_time

In [5]:
# Medir tiempo de ejecución y uso de memoria para q2_time
start_time = time.time()
result_q2_time = q2_time(file_path)
end_time = time.time()
print(f"Tiempo de ejecución de q2_time: {end_time - start_time} segundos")
mem_usage_q2_time = memory_usage((q2_time, (file_path,)))
print(f"Uso de memoria de q2_time: {max(mem_usage_q2_time)} MB")


# Resultados de la función
print("Resultados de q2_time:")
print(result_q2_time)

Tiempo de ejecución de q2_time: 7.5109851360321045 segundos
Uso de memoria de q2_time: 3083.63671875 MB
Resultados de q2_time:
[('🙏', 2166), ('🌾', 596), ('💚', 532), ('😂', 491), ('👍', 470), ('👉', 450), ('🙏🙏', 413), ('👇', 376), ('🚜', 341), ('🙏🏽', 327)]


### q2_memory - Medir tiempo de ejecución y uso de memoria para q2_memory

In [6]:
# Medir tiempo de ejecución y uso de memoria para q2_memory
start_time = time.time()
result_q2_memory = q2_memory(file_path)
end_time = time.time()
print(f"Tiempo de ejecución de q2_memory: {end_time - start_time} segundos")
mem_usage_q2_memory = memory_usage((q2_memory, (file_path,)))
print(f"Uso de memoria de q2_memory: {max(mem_usage_q2_memory)} MB")

# Resultados de la función
print("Resultados de q2_memory:")
print(result_q2_memory)

Tiempo de ejecución de q2_memory: 6.5001983642578125 segundos
Uso de memoria de q2_memory: 493.87109375 MB
Resultados de q2_memory:
[('🙏', 2166), ('🌾', 596), ('💚', 532), ('😂', 491), ('👍', 470), ('👉', 450), ('🙏🙏', 413), ('👇', 376), ('🚜', 341), ('🙏🏽', 327)]


### q3_time - Medir tiempo de ejecución y uso de memoria para q3_time

In [7]:
# Medir tiempo de ejecución y uso de memoria para q3_time
start_time = time.time()
result_q3_time = q3_time(file_path)
end_time = time.time()
print(f"Tiempo de ejecución de q3_time: {end_time - start_time} segundos")
mem_usage_q3_time = memory_usage((q3_time, (file_path,)))
print(f"Uso de memoria de q3_time: {max(mem_usage_q3_time)} MB")

# Resultados de la función
print("Resultados de q3_time:")
print(result_q3_time)

Tiempo de ejecución de q3_time: 6.9319586753845215 segundos
Uso de memoria de q3_time: 3066.4765625 MB
Resultados de q3_time:
[('@narendramodi', 2261), ('@Kisanektamorcha', 1836), ('@RakeshTikaitBKU', 1639), ('@PMOIndia', 1422), ('@RahulGandhi', 1125), ('@GretaThunberg', 1046), ('@RaviSinghKA', 1015), ('@rihanna', 972), ('@UNHumanRights', 962), ('@meenaharris', 925)]


### q3_memory - Medir tiempo de ejecución y uso de memoria para q3_memory

In [3]:
# Medir tiempo de ejecución y uso de memoria para q3_memory
start_time = time.time()
result_q3_memory = q3_memory(file_path)
end_time = time.time()
print(f"Tiempo de ejecución de q3_memory: {end_time - start_time} segundos")
mem_usage_q3_memory = memory_usage((q3_memory, (file_path,)))
print(f"Uso de memoria de q3_memory: {max(mem_usage_q3_memory)} MB")

# Resultados de la función
print("Resultados de q3_memory:")
print(result_q3_memory)

Tiempo de ejecución de q3_memory: 6.537315845489502 segundos
Uso de memoria de q3_memory: 485.921875 MB
Resultados de q3_memory:
[('@narendramodi', 2261), ('@Kisanektamorcha', 1836), ('@RakeshTikaitBKU', 1639), ('@PMOIndia', 1422), ('@RahulGandhi', 1125), ('@GretaThunberg', 1046), ('@RaviSinghKA', 1015), ('@rihanna', 972), ('@UNHumanRights', 962), ('@meenaharris', 925)]
