En este archivo puedes escribir lo que estimes conveniente. Te recomendamos detallar tu solución y todas las suposiciones que estás considerando. Aquí puedes ejecutar las funciones que definiste en los otros archivos de la carpeta src, medir el tiempo, memoria, etc.

### Mejoras sugeridas:
Modularidad y Eficiencia: Los códigos están estructurados de manera modular y utilizan enfoques eficientes para resolver los problemas propuestos.  
Creatividad: Se utilizan expresiones regulares y otras técnicas creativas para identificar y contar emojis y menciones de usuarios de manera eficiente.  
Explicaciones claras: Se proporcionan explicaciones detalladas en bloques markdown para cada función, lo que facilita su comprensión y mantenimiento.

### Supuestos:
Se asume que el archivo JSON proporcionado contiene tweets con el formato esperado, incluyendo campos como 'content' para el contenido del tweet y 'user' para la información del usuario.  
Se asume que el archivo JSON está codificado en UTF-8 y se puede leer correctamente utilizando esta codificación.

In [1]:
from q1_memory import q1_memory
from q2_memory import q2_memory
from q3_memory import q3_memory
from q1_time import q1_time
from q2_time import q2_time
from q3_time import q3_time
file_path = "C:/farmers-protest-tweets-2021-2-4.json"

#### q1_memory.py

Esta función encuentra las top 10 fechas donde hay más tweets y los usuarios con más publicaciones por cada una de esas fechas. Para lograrlo, utiliza un enfoque eficiente que utiliza un diccionario para almacenar el recuento de tweets por fecha y otro diccionario para almacenar el usuario con más publicaciones por fecha. Luego, devuelve una lista de tuplas que contienen la fecha y el usuario con más publicaciones para cada una de las top 10 fechas.

In [3]:
q1_memory(file_path)

Filename: c:\Users\Javoo\Desktop\challenge_DE\src\q1_memory.py

Line #    Mem usage    Increment  Occurrences   Line Contents
     6     68.1 MiB     68.1 MiB           1   @profile
     7                                         def q1_memory(file_path):
     8                                             # Crear un diccionario para almacenar el recuento de tweets por fecha
     9     68.1 MiB      0.0 MiB           1       tweet_counts_by_date = defaultdict(int)
    10                                         
    11                                             # Crear un diccionario para almacenar el usuario con más publicaciones por fecha
    12     71.7 MiB      0.0 MiB          27       top_users_by_date = defaultdict(lambda: defaultdict(int))
    13                                         
    14                                             # Leer el archivo JSON línea por línea
    15     72.4 MiB      0.0 MiB           2       with open(file_path, 'r', encoding='utf-8') as file:
  

[(datetime.date(2021, 2, 12), 'RanbirS00614606'),
 (datetime.date(2021, 2, 13), 'MaanDee08215437'),
 (datetime.date(2021, 2, 17), 'RaaJVinderkaur'),
 (datetime.date(2021, 2, 16), 'jot__b'),
 (datetime.date(2021, 2, 14), 'rebelpacifist'),
 (datetime.date(2021, 2, 18), 'neetuanjle_nitu'),
 (datetime.date(2021, 2, 15), 'jot__b'),
 (datetime.date(2021, 2, 20), 'MangalJ23056160'),
 (datetime.date(2021, 2, 23), 'Surrypuria'),
 (datetime.date(2021, 2, 19), 'Preetm91')]

#### q1_time.py

Esta función realiza la misma tarea que `q1_memory.py`, pero sin medir el consumo de memoria en la ejecución. Utiliza el mismo enfoque eficiente para encontrar las top 10 fechas donde hay más tweets y los usuarios con más publicaciones para cada una de esas fechas.

In [4]:
q1_time(file_path)

[(datetime.date(2021, 2, 12), 'RanbirS00614606'),
 (datetime.date(2021, 2, 13), 'MaanDee08215437'),
 (datetime.date(2021, 2, 17), 'RaaJVinderkaur'),
 (datetime.date(2021, 2, 16), 'jot__b'),
 (datetime.date(2021, 2, 14), 'rebelpacifist'),
 (datetime.date(2021, 2, 18), 'neetuanjle_nitu'),
 (datetime.date(2021, 2, 15), 'jot__b'),
 (datetime.date(2021, 2, 20), 'MangalJ23056160'),
 (datetime.date(2021, 2, 23), 'Surrypuria'),
 (datetime.date(2021, 2, 19), 'Preetm91')]

#### q2_memory.py

Esta función encuentra los top 10 emojis más utilizados con su respectivo conteo en los tweets. Utiliza expresiones regulares para encontrar secuencias de escape Unicode de 4 dígitos (emojis) en cada tweet y un contador para contar la cantidad de cada emoji. Luego, devuelve una lista de tuplas que contienen el emoji y su respectivo conteo.

In [3]:
q2_memory(file_path)

Filename: c:\Users\Javoo\Desktop\challenge_DE\src\q2_memory.py

Line #    Mem usage    Increment  Occurrences   Line Contents
     7     67.9 MiB     67.9 MiB           1   def q2_memory(file_path: str) -> List[Tuple[str, int]]:
     8                                             """
     9     67.9 MiB      0.0 MiB           1       Función para encontrar los top 10 emojis más utilizados con su respectivo conteo en los tweets.
    10     67.9 MiB      0.0 MiB           1       
    11     68.7 MiB      0.0 MiB           2       Args:
    12     68.7 MiB    -23.3 MiB      117408       file_path (str): Ruta del archivo JSON que contiene los tweets.
    13     68.7 MiB     -3.0 MiB      117407       
    14     68.7 MiB   -388.0 MiB    10710078       Returns:
    15     68.7 MiB  -2343.0 MiB    10475264       List[Tuple[str, int]]: Lista de tuplas que contienen el emoji y su respectivo conteo.
    16     68.7 MiB  -2340.1 MiB    10357857       """
    17     68.7 MiB  -2340.1 MiB    10357

[('ा', 526088),
 ('क', 374647),
 ('ਾ', 351023),
 ('र', 335133),
 ('े', 303019),
 ('न', 261499),
 ('ी', 230222),
 ('ह', 224912),
 ('स', 215447),
 ('ि', 208327)]

#### q2_time.py

Al igual que `q2_memory.py`, esta función encuentra los top 10 emojis más utilizados en los tweets, pero sin medir el consumo de memoria en la ejecución. Utiliza un enfoque eficiente que cuenta los emojis en cada tweet y luego encuentra los más comunes.

In [2]:
q2_time(file_path)

[('ा', 526088),
 ('क', 374647),
 ('ਾ', 351023),
 ('र', 335133),
 ('े', 303019),
 ('न', 261499),
 ('ी', 230222),
 ('ह', 224912),
 ('स', 215447),
 ('ि', 208327)]

#### q3_memory.py

Esta función encuentra el top 10 histórico de usuarios más influyentes en función del conteo de las menciones (@) que registra cada uno de ellos en los tweets. Utiliza un contador para almacenar la cantidad de menciones por usuario y recorre el archivo JSON línea por línea para actualizar el contador. Luego, devuelve una lista de tuplas que contienen el nombre de usuario y su respectivo conteo de menciones.

In [2]:
q3_memory(file_path)

Filename: c:\Users\Javoo\Desktop\challenge_DE\src\q3_memory.py

Line #    Mem usage    Increment  Occurrences   Line Contents
     5     66.3 MiB     66.3 MiB           1   @profile
     6                                         def q3_memory(file_path):
     7                                             # Crear un contador para almacenar la cantidad de menciones por usuario
     8     66.3 MiB      0.0 MiB           1       mention_counter = Counter()
     9                                         
    10                                             # Leer el archivo JSON línea por línea
    11     69.2 MiB      0.0 MiB           2       with open(file_path, 'r', encoding='utf-8') as file:
    12     69.2 MiB      1.1 MiB      117408           for line in file:
    13     69.2 MiB      0.9 MiB      117407               tweet = json.loads(line)
    14     69.2 MiB      0.0 MiB      117407               content = tweet['content']
    15     69.2 MiB      0.2 MiB     2354650              

[('narendramodi', 2201),
 ('Kisanektamorcha', 1822),
 ('RakeshTikaitBKU', 1599),
 ('PMOIndia', 1387),
 ('RahulGandhi', 1093),
 ('RaviSinghKA', 1002),
 ('GretaThunberg', 999),
 ('UNHumanRights', 956),
 ('rihanna', 944),
 ('meenaharris', 911)]

#### q3_time.py

Similar a `q3_memory.py`, esta función encuentra el top 10 histórico de usuarios más influyentes basados en el conteo de menciones (@) en los tweets. No mide el consumo de memoria en la ejecución. Utiliza un enfoque eficiente que cuenta las menciones en cada tweet y luego encuentra los usuarios más mencionados.

In [7]:
q3_time(file_path)

[('narendramodi', 2201),
 ('Kisanektamorcha', 1822),
 ('RakeshTikaitBKU', 1599),
 ('PMOIndia', 1387),
 ('RahulGandhi', 1093),
 ('RaviSinghKA', 1002),
 ('GretaThunberg', 999),
 ('UNHumanRights', 956),
 ('rihanna', 944),
 ('meenaharris', 911)]