En este archivo puedes escribir lo que estimes conveniente. Te recomendamos detallar tu solución y todas las suposiciones que estás considerando. Aquí puedes ejecutar las funciones que definiste en los otros archivos de la carpeta src, medir el tiempo, memoria, etc.

In [None]:
from typing import List, Tuple
from datetime import datetime
from collections import defaultdict, Counter
import json
import emoji

In [2]:
file_path = "farmers-protest-tweets-2021-2-4.json"

In [3]:
# This function will read the json file, iterate each line to get date and username and finally find the 
def q1_memory(file_path: str) -> List[Tuple[datetime.date, str]]:
    # Leer el archivo JSON
    with open(file_path, 'r') as file:
        tweets = json.load(file)

    # Crear un diccionario para almacenar los tweets por fecha
    tweets_by_date = defaultdict(list)

    # Recorrer los tweets para agruparlos por fecha
    for tweet in tweets:
        tweet_date = datetime.strptime(tweet["date"], "%Y-%m-%dT%H:%M:%S+00:00").date()
        tweets_by_date[tweet_date].append(tweet)

    # Ordenar las fechas por la cantidad de tweets en orden descendente
    sorted_dates = sorted(tweets_by_date.items(), key=lambda x: len(x[1]), reverse=True)
    
    # Tomar las primeras 10 fechas
    top_10_dates = sorted_dates[:10]
    
    # Obtener el usuario con más publicaciones para cada una de las fechas
    result = []
    for date, tweets in top_10_dates:
        top_user = max(tweets, key=lambda x: x["user"]["statusesCount"])["user"]["username"]
        result.append((date, top_user))
    
    return result

In [4]:
def q1_time(file_path: str) -> List[Tuple[datetime.date, str]]:
    # Diccionario para almacenar tweets agrupados por fecha
    tweets_by_date = {}
    
    # Abrir el archivo JSON de tweets
    with open(file_path, 'r', encoding='utf-8') as file:
        # Leer cada línea del archivo
        for line in file:
            # Parsear los datos JSON de la línea
            tweet_data = json.loads(line)
            
            # Extraer la fecha del tweet y convertirla a formato de fecha
            tweet_date = datetime.strptime(tweet_data['date'], '%Y-%m-%dT%H:%M:%S+00:00').date()
            
            # Extraer el nombre de usuario del tweet
            username = tweet_data['user']['username']
            
            # Agregar el nombre de usuario al diccionario tweets_by_date, agrupado por fecha
            if tweet_date in tweets_by_date:
                tweets_by_date[tweet_date].append(username)
            else:
                tweets_by_date[tweet_date] = [username]
    
    # Seleccionar las 10 fechas con más tweets
    top_dates = sorted(tweets_by_date.keys(), key=lambda x: len(tweets_by_date[x]), reverse=True)[:10]
    
    # Crear una lista de tuplas con las fechas y los usuarios más activos para cada fecha
    result = [(date, max(tweets_by_date[date], key=tweets_by_date[date].count)) for date in top_dates]
    
    # Retornar el resultado
    return result

In [None]:
def q2_memory(file_path: str) -> List[Tuple[str, int]]:
    # Diccionario para almacenar el conteo de emojis
    emoji_counts = {}
    
    # Abrir el archivo JSON de tweets
    with open(file_path, 'r', encoding='utf-8') as file:
        # Leer cada línea del archivo
        for line in file:
            # Parsear los datos JSON de la línea
            tweet_data = json.loads(line)
            
            # Extraer el contenido del tweet
            content = tweet_data['content']
            
            # Contar el uso de emojis en el contenido del tweet y actualizar el conteo
            for char in content:
                if char in emoji.UNICODE_EMOJI['en']:
                    if char in emoji_counts:
                        emoji_counts[char] += 1
                    else:
                        emoji_counts[char] = 1
    
    # Seleccionar los top 10 emojis más utilizados
    top_emojis = sorted(emoji_counts.items(), key=lambda x: x[1], reverse=True)[:10]
    
    # Retornar el resultado
    return top_emojis

In [None]:
def q2_time(file_path: str) -> List[Tuple[str, int]]:
    # Diccionario para almacenar el conteo de emojis
    emoji_counts = Counter()
    
    # Abrir el archivo JSON de tweets
    with open(file_path, 'r', encoding='utf-8') as file:
        # Leer cada línea del archivo
        for line in file:
            # Parsear los datos JSON de la línea
            tweet_data = json.loads(line)
            
            # Extraer el contenido del tweet
            content = tweet_data['content']
            
            # Contar el uso de emojis en el contenido del tweet y actualizar el conteo
            emojis = [char for char in content if char in emoji.UNICODE_EMOJI['en']]
            emoji_counts.update(emojis)
    
    # Seleccionar los top 10 emojis más utilizados
    top_emojis = emoji_counts.most_common(10)
    
    # Retornar el resultado
    return top_emojis

In [None]:
def q3_memory(file_path: str) -> List[Tuple[str, int]]:
    # Diccionario para almacenar el conteo de menciones para cada usuario
    mention_counts = {}
    
    # Abrir el archivo JSON de tweets
    with open(file_path, 'r', encoding='utf-8') as file:
        # Leer cada línea del archivo
        for line in file:
            # Parsear los datos JSON de la línea
            tweet_data = json.loads(line)
            
            # Extraer el nombre de usuario del tweet
            username = tweet_data['user']['username']
            
            # Contar el número de menciones (@) en el contenido del tweet
            mention_count = tweet_data['content'].count('@')
            
            # Actualizar el conteo de menciones para el usuario en el diccionario
            if username in mention_counts:
                mention_counts[username] += mention_count
            else:
                mention_counts[username] = mention_count
    
    # Seleccionar los top 10 usuarios más influyentes basados en el conteo de menciones
    top_users = sorted(mention_counts.items(), key=lambda x: x[1], reverse=True)[:10]
    
    # Retornar el resultado
    return top_users

In [None]:
def q3_time(file_path: str) -> List[Tuple[str, int]]:
    # Diccionario para almacenar el conteo de menciones para cada usuario
    mention_counts = Counter()
    
    # Abrir el archivo JSON de tweets
    with open(file_path, 'r', encoding='utf-8') as file:
        # Leer cada línea del archivo
        for line in file:
            # Parsear los datos JSON de la línea
            tweet_data = json.loads(line)
            
            # Extraer el nombre de usuario del tweet
            username = tweet_data['user']['username']
            
            # Contar el número de menciones (@) en el contenido del tweet y actualizar el conteo
            mention_count = tweet_data['content'].count('@')
            mention_counts[username] += mention_count
    
    # Seleccionar los top 10 usuarios más influyentes basados en el conteo de menciones
    top_users = mention_counts.most_common(10)
    
    # Retornar el resultado
    return top_users