In [1]:
import pandas as pd
import json

def get_tweets(df):
    return df.nlargest(n=10, columns=["retweetCount"])

def get_users(df):
    return df.nlargest(n=10, columns=["statusesCount"])

def get_dates(df):
    df['day'] = df['date'].apply(lambda x: x[:10])
    return df['day'].value_counts()[:10].index.tolist()

def get_hashtags(df):
    # Fuente: https://stackoverflow.com/questions/63228403/count-hashtag-frequency-in-a-dataframe
    return df['content'].str.findall(r'(#\w+)').explode().value_counts()[:10].index.tolist()

def main():
    print("Cargando tweets...")
    with open("farmers-protest-tweets-2021-03-5.json", "r") as file:     
        data = file.readlines()
        data = list(map(json.loads, data))
    df = pd.DataFrame(data)
    print("Cargando usuarios...")
    # Fuente: https://www.kaggle.com/code/prathamsharma123/clean-raw-json-tweets-data
    udf = pd.json_normalize(df['user'])
    udf.drop(['description', 'linkTcourl'], axis=1, inplace=True)
    udf.rename(columns={'id':'userId', 'url':'profileUrl'}, inplace=True)
    udf.drop_duplicates(subset=['userId'], inplace=True)
    print("Datos cargados")
    condicion = True
    while condicion:
        print("Elija una opcion:")
        print("[0] - Obtener el top 10 de tweets más retweeted")
        print("[1] - Obtener el top 10 de usuarios en función a la cantidad de tweets que emitieron")
        print("[2] - Obtener el top 10 días donde hay más tweets")
        print("[3] - Obtener el Top 10 hashtags más usados")
        print("[4] - Salir")
        option = input("Opcion seleccionada: ")
        if option == "0":
            print(get_tweets(df))
        elif option == "1":
            print(get_users(udf))
        elif option == "2":
            print(get_dates(df))
        elif option == "3":
            print(get_hashtags(df))
        elif option == "4":
            print("Adios")
            condicion = False
        else:
            print("Opcion no valida")

if __name__ == "__main__":
    main()

Cargando tweets...
Cargando usuarios...
Datos cargados
Elija una opcion:
[0] - Obtener el top 10 de tweets más retweeted
[1] - Obtener el top 10 de usuarios en función a la cantidad de tweets que emitieron
[2] - Obtener el top 10 días donde hay más tweets
[3] - Obtener el Top 10 hashtags más usados
[4] - Salir
Opcion seleccionada: 3
['#FarmersProtest', '#IStandWithFarmers', '#farmersprotest', '#IndianFarmersHumanRights', '#FarmersAreIndia', '#StandWithFarmers', '#Rihanna', '#FarmersProtests', '#Farmers', '#shameonbollywood']
Elija una opcion:
[0] - Obtener el top 10 de tweets más retweeted
[1] - Obtener el top 10 de usuarios en función a la cantidad de tweets que emitieron
[2] - Obtener el top 10 días donde hay más tweets
[3] - Obtener el Top 10 hashtags más usados
[4] - Salir
Opcion seleccionada: 4
Adios
