# 1. Import libraries

In [38]:
import csv 
import pandas as pd
import ast
import re
import glob
import os

# 2. Declaring vars and functions

In [39]:
def string_to_dict(string):
    if isinstance(string, dict):
        return string
    try:
        return ast.literal_eval(string)
    except:
        return ast.literal_eval(string.replace('"','\\"'))
        
def record_nodes(user):
    if user[0] not in nodes:
        nodes[user[0]] = user
    elif (user[3] > nodes[user[0]][3]):
        nodes[user[0]] = user
    return user[0]
          
def extract_source(tweet, quoted=False):   
    try:
        if quoted:
            u = tweet['user']
            return record_nodes([u['username'].lower(), u['followersCount'], u['friendsCount'], str(tweet['date'])[:10]])
        else:
            u = ast.literal_eval(tweet['Author'].values[0])
            return record_nodes([u['username'].lower(), u['followersCount'], u['friendsCount'], str(tweet['date'])[:10]])

    except Exception as e:
        display(tweet)
        raise e
        

def extract_mention_targets(tweet):   
    text = tweet['content'] if isinstance(tweet['content'], str) else tweet['content'].values[0] 
    users = re.findall(r'(?<=^|(?<=[^a-zA-Z0-9-_\.]))@([A-Za-z]+[A-Za-z0-9-_]+)', text, flags=re.IGNORECASE)
    return [record_nodes([u.lower(), 0, 0,str(tweet['date'])[:10]]) for u in users]

def extract_mention_edges(tweet, quoted=False):
    # source, Target, Label, Weigth, Tweet Id 
    source = extract_source(tweet, quoted)
    targets = extract_mention_targets(tweet)
    for t in targets:
        edges.append([source, t, 'MENTION', 1, tweet['id'].values[0] if not quoted else tweet['id']])

    return source

def extract_quoted_target(q):
    return record_nodes([q['user']['username'].lower(), q['user']['followersCount'], q['user']['friendsCount'], str(q['date'])[:10]])

def extract_quoted_edge(quoted_tweet, source):
    # source, Target, Label, Weigth, Tweet ID
    q = string_to_dict(quoted_tweet)
    u = extract_quoted_target(q)
    edges.append([source, u, 'QUOTE', 1, q['id']])
    
def process_tweet(tweet, quoted = False):
    source = extract_mention_edges(tweet, quoted)
    
    if not quoted and pd.notnull(tweet['quotedTweet']).all():  
        quotedTweet = tweet['quotedTweet'].values[0] 
        extract_quoted_edge(quotedTweet, source) # quoted edge
        process_tweet(string_to_dict(quotedTweet), True) #process the tweet
        
    elif quoted and tweet['quotedTweet']:
        quotedTweet = tweet['quotedTweet']
        extract_quoted_edge(quotedTweet, source) 
        process_tweet(quotedTweet, True)

def process_file(filename):
    print(filename)
    errors = 0 
    df = pd.read_excel(filename, index_col=0).reset_index()
    display(df.head())
    for index, row in df.iterrows(): #process tweets
        try: 
            process_tweet(df.iloc[[index]])
        except Exception as e:   
            print("Index: ", index)
            print(type(df.iloc[[index]]))
            raise e
            errors += 1

    df_nodes = pd.DataFrame.from_dict(nodes, orient='index', columns=['Label', 'Followers', 'Friends', 'Date']) 
    df_nodes = df_nodes[['Label', 'Followers', 'Friends']]
    df_nodes.to_csv("data/nets/nodes_" + filename.replace('.xlsx', '.csv').replace('data/raw_data\\', ''), index=True)
    
    df_edges = pd.DataFrame(edges, columns=['Source', 'Target', 'Label', 'Weight', 'Tweet ID']) 
    df_edges = df_edges.drop_duplicates(subset=['Source', 'Target', 'Label', 'Tweet ID'], keep='last')
    df_edges = df_edges[['Source', 'Target', 'Label', 'Weight']]
    df_edges = df_edges.groupby(['Source', 'Target', 'Label']).agg({'Weight': 'sum'}).reset_index()
    df_edges.to_csv("data/nets/edges_" + filename.replace('.xlsx', '.csv').replace('data/raw_data\\', ''), index=False)
    print (errors)
    return [filename, len(df), len(df_nodes), len(df_edges), errors]

# 3. Process files

In [40]:
import json
pd.set_option('display.max_colwidth', None)
stats = []
PATH = 'data/raw_data/'

for filename in glob.glob(os.path.join(PATH, '*.xlsx')):
    nodes = {}
    edges = [] 
    stats.append(process_file(filename))
    
df = pd.DataFrame(stats, columns = ['Filename', 'No. Tweets', 'No. Nodes', 'No. Edges', 'No. Errors'])
df.to_csv('data\global_net_stats.csv', index = False)
len(df)

data/raw_data\brasilEvento3.xlsx


Unnamed: 0,date,content,id,outlinks,replyCount,retweetCount,likeCount,quoteCount,conversationId,lang,retweetedTweet,quotedTweet,Author,username,followers_list,friends_list
0,2020-05-26,O Brasil j√° sabe que a fam√≠lia Bolsonaro interfere na Pol√≠cia Federal para se blindar das investiga√ß√µes. N√£o podemos deixar que o Caso Marielle seja federalizado nesse momento. #Federaliza√ß√£oN√£o https://t.co/0wd0fyWtGv,1265432499263503872,['http://www.federalizacaonao.org'],0,0,0,0,1265432499263503872,pt,,,"{'username': 'jeivison_jose', 'displayname': 'Jeivison Jos√©', 'id': 1199717598482579456, 'description': 'Fot√≥grafo por acaso.', 'rawDescription': 'Fot√≥grafo por acaso.', 'descriptionUrls': [], 'verified': False, 'created': '2019-11-27T15:52:49+00:00', 'followersCount': 5, 'friendsCount': 99, 'statusesCount': 62, 'favouritesCount': 380, 'listedCount': 0, 'mediaCount': 1, 'location': 'S√£o Paulo', 'protected': False, 'linkUrl': 'https://jeivison.myportfolio.com/', 'linkTcourl': 'https://t.co/YuG03T6vCp', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1265431002631081984/-HsQy-pH_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1199717598482579456/1590537237', 'url': 'https://twitter.com/jeivison_jose'}",jeivison_jose,5,99
1,2020-05-26,S√≥ at√© amanh√£. \nO Brasil j√° sabe que a fam√≠lia Bolsonaro interfere na Pol√≠cia Federal para se blindar das investiga√ß√µes. N√£o podemos deixar que o Caso Marielle seja federalizado nesse momento. #Federaliza√ß√£oN√£o https://t.co/m0SRsmqpsc,1265432263048790016,['http://www.federalizacaonao.org'],0,0,0,0,1265432263048790016,pt,,,"{'username': 'peraindameufi', 'displayname': 'Cacto Tch√≥p da Julietteüåµ', 'id': 1186128416, 'description': 'Pernambucana, Recifense Vivendo no Cerrado üèú\n‚ö°Ô∏è Amor ao Trance Rave Festival ‚ô™ Autismoüß© #FeministaTodoDia Leonina ‚ö†Ô∏èINSTAÔ∏è‚ù£ Instagram.com/peraiiinda/', 'rawDescription': 'Pernambucana, Recifense Vivendo no Cerrado üèú\n‚ö°Ô∏è Amor ao Trance Rave Festival ‚ô™ Autismoüß© #FeministaTodoDia Leonina ‚ö†Ô∏èINSTAÔ∏è‚ù£ https://t.co/eTOTbXks18', 'descriptionUrls': [{'text': 'Instagram.com/peraiiinda/', 'url': 'http://Instagram.com/peraiiinda/', 'tcourl': 'https://t.co/eTOTbXks18', 'indices': [126, 149]}], 'verified': False, 'created': '2013-02-16T12:44:48+00:00', 'followersCount': 2588, 'friendsCount': 2315, 'statusesCount': 7957, 'favouritesCount': 26374, 'listedCount': 8, 'mediaCount': 440, 'location': 'Bras√≠lia DF', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1322196825407950848/mWv8egPS_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1186128416/1604071518', 'url': 'https://twitter.com/peraindameufi'}",peraindameufi,2588,2315
2,2020-05-26,"Disseram:""Bolsonaro √© a segunda maior vergonha do Brasil""... Por isso nossa empresa investigada pela Pol√≠cia Federal assinou contrato de MILH√ïES DE REAIS com Sergio Moro...? ü§®ü§®ü§®\n\nEntenderam?\n\nVia @domlancellotti\n\n#MoroNaCadeia üí• https://t.co/BWvDXHSd9P",1265432001437470976,[],2,6,16,0,1265431931648445952,pt,,,"{'username': 'a_jessicao', 'displayname': 'Jessic√£o, a Opressora', 'id': 1248830800281378817, 'description': 'üó£Ô∏è| Vereadora na cidade de Londrina-PR\nüì¢ | Presidente do Direita Paran√° Oficial\nüáßüá∑ | #bolsonaro2022\nüì± | 43 9.96484741', 'rawDescription': 'üó£Ô∏è| Vereadora na cidade de Londrina-PR\nüì¢ | Presidente do Direita Paran√° Oficial\nüáßüá∑ | #bolsonaro2022\nüì± | 43 9.96484741', 'descriptionUrls': [], 'verified': False, 'created': '2020-04-11T04:31:02+00:00', 'followersCount': 22267, 'friendsCount': 325, 'statusesCount': 1890, 'favouritesCount': 6316, 'listedCount': 11, 'mediaCount': 696, 'location': 'Londrina, Brasil', 'protected': False, 'linkUrl': 'https://www.facebook.com/jessicaoaopressora', 'linkTcourl': 'https://t.co/OcZryakVRU', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1248844060791656448/BiJQvViI_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1248830800281378817/1613063982', 'url': 'https://twitter.com/a_jessicao'}",a_jessicao,22267,325
3,2020-05-26,O Brasil j√° sabe que a fam√≠lia Bolsonaro interfere na Pol√≠cia Federal para se blindar das investiga√ß√µes. N√£o podemos deixar que o Caso Marielle seja federalizado nesse momento. #Federaliza√ß√£oN√£o https://t.co/ckPlJj8G6L,1265431695106458112,['http://www.federalizacaonao.org'],0,0,0,0,1265431695106458112,pt,,,"{'username': 'driihvilasboas', 'displayname': 'Adriene', 'id': 1225939807068737536, 'description': 'Deus √© bom o tempo todo üôèüèªüíï', 'rawDescription': 'Deus √© bom o tempo todo üôèüèªüíï', 'descriptionUrls': [], 'verified': False, 'created': '2020-02-08T00:30:19+00:00', 'followersCount': 6, 'friendsCount': 61, 'statusesCount': 123, 'favouritesCount': 3250, 'listedCount': 0, 'mediaCount': 5, 'location': 'Itajub√°, Brasil', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1362396043955036160/AfKDKFxq_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1225939807068737536/1613655504', 'url': 'https://twitter.com/driihvilasboas'}",driihvilasboas,6,61
4,2020-05-26,Hoje foi o dia que eu descobri que √© muito mais f√°cil passar na faculdade mais concorrida de medicina (do Brasil) do que no concurso da Pol√≠cia Federal,1265431646494473984,[],2,0,4,0,1265431646494473984,pt,,,"{'username': 'TMusshauser', 'displayname': 'ùï∏ùñöùñòùñòùñçùñÜùñöùñòùñäùñó', 'id': 869277217443983360, 'description': 'kk puts', 'rawDescription': 'kk puts', 'descriptionUrls': [], 'verified': False, 'created': '2017-05-29T19:40:13+00:00', 'followersCount': 66, 'friendsCount': 75, 'statusesCount': 3264, 'favouritesCount': 1876, 'listedCount': 0, 'mediaCount': 49, 'location': 'Joinville, Brasil', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1330955676856758276/47P_PDx1_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/869277217443983360/1616190131', 'url': 'https://twitter.com/TMusshauser'}",TMusshauser,66,75


0
data/raw_data\colombiaEvento1.xlsx


Unnamed: 0,index,date,content,id,outlinks,replyCount,retweetCount,likeCount,quoteCount,conversationId,lang,retweetedTweet,quotedTweet,Author,username,followers_list,friends_list
0,171258,2020-09-10,"@RevistaSemana NO MAS BALAS !!\nquien di√≥ la orden !!!\n\nEn Fontibon hoy 10-Septiembre-2020, @PoliciaColombia abren fuego contra manifestantes https://t.co/UOs1CtE9nN",1304208027281690880,[],0,0,0,0,1304201250326614016,es,,,"{'username': '_COLOMBIAHUMANA', 'displayname': 'LA VERDAD NOS HAR√Å LIBRES!üë®\u200düåæüë®\u200düéìü•ëüåæüå≤üöØüöÆüá®üá¥', 'id': 1282323464280584192, 'description': 'El debate del Gobierno entre derecha e izquierda no es el debate de esta generaci√≥n! El debate es entre progreso y atraso... Nosotros somos progresismo üëäüèæ', 'rawDescription': 'El debate del Gobierno entre derecha e izquierda no es el debate de esta generaci√≥n! El debate es entre progreso y atraso... Nosotros somos progresismo üëäüèæ', 'descriptionUrls': [], 'verified': False, 'created': '2020-07-12T14:38:41+00:00', 'followersCount': 1487, 'friendsCount': 590, 'statusesCount': 33525, 'favouritesCount': 15826, 'listedCount': 2, 'mediaCount': 9073, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1294688165542928390/kskxQIpO_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1282323464280584192/1613740078', 'url': 'https://twitter.com/_COLOMBIAHUMANA'}",_COLOMBIAHUMANA,1487,590
1,171259,2020-09-10,"@PoliciaColombia Instituci√≥n con poca credibilidad y preparo, agentes ordinarios que a veces se confunden con gamines por su forma coloquial de hablar, sin valores y nada cultos, perdieron mi respeto.",1304208025750774016,[],0,0,0,0,1304183024217711104,es,,,"{'username': 'Cuest9', 'displayname': 'Cuest', 'id': 1240518196970618881, 'description': '#Bitcoin\n#nosugar', 'rawDescription': '#Bitcoin\n#nosugar', 'descriptionUrls': [], 'verified': False, 'created': '2020-03-19T05:59:32+00:00', 'followersCount': 10, 'friendsCount': 103, 'statusesCount': 197, 'favouritesCount': 846, 'listedCount': 0, 'mediaCount': 0, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1304207463890259970/7NN8oQda_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1240518196970618881/1599782341', 'url': 'https://twitter.com/Cuest9'}",Cuest9,10,103
2,171260,2020-09-10,"@somosraya @PoliciaBogota @ProteccionPonal @Policia924FM @TransitoBta @PoliciaColombia @AnimalesBOG Ma√±ana les ordenan que lleven a los hijos a las protestas, y √©stos obedecen. #QuienDioLaOrden ?",1304208007354609920,[],1,0,0,0,1304150393438573056,es,,,"{'username': 'Cyanider_', 'displayname': 'ùìíùíö·¥Äùíè…™ùíÖe–Ø', 'id': 77595198, 'description': 'All will bear a part of me, let this\nhollow shell set your free to live as one...', 'rawDescription': 'All will bear a part of me, let this\nhollow shell set your free to live as one...', 'descriptionUrls': [], 'verified': False, 'created': '2009-09-26T22:50:37+00:00', 'followersCount': 3294, 'friendsCount': 3352, 'statusesCount': 7038, 'favouritesCount': 10321, 'listedCount': 0, 'mediaCount': 662, 'location': 'Bucaramsterdam', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1377301149850669062/0XEA_umO_normal.png', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/77595198/1614792236', 'url': 'https://twitter.com/Cyanider_'}",Cyanider_,3294,3352
3,171261,2020-09-10,@elcinicoreyrana @PoliciaColombia @verdolaga2323 Estamos hablando con base a los hechos que dieron lugar al levantamiento del pueblo.\n\nY seguimos siendo victimas de sus atropellos.,1304208005936886016,[],1,0,0,0,1304183024217711104,es,,,"{'username': 'SargentoYosa', 'displayname': 'üá®üá¥Sargento (r) Yosa üá®üá¥', 'id': 1409414106, 'description': 'Exmilitar, Abogado penalista, Quiero una Colombia justa y equitativa, celebro La Paz.\n#ReservaSocialporlaPaz \n#NegativoParaUribista \n#AntiUribista', 'rawDescription': 'Exmilitar, Abogado penalista, Quiero una Colombia justa y equitativa, celebro La Paz.\n#ReservaSocialporlaPaz \n#NegativoParaUribista \n#AntiUribista', 'descriptionUrls': [], 'verified': False, 'created': '2013-05-07T04:59:48+00:00', 'followersCount': 7546, 'friendsCount': 6918, 'statusesCount': 3495, 'favouritesCount': 3975, 'listedCount': 4, 'mediaCount': 176, 'location': 'M√©xico', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1288704079988957184/xriOqsia_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1409414106/1602946404', 'url': 'https://twitter.com/SargentoYosa'}",SargentoYosa,7546,6918
4,171262,2020-09-10,"Me duele mi patria...\nNo pueden protestar con violencia... Por la violencia de unos pocos de la @PoliciaColombia . Es su obligaci√≥n velar por nuestro bienestar, hacer cumplir la ley, con respeto.. Y la de nosotros respetarlos a ustedes, Somos iguales.üò≠üò≠",1304207998542402048,[],0,0,0,0,1304207998542402048,es,,,"{'username': 'saramarinrendon', 'displayname': 'Sara Mar√≠n Rend√≥n', 'id': 635740221, 'description': '‚ô¶‚ô†‚ô£‚ô•', 'rawDescription': '‚ô¶‚ô†‚ô£‚ô•', 'descriptionUrls': [], 'verified': False, 'created': '2012-07-14T21:11:43+00:00', 'followersCount': 42, 'friendsCount': 420, 'statusesCount': 290, 'favouritesCount': 260, 'listedCount': 0, 'mediaCount': 11, 'location': 'Medell√≠n, Colombia', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1292231455100276739/u1xxc7sS_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/635740221/1547744122', 'url': 'https://twitter.com/saramarinrendon'}",saramarinrendon,42,420


0
data/raw_data\colombiaEvento2.xlsx


Unnamed: 0,date,content,id,outlinks,replyCount,retweetCount,likeCount,quoteCount,conversationId,lang,retweetedTweet,quotedTweet,Author,username,followers_list,friends_list
0,2020-09-10,"@RevistaSemana NO MAS BALAS !!\nquien di√≥ la orden !!!\n\nEn Fontibon hoy 10-Septiembre-2020, @PoliciaColombia abren fuego contra manifestantes https://t.co/UOs1CtE9nN",1304208027281690880,[],0,0,0,0,1304201250326614016,es,,,"{'username': '_COLOMBIAHUMANA', 'displayname': 'LA VERDAD NOS HAR√Å LIBRES!üë®\u200düåæüë®\u200düéìü•ëüåæüå≤üöØüöÆüá®üá¥', 'id': 1282323464280584192, 'description': 'El debate del Gobierno entre derecha e izquierda no es el debate de esta generaci√≥n! El debate es entre progreso y atraso... Nosotros somos progresismo üëäüèæ', 'rawDescription': 'El debate del Gobierno entre derecha e izquierda no es el debate de esta generaci√≥n! El debate es entre progreso y atraso... Nosotros somos progresismo üëäüèæ', 'descriptionUrls': [], 'verified': False, 'created': '2020-07-12T14:38:41+00:00', 'followersCount': 1487, 'friendsCount': 590, 'statusesCount': 33525, 'favouritesCount': 15826, 'listedCount': 2, 'mediaCount': 9073, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1294688165542928390/kskxQIpO_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1282323464280584192/1613740078', 'url': 'https://twitter.com/_COLOMBIAHUMANA'}",_COLOMBIAHUMANA,1487,590
1,2020-09-10,"@PoliciaColombia Instituci√≥n con poca credibilidad y preparo, agentes ordinarios que a veces se confunden con gamines por su forma coloquial de hablar, sin valores y nada cultos, perdieron mi respeto.",1304208025750774016,[],0,0,0,0,1304183024217711104,es,,,"{'username': 'Cuest9', 'displayname': 'Cuest', 'id': 1240518196970618881, 'description': '#Bitcoin\n#nosugar', 'rawDescription': '#Bitcoin\n#nosugar', 'descriptionUrls': [], 'verified': False, 'created': '2020-03-19T05:59:32+00:00', 'followersCount': 10, 'friendsCount': 103, 'statusesCount': 197, 'favouritesCount': 846, 'listedCount': 0, 'mediaCount': 0, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1304207463890259970/7NN8oQda_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1240518196970618881/1599782341', 'url': 'https://twitter.com/Cuest9'}",Cuest9,10,103
2,2020-09-10,"@somosraya @PoliciaBogota @ProteccionPonal @Policia924FM @TransitoBta @PoliciaColombia @AnimalesBOG Ma√±ana les ordenan que lleven a los hijos a las protestas, y √©stos obedecen. #QuienDioLaOrden ?",1304208007354609920,[],1,0,0,0,1304150393438573056,es,,,"{'username': 'Cyanider_', 'displayname': 'ùìíùíö·¥Äùíè…™ùíÖe–Ø', 'id': 77595198, 'description': 'All will bear a part of me, let this\nhollow shell set your free to live as one...', 'rawDescription': 'All will bear a part of me, let this\nhollow shell set your free to live as one...', 'descriptionUrls': [], 'verified': False, 'created': '2009-09-26T22:50:37+00:00', 'followersCount': 3294, 'friendsCount': 3352, 'statusesCount': 7038, 'favouritesCount': 10321, 'listedCount': 0, 'mediaCount': 662, 'location': 'Bucaramsterdam', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1377301149850669062/0XEA_umO_normal.png', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/77595198/1614792236', 'url': 'https://twitter.com/Cyanider_'}",Cyanider_,3294,3352
3,2020-09-10,@elcinicoreyrana @PoliciaColombia @verdolaga2323 Estamos hablando con base a los hechos que dieron lugar al levantamiento del pueblo.\n\nY seguimos siendo victimas de sus atropellos.,1304208005936886016,[],1,0,0,0,1304183024217711104,es,,,"{'username': 'SargentoYosa', 'displayname': 'üá®üá¥Sargento (r) Yosa üá®üá¥', 'id': 1409414106, 'description': 'Exmilitar, Abogado penalista, Quiero una Colombia justa y equitativa, celebro La Paz.\n#ReservaSocialporlaPaz \n#NegativoParaUribista \n#AntiUribista', 'rawDescription': 'Exmilitar, Abogado penalista, Quiero una Colombia justa y equitativa, celebro La Paz.\n#ReservaSocialporlaPaz \n#NegativoParaUribista \n#AntiUribista', 'descriptionUrls': [], 'verified': False, 'created': '2013-05-07T04:59:48+00:00', 'followersCount': 7546, 'friendsCount': 6918, 'statusesCount': 3495, 'favouritesCount': 3975, 'listedCount': 4, 'mediaCount': 176, 'location': 'M√©xico', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1288704079988957184/xriOqsia_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1409414106/1602946404', 'url': 'https://twitter.com/SargentoYosa'}",SargentoYosa,7546,6918
4,2020-09-10,"Me duele mi patria...\nNo pueden protestar con violencia... Por la violencia de unos pocos de la @PoliciaColombia . Es su obligaci√≥n velar por nuestro bienestar, hacer cumplir la ley, con respeto.. Y la de nosotros respetarlos a ustedes, Somos iguales.üò≠üò≠",1304207998542402048,[],0,0,0,0,1304207998542402048,es,,,"{'username': 'saramarinrendon', 'displayname': 'Sara Mar√≠n Rend√≥n', 'id': 635740221, 'description': '‚ô¶‚ô†‚ô£‚ô•', 'rawDescription': '‚ô¶‚ô†‚ô£‚ô•', 'descriptionUrls': [], 'verified': False, 'created': '2012-07-14T21:11:43+00:00', 'followersCount': 42, 'friendsCount': 420, 'statusesCount': 290, 'favouritesCount': 260, 'listedCount': 0, 'mediaCount': 11, 'location': 'Medell√≠n, Colombia', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1292231455100276739/u1xxc7sS_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/635740221/1547744122', 'url': 'https://twitter.com/saramarinrendon'}",saramarinrendon,42,420


0
data/raw_data\colombiaEvento3.xlsx


Unnamed: 0,date,content,id,outlinks,replyCount,retweetCount,likeCount,quoteCount,conversationId,lang,retweetedTweet,quotedTweet,Author,username,followers_list,friends_list
0,2020-09-10,"@RevistaSemana NO MAS BALAS !!\nquien di√≥ la orden !!!\n\nEn Fontibon hoy 10-Septiembre-2020, @PoliciaColombia abren fuego contra manifestantes https://t.co/UOs1CtE9nN",1304208027281690880,[],0,0,0,0,1304201250326614016,es,,,"{'username': '_COLOMBIAHUMANA', 'displayname': 'LA VERDAD NOS HAR√Å LIBRES!üë®\u200düåæüë®\u200düéìü•ëüåæüå≤üöØüöÆüá®üá¥', 'id': 1282323464280584192, 'description': 'El debate del Gobierno entre derecha e izquierda no es el debate de esta generaci√≥n! El debate es entre progreso y atraso... Nosotros somos progresismo üëäüèæ', 'rawDescription': 'El debate del Gobierno entre derecha e izquierda no es el debate de esta generaci√≥n! El debate es entre progreso y atraso... Nosotros somos progresismo üëäüèæ', 'descriptionUrls': [], 'verified': False, 'created': '2020-07-12T14:38:41+00:00', 'followersCount': 1487, 'friendsCount': 590, 'statusesCount': 33525, 'favouritesCount': 15826, 'listedCount': 2, 'mediaCount': 9073, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1294688165542928390/kskxQIpO_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1282323464280584192/1613740078', 'url': 'https://twitter.com/_COLOMBIAHUMANA'}",_COLOMBIAHUMANA,1487,590
1,2020-09-10,"@PoliciaColombia Instituci√≥n con poca credibilidad y preparo, agentes ordinarios que a veces se confunden con gamines por su forma coloquial de hablar, sin valores y nada cultos, perdieron mi respeto.",1304208025750774016,[],0,0,0,0,1304183024217711104,es,,,"{'username': 'Cuest9', 'displayname': 'Cuest', 'id': 1240518196970618881, 'description': '#Bitcoin\n#nosugar', 'rawDescription': '#Bitcoin\n#nosugar', 'descriptionUrls': [], 'verified': False, 'created': '2020-03-19T05:59:32+00:00', 'followersCount': 10, 'friendsCount': 103, 'statusesCount': 197, 'favouritesCount': 846, 'listedCount': 0, 'mediaCount': 0, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1304207463890259970/7NN8oQda_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1240518196970618881/1599782341', 'url': 'https://twitter.com/Cuest9'}",Cuest9,10,103
2,2020-09-10,"@somosraya @PoliciaBogota @ProteccionPonal @Policia924FM @TransitoBta @PoliciaColombia @AnimalesBOG Ma√±ana les ordenan que lleven a los hijos a las protestas, y √©stos obedecen. #QuienDioLaOrden ?",1304208007354609920,[],1,0,0,0,1304150393438573056,es,,,"{'username': 'Cyanider_', 'displayname': 'ùìíùíö·¥Äùíè…™ùíÖe–Ø', 'id': 77595198, 'description': 'All will bear a part of me, let this\nhollow shell set your free to live as one...', 'rawDescription': 'All will bear a part of me, let this\nhollow shell set your free to live as one...', 'descriptionUrls': [], 'verified': False, 'created': '2009-09-26T22:50:37+00:00', 'followersCount': 3294, 'friendsCount': 3352, 'statusesCount': 7038, 'favouritesCount': 10321, 'listedCount': 0, 'mediaCount': 662, 'location': 'Bucaramsterdam', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1377301149850669062/0XEA_umO_normal.png', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/77595198/1614792236', 'url': 'https://twitter.com/Cyanider_'}",Cyanider_,3294,3352
3,2020-09-10,@elcinicoreyrana @PoliciaColombia @verdolaga2323 Estamos hablando con base a los hechos que dieron lugar al levantamiento del pueblo.\n\nY seguimos siendo victimas de sus atropellos.,1304208005936886016,[],1,0,0,0,1304183024217711104,es,,,"{'username': 'SargentoYosa', 'displayname': 'üá®üá¥Sargento (r) Yosa üá®üá¥', 'id': 1409414106, 'description': 'Exmilitar, Abogado penalista, Quiero una Colombia justa y equitativa, celebro La Paz.\n#ReservaSocialporlaPaz \n#NegativoParaUribista \n#AntiUribista', 'rawDescription': 'Exmilitar, Abogado penalista, Quiero una Colombia justa y equitativa, celebro La Paz.\n#ReservaSocialporlaPaz \n#NegativoParaUribista \n#AntiUribista', 'descriptionUrls': [], 'verified': False, 'created': '2013-05-07T04:59:48+00:00', 'followersCount': 7546, 'friendsCount': 6918, 'statusesCount': 3495, 'favouritesCount': 3975, 'listedCount': 4, 'mediaCount': 176, 'location': 'M√©xico', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1288704079988957184/xriOqsia_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1409414106/1602946404', 'url': 'https://twitter.com/SargentoYosa'}",SargentoYosa,7546,6918
4,2020-09-10,"Me duele mi patria...\nNo pueden protestar con violencia... Por la violencia de unos pocos de la @PoliciaColombia . Es su obligaci√≥n velar por nuestro bienestar, hacer cumplir la ley, con respeto.. Y la de nosotros respetarlos a ustedes, Somos iguales.üò≠üò≠",1304207998542402048,[],0,0,0,0,1304207998542402048,es,,,"{'username': 'saramarinrendon', 'displayname': 'Sara Mar√≠n Rend√≥n', 'id': 635740221, 'description': '‚ô¶‚ô†‚ô£‚ô•', 'rawDescription': '‚ô¶‚ô†‚ô£‚ô•', 'descriptionUrls': [], 'verified': False, 'created': '2012-07-14T21:11:43+00:00', 'followersCount': 42, 'friendsCount': 420, 'statusesCount': 290, 'favouritesCount': 260, 'listedCount': 0, 'mediaCount': 11, 'location': 'Medell√≠n, Colombia', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1292231455100276739/u1xxc7sS_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/635740221/1547744122', 'url': 'https://twitter.com/saramarinrendon'}",saramarinrendon,42,420


0
data/raw_data\ecuadorEvento1.xlsx


Unnamed: 0,date,content,id,outlinks,replyCount,retweetCount,likeCount,quoteCount,conversationId,lang,retweetedTweet,quotedTweet,Author,username,followers_list,friends_list
0,2019-10-12,@ediyanez @MetrodeQuito @LoroHomero @lahoraecuador @santiguarderas @babadmerchan @gisella_bayona @OswaldoMorocho1 @eduardodelp @rpflores @ECU911_ @PoliciaEcuador @EjercitoECU El vandalismo la delincuencia infiltrada en protestas @FFAAECUADOR @PoliciaEcuador xq abandonan obra q cuesta 2MM dolares UIO desprotegido en inversiones p√∫blicas y privadas ataques entre ecuatorianos por una desicion gubernamental q puede modificar o cambiar si tiene voluntad,1183170479789658112,[],1,2,0,0,1183152434014839040,es,,,"{'username': 'JorgeYanezVen', 'displayname': 'Jorge An√≠bal Yanez V', 'id': 891313209554219009, 'description': 'Dirigente del transporte urbano de Quito desde 1980 para gusto de muchos y disgustos de la gente indisiplinada', 'rawDescription': 'Dirigente del transporte urbano de Quito desde 1980 para gusto de muchos y disgustos de la gente indisiplinada', 'descriptionUrls': [], 'verified': False, 'created': '2017-07-29T15:03:23+00:00', 'followersCount': 622, 'friendsCount': 1539, 'statusesCount': 5014, 'favouritesCount': 3230, 'listedCount': 2, 'mediaCount': 56, 'location': 'Quito, Ecuador', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1253684961103745029/lvN-GQh__normal.jpg', 'profileBannerUrl': None, 'url': 'https://twitter.com/JorgeYanezVen'}",JorgeYanezVen,622,1539
1,2019-10-12,@ComunicacionEc @juanfer3x @PoliciaEcuador @FFAAECUADOR Son el orgullo del Ecuador @FFAAECUADOR y @PoliciaEcuador no podemos estar en mejores manos!!!,1183170474588679936,[],0,0,0,0,1183081477464121088,es,,,"{'username': 'pedrovazquezmal', 'displayname': 'Pedro V√°zquez', 'id': 336786738, 'description': '', 'rawDescription': '', 'descriptionUrls': [], 'verified': False, 'created': '2011-07-16T22:27:58+00:00', 'followersCount': 183, 'friendsCount': 304, 'statusesCount': 2683, 'favouritesCount': 239, 'listedCount': 2, 'mediaCount': 620, 'location': 'Cuenca - Ecuador', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1050918844380909568/1n4frU7W_normal.jpg', 'profileBannerUrl': None, 'url': 'https://twitter.com/pedrovazquezmal'}",pedrovazquezmal,183,304
2,2019-10-12,@mariapaularomo @PoliciaEcuador Renuncia por favor @mariapaularomo,1183170471782768896,[],0,0,0,0,1183077011528539904,es,,,"{'username': 'JuanJoPoa', 'displayname': 'Juan Jose Poaquiza C', 'id': 750627810, 'description': '', 'rawDescription': '', 'descriptionUrls': [], 'verified': False, 'created': '2012-08-11T04:21:19+00:00', 'followersCount': 10, 'friendsCount': 250, 'statusesCount': 47, 'favouritesCount': 422, 'listedCount': 0, 'mediaCount': 2, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1202913069975900160/IlNHAty8_normal.jpg', 'profileBannerUrl': None, 'url': 'https://twitter.com/JuanJoPoa'}",JuanJoPoa,10,250
3,2019-10-12,"@wgomezr @PoliciaEcuador @ONU_es @ONUecuador @CIDH @RELE_CIDH @OEA_oficial @Almagro_OEA2015 Una lanza no mata?, Una piedra no mata?, Sea m√°s coherente con sus palabras licenciado Mag√≠ster!!!",1183170450127577088,[],2,0,0,0,1183048566861946880,es,,,"{'username': 'harrymichaelv', 'displayname': 'Miguel Angel üá™üá®üíõüñ§‚ù§', 'id': 1300429435, 'description': 'Barcelonista de Coraz√≥n, Apoyando a mi equipo en las buenas y en las malas, Amo a Dios, a mi Madre y a Barcelona Sporting Club!', 'rawDescription': 'Barcelonista de Coraz√≥n, Apoyando a mi equipo en las buenas y en las malas, Amo a Dios, a mi Madre y a Barcelona Sporting Club!', 'descriptionUrls': [], 'verified': False, 'created': '2013-03-25T17:42:23+00:00', 'followersCount': 72, 'friendsCount': 1031, 'statusesCount': 1449, 'favouritesCount': 3709, 'listedCount': 0, 'mediaCount': 53, 'location': 'Abu\xa0Dabi, Emiratos √Årabes Unid', 'protected': False, 'linkUrl': 'http://www.rogerfederer.com', 'linkTcourl': 'https://t.co/M2BUlD3GSC', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1223031070838398978/02KaGGX9_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1300429435/1580428306', 'url': 'https://twitter.com/harrymichaelv'}",harrymichaelv,72,1031
4,2019-10-12,@PoliciaEcuador https://t.co/6eC40fkHon,1183170448714019072,[],0,3,6,0,1183170448714019072,und,,,"{'username': 'ProfHoax__', 'displayname': 'ProfHoax ¬Æ üåäüíô üëüüëü', 'id': 309985367, 'description': 'Libertario por nacimiento, por vocaci√≥n y por convicci√≥n.\nMantuve vagos con mis impuestos desde 1981 hasta el 2019.', 'rawDescription': 'Libertario por nacimiento, por vocaci√≥n y por convicci√≥n.\nMantuve vagos con mis impuestos desde 1981 hasta el 2019.', 'descriptionUrls': [], 'verified': False, 'created': '2011-06-03T00:45:09+00:00', 'followersCount': 21832, 'friendsCount': 615, 'statusesCount': 573182, 'favouritesCount': 3033, 'listedCount': 135, 'mediaCount': 9774, 'location': 'Republiqueta Soberana Banania', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1147181743608422401/P6kXZS5X_normal.png', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/309985367/1562344464', 'url': 'https://twitter.com/ProfHoax__'}",ProfHoax__,21832,615


0
data/raw_data\ecuadorEvento2.xlsx


Unnamed: 0,date,content,id,outlinks,replyCount,retweetCount,likeCount,quoteCount,conversationId,lang,retweetedTweet,quotedTweet,Author,username,followers_list,friends_list
0,2019-10-12,@ediyanez @MetrodeQuito @LoroHomero @lahoraecuador @santiguarderas @babadmerchan @gisella_bayona @OswaldoMorocho1 @eduardodelp @rpflores @ECU911_ @PoliciaEcuador @EjercitoECU El vandalismo la delincuencia infiltrada en protestas @FFAAECUADOR @PoliciaEcuador xq abandonan obra q cuesta 2MM dolares UIO desprotegido en inversiones p√∫blicas y privadas ataques entre ecuatorianos por una desicion gubernamental q puede modificar o cambiar si tiene voluntad,1183170479789658112,[],1,2,0,0,1183152434014839040,es,,,"{'username': 'JorgeYanezVen', 'displayname': 'Jorge An√≠bal Yanez V', 'id': 891313209554219009, 'description': 'Dirigente del transporte urbano de Quito desde 1980 para gusto de muchos y disgustos de la gente indisiplinada', 'rawDescription': 'Dirigente del transporte urbano de Quito desde 1980 para gusto de muchos y disgustos de la gente indisiplinada', 'descriptionUrls': [], 'verified': False, 'created': '2017-07-29T15:03:23+00:00', 'followersCount': 622, 'friendsCount': 1539, 'statusesCount': 5014, 'favouritesCount': 3230, 'listedCount': 2, 'mediaCount': 56, 'location': 'Quito, Ecuador', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1253684961103745029/lvN-GQh__normal.jpg', 'profileBannerUrl': None, 'url': 'https://twitter.com/JorgeYanezVen'}",JorgeYanezVen,622,1539
1,2019-10-12,@ComunicacionEc @juanfer3x @PoliciaEcuador @FFAAECUADOR Son el orgullo del Ecuador @FFAAECUADOR y @PoliciaEcuador no podemos estar en mejores manos!!!,1183170474588679936,[],0,0,0,0,1183081477464121088,es,,,"{'username': 'pedrovazquezmal', 'displayname': 'Pedro V√°zquez', 'id': 336786738, 'description': '', 'rawDescription': '', 'descriptionUrls': [], 'verified': False, 'created': '2011-07-16T22:27:58+00:00', 'followersCount': 183, 'friendsCount': 304, 'statusesCount': 2683, 'favouritesCount': 239, 'listedCount': 2, 'mediaCount': 620, 'location': 'Cuenca - Ecuador', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1050918844380909568/1n4frU7W_normal.jpg', 'profileBannerUrl': None, 'url': 'https://twitter.com/pedrovazquezmal'}",pedrovazquezmal,183,304
2,2019-10-12,@mariapaularomo @PoliciaEcuador Renuncia por favor @mariapaularomo,1183170471782768896,[],0,0,0,0,1183077011528539904,es,,,"{'username': 'JuanJoPoa', 'displayname': 'Juan Jose Poaquiza C', 'id': 750627810, 'description': '', 'rawDescription': '', 'descriptionUrls': [], 'verified': False, 'created': '2012-08-11T04:21:19+00:00', 'followersCount': 10, 'friendsCount': 250, 'statusesCount': 47, 'favouritesCount': 422, 'listedCount': 0, 'mediaCount': 2, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1202913069975900160/IlNHAty8_normal.jpg', 'profileBannerUrl': None, 'url': 'https://twitter.com/JuanJoPoa'}",JuanJoPoa,10,250
3,2019-10-12,"@wgomezr @PoliciaEcuador @ONU_es @ONUecuador @CIDH @RELE_CIDH @OEA_oficial @Almagro_OEA2015 Una lanza no mata?, Una piedra no mata?, Sea m√°s coherente con sus palabras licenciado Mag√≠ster!!!",1183170450127577088,[],2,0,0,0,1183048566861946880,es,,,"{'username': 'harrymichaelv', 'displayname': 'Miguel Angel üá™üá®üíõüñ§‚ù§', 'id': 1300429435, 'description': 'Barcelonista de Coraz√≥n, Apoyando a mi equipo en las buenas y en las malas, Amo a Dios, a mi Madre y a Barcelona Sporting Club!', 'rawDescription': 'Barcelonista de Coraz√≥n, Apoyando a mi equipo en las buenas y en las malas, Amo a Dios, a mi Madre y a Barcelona Sporting Club!', 'descriptionUrls': [], 'verified': False, 'created': '2013-03-25T17:42:23+00:00', 'followersCount': 72, 'friendsCount': 1031, 'statusesCount': 1449, 'favouritesCount': 3709, 'listedCount': 0, 'mediaCount': 53, 'location': 'Abu\xa0Dabi, Emiratos √Årabes Unid', 'protected': False, 'linkUrl': 'http://www.rogerfederer.com', 'linkTcourl': 'https://t.co/M2BUlD3GSC', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1223031070838398978/02KaGGX9_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1300429435/1580428306', 'url': 'https://twitter.com/harrymichaelv'}",harrymichaelv,72,1031
4,2019-10-12,@PoliciaEcuador https://t.co/6eC40fkHon,1183170448714019072,[],0,3,6,0,1183170448714019072,und,,,"{'username': 'ProfHoax__', 'displayname': 'ProfHoax ¬Æ üåäüíô üëüüëü', 'id': 309985367, 'description': 'Libertario por nacimiento, por vocaci√≥n y por convicci√≥n.\nMantuve vagos con mis impuestos desde 1981 hasta el 2019.', 'rawDescription': 'Libertario por nacimiento, por vocaci√≥n y por convicci√≥n.\nMantuve vagos con mis impuestos desde 1981 hasta el 2019.', 'descriptionUrls': [], 'verified': False, 'created': '2011-06-03T00:45:09+00:00', 'followersCount': 21832, 'friendsCount': 615, 'statusesCount': 573182, 'favouritesCount': 3033, 'listedCount': 135, 'mediaCount': 9774, 'location': 'Republiqueta Soberana Banania', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1147181743608422401/P6kXZS5X_normal.png', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/309985367/1562344464', 'url': 'https://twitter.com/ProfHoax__'}",ProfHoax__,21832,615


0
data/raw_data\peruEvento1.xlsx


Unnamed: 0,index,date,content,id,outlinks,replyCount,retweetCount,likeCount,quoteCount,conversationId,lang,retweetedTweet,quotedTweet,Author,username,followers_list,friends_list
0,16401,2020-11-16,"Ante la crisis pol√≠tica en #Per√∫, la Federaci√≥n blanquiroja confirm√≥ que hay las garant√≠as por parte de la polic√≠a del pa√≠s para el partido que se jugar√° a las 19:30 en el Monumental del Lima ante #Argentina \n\n#EliminatoriasQatar2022\n#TeamDeportivoEc https://t.co/YWPrSMe5PY",1328483150784238080,[],0,0,0,0,1328483150784238080,es,,,"{'username': 'TeamDeportivoEC', 'displayname': 'TeamDeportivo', 'id': 1225611173476868097, 'description': 'P√°gina especializada en el f√∫tbol de Ecuador y del mundo \n#TeamDeportivoEc', 'rawDescription': 'P√°gina especializada en el f√∫tbol de Ecuador y del mundo \n#TeamDeportivoEc', 'descriptionUrls': [], 'verified': False, 'created': '2020-02-07T02:44:34+00:00', 'followersCount': 20, 'friendsCount': 242, 'statusesCount': 3604, 'favouritesCount': 63, 'listedCount': 0, 'mediaCount': 1673, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1347739829572939777/2hwz3VZz_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1225611173476868097/1581043882', 'url': 'https://twitter.com/TeamDeportivoEC'}",TeamDeportivoEC,20,242
1,16402,2020-11-16,"üìç La Polic√≠a lleg√≥ hasta su vivienda del hombre, quien confirm√≥ que no hab√≠a viajado a Lima para protestar ‚òùÔ∏èhttps://t.co/CNrJzCKigp",1328481295534596096,['https://radiokaribena.pe/hombre-aparece-en-lista-de-desaparecidos-pero-vive-en-arequipa/'],0,0,0,0,1328481295534596096,es,,,"{'username': 'karibenape', 'displayname': 'La Karibe√±a', 'id': 1683606829, 'description': 'Twitter oficial ¬°Espect√°culos, cumbia y m√°s! Esc√∫chanos en los 94.9FM', 'rawDescription': 'Twitter oficial ¬°Espect√°culos, cumbia y m√°s! Esc√∫chanos en los 94.9FM', 'descriptionUrls': [], 'verified': False, 'created': '2013-08-19T15:51:18+00:00', 'followersCount': 25800, 'friendsCount': 241, 'statusesCount': 56534, 'favouritesCount': 800, 'listedCount': 60, 'mediaCount': 34217, 'location': 'Lima - Per√∫', 'protected': False, 'linkUrl': 'http://www.radiokaribena.pe/', 'linkTcourl': 'http://t.co/AlJjDMaF2q', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1343574315632111621/4sskp2E9_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1683606829/1609768842', 'url': 'https://twitter.com/karibenape'}",karibenape,25800,241
2,16403,2020-11-16,"@CARLOSFMEJIA Imaginamos que el ""exitoso"" grupo de Lima y el mejor ej√©rcito y polic√≠a de Latinoam√©rica ya tienen controlado todo XD https://t.co/YzjqlFLpZX",1328475683257987072,[],0,0,1,0,1328364341519938048,es,,,"{'username': 'EdFor20', 'displayname': 'nerver walk alone', 'id': 1267821752370860033, 'description': '', 'rawDescription': '', 'descriptionUrls': [], 'verified': False, 'created': '2020-06-02T14:14:06+00:00', 'followersCount': 416, 'friendsCount': 794, 'statusesCount': 2960, 'favouritesCount': 25721, 'listedCount': 0, 'mediaCount': 72, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1330815250220933121/AvtJGWFw_normal.jpg', 'profileBannerUrl': None, 'url': 'https://twitter.com/EdFor20'}",EdFor20,416,794
3,16404,2020-11-16,"üáµüá™#Peru #MarchaNacional\n#Lima \n¬°¬°¬°QUE COBARDE ES LA POLIC√çA NACIONAL !!!\nBlanca no tienen ni la conciencia ni el alma, por eso el Pueblo los quiere matar. DIOS LOS MALDICE‚ÄºÔ∏è \nhttps://t.co/2fzKw1uSb9 \n\n#JackBryanPintadoSanchez \n#HeroeDelBicentenario \n#MartirDeLaDemocracia https://t.co/BwWDjsZpfG",1328471482037637120,['https://youtu.be/6hKTw_5oyp8'],0,1,1,0,1328471482037637120,es,,,"{'username': 'ContraApostasia', 'displayname': 'ContraApostasia', 'id': 1215368976240447488, 'description': '¬© ‚úùÔ∏è The Militia of the Soldiers of Jesus Christ¬Æ‚Ñ¢ ‚öîÔ∏è (MSIC¬©¬Æ‚Ñ¢) üëº', 'rawDescription': '¬© ‚úùÔ∏è The Militia of the Soldiers of Jesus Christ¬Æ‚Ñ¢ ‚öîÔ∏è (MSIC¬©¬Æ‚Ñ¢) üëº', 'descriptionUrls': [], 'verified': False, 'created': '2020-01-09T20:25:42+00:00', 'followersCount': 97, 'friendsCount': 86, 'statusesCount': 22640, 'favouritesCount': 16532, 'listedCount': 1, 'mediaCount': 6902, 'location': 'Œ≤Œ±œÉŒπŒªŒµŒØŒ± œÑ·ø∂ŒΩ Œø·ΩêœÅŒ±ŒΩ·ø∂ŒΩ üëº‚úùÔ∏èüëº ', 'protected': False, 'linkUrl': 'https://AciesDeiViventis.blogspot.com/', 'linkTcourl': 'https://t.co/epfuVG6Ed7', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1270922213265473545/6h_um_0f_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1215368976240447488/1595392168', 'url': 'https://twitter.com/ContraApostasia'}",ContraApostasia,97,86
4,16405,2020-11-16,#FotoDelD√≠a | Ciudadanos rinden homenaje a los estudiantes universitarios fallecidos durante las protestas el pasado 14 de noviembre por perdigones de la polic√≠a en Lima el 15 de noviembre de 2020. Per√∫ fue esta ma√±ana de lunes un pa√≠s ingobernable. El Economista/EFE https://t.co/aM3QUJbqSv,1328465517066277120,[],0,1,6,0,1328465517066277120,es,,,"{'username': 'Eleconomistanet', 'displayname': 'El Economista', 'id': 46449107, 'description': 'El Economista Centroam√©rica es una revista especializada en temas financieros y de negocios. Formamos parte de Grupo LPG, El Salvador.', 'rawDescription': 'El Economista Centroam√©rica es una revista especializada en temas financieros y de negocios. Formamos parte de Grupo LPG, El Salvador.', 'descriptionUrls': [], 'verified': False, 'created': '2009-06-11T18:13:10+00:00', 'followersCount': 31615, 'friendsCount': 765, 'statusesCount': 231127, 'favouritesCount': 205, 'listedCount': 483, 'mediaCount': 92767, 'location': '√úT: 13.675874,-89.260114', 'protected': False, 'linkUrl': 'http://eleconomista.net', 'linkTcourl': 'https://t.co/3rS1VQwAD5', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1323633293116493824/iWDTuu3B_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/46449107/1616713022', 'url': 'https://twitter.com/Eleconomistanet'}",Eleconomistanet,31615,765


0
data/raw_data\peruEvento3.xlsx


Unnamed: 0,date,content,id,outlinks,replyCount,retweetCount,likeCount,quoteCount,conversationId,lang,retweetedTweet,quotedTweet,Author,username,followers_list,friends_list
0,2020-11-13,"En sullana-piura, tumbes y Arequipa la polic√≠a esta marchando con el pueblo de manera pac√≠fica y est√° brindando mascarillas a los que no tienen, son un gran ejemplo para los tombos in√∫tiles de Lima. \n#PeruVsChile",1327400807550116096,[],2,7,36,0,1327400807550116096,es,,,"{'username': 'godispjm_', 'displayname': 'Angel‚ôÄÔ∏è', 'id': 1001652185061560320, 'description': 'no words to describe jimin. he is a angel.', 'rawDescription': 'no words to describe jimin. he is a angel.', 'descriptionUrls': [], 'verified': False, 'created': '2018-05-30T02:31:05+00:00', 'followersCount': 2326, 'friendsCount': 725, 'statusesCount': 66750, 'favouritesCount': 84691, 'listedCount': 23, 'mediaCount': 10282, 'location': ""jimin it's Korean boy"", 'protected': False, 'linkUrl': 'https://pjmsupport.carrd.co/', 'linkTcourl': 'https://t.co/zchsDQ1zR9', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1376285826187984897/EU9uur5D_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/1001652185061560320/1617334371', 'url': 'https://twitter.com/godispjm_'}",godispjm_,2326,725
1,2020-11-13,"@AdrianzenEduard La gente miraflorina, los de la Molina, San Isidro, San Borja ,etc. Deber√≠a ir al centro de Lima. A ver si tocan a uno y los padres hacen mierda a la polic√≠a, esperemos que no les hagan nada #per√∫vschile #peruchile",1327400073064549888,[],0,1,14,0,1327395767489794048,es,,,"{'username': 'geryruiz08', 'displayname': 'Geraldine‚öì', 'id': 159964181, 'description': '', 'rawDescription': '', 'descriptionUrls': [], 'verified': False, 'created': '2010-06-26T20:19:30+00:00', 'followersCount': 34, 'friendsCount': 122, 'statusesCount': 416, 'favouritesCount': 430, 'listedCount': 0, 'mediaCount': 45, 'location': 'Per√∫', 'protected': False, 'linkUrl': 'https://www.instagram.com/geryruiz08/', 'linkTcourl': 'https://t.co/onnnjXqgfN', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/988141856834965504/9QB7bp91_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/159964181/1523233254', 'url': 'https://twitter.com/geryruiz08'}",geryruiz08,34,122
2,2020-11-13,"@Yapa_qu399 @CharitoABC @PoliciaPeru @MininterPeru @pcmperu @MindefPeru @LucianoRevoredo @abeja_peru No, en provincia, todo tranquilo y la polic√≠a no fue violenta. Los manifestantes se fueron a casa temprano y ya. Solo en Lima hicieron vandalismo. Vean c√≥mo quedaron las calles llenas de piedras, vidrios rotos, cajeros vandalizados, monumentos pintarrajeados. Delincuentes!",1327398865268568064,[],0,1,0,0,1327258852652442112,es,,,"{'username': 'Yolimalintzin', 'displayname': 'Yolimalintzin', 'id': 2249728525, 'description': '#TraditionalCatholic #Pachamama is idolatry #ProLife #VOX_es #MAGA #Patriots #Communism=misery & chaos. Stop #GenderIdeology', 'rawDescription': '#TraditionalCatholic #Pachamama is idolatry #ProLife #VOX_es #MAGA #Patriots #Communism=misery & chaos. Stop #GenderIdeology', 'descriptionUrls': [], 'verified': False, 'created': '2013-12-17T03:21:15+00:00', 'followersCount': 1818, 'friendsCount': 2021, 'statusesCount': 27647, 'favouritesCount': 43692, 'listedCount': 2, 'mediaCount': 1035, 'location': '', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1368570331921793025/OIjUynOC_normal.jpg', 'profileBannerUrl': None, 'url': 'https://twitter.com/Yolimalintzin'}",Yolimalintzin,1818,2021
3,2020-11-13,Expl√≠queme porque la polic√≠a camina a su lado y en el centro de lima nos cogen a pedrones y gases https://t.co/ZMJwIns82R,1327396636809712128,['https://twitter.com/postmoderngrrl/status/1327364631229321221'],0,0,0,0,1327396636809712128,es,,"{'url': 'https://twitter.com/postmoderngrrl/status/1327364631229321221', 'date': '2020-11-13T21:36:03+00:00', 'content': 'Manifestantes en LA MOLINA marchando ahora mismo en el Molina Plaza de la Av. Ra√∫l Ferrero.\n\n#PeruVsChile \n#MerinoNoMeRepresenta \n#MerinoNoEsMiPresidente \n#GabineteGolpista \n#MarchaPer√∫ https://t.co/rxDggL6kko', 'renderedContent': 'Manifestantes en LA MOLINA marchando ahora mismo en el Molina Plaza de la Av. Ra√∫l Ferrero.\n\n#PeruVsChile \n#MerinoNoMeRepresenta \n#MerinoNoEsMiPresidente \n#GabineteGolpista \n#MarchaPer√∫ https://t.co/rxDggL6kko', 'id': 1327364631229321221, 'user': {'username': 'postmoderngrrl', 'displayname': 'üíöJP13 y JP5‚ù§Ô∏è', 'id': 100561404, 'description': 'üå∏ intentando ser dulce conmigo y demostrar apertura | she/her/ella üå∫', 'rawDescription': 'üå∏ intentando ser dulce conmigo y demostrar apertura | she/her/ella üå∫', 'descriptionUrls': [], 'verified': False, 'created': '2009-12-30T18:17:50+00:00', 'followersCount': 324, 'friendsCount': 193, 'statusesCount': 72479, 'favouritesCount': 29276, 'listedCount': 8, 'mediaCount': 1686, 'location': 'Peru', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1331600170509881344/OOcrIqzb_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/100561404/1597810927', 'url': 'https://twitter.com/postmoderngrrl'}, 'outlinks': [], 'tcooutlinks': [], 'replyCount': 14, 'retweetCount': 308, 'likeCount': 735, 'quoteCount': 76, 'conversationId': 1327364631229321221, 'lang': 'es', 'source': '<a href=""https://mobile.twitter.com"" rel=""nofollow"">Twitter Web App</a>', 'sourceUrl': 'https://mobile.twitter.com', 'sourceLabel': 'Twitter Web App', 'media': [{'thumbnailUrl': 'https://pbs.twimg.com/ext_tw_video_thumb/1327364204442087424/pu/img/Em3mT7DtV89VLB5W.jpg', 'variants': [{'contentType': 'video/mp4', 'url': 'https://video.twimg.com/ext_tw_video/1327364204442087424/pu/vid/848x480/TTd3uTrkstiWRGvX.mp4?tag=10', 'bitrate': 2176000}, {'contentType': 'video/mp4', 'url': 'https://video.twimg.com/ext_tw_video/1327364204442087424/pu/vid/476x270/uGo0lZa4aounA5EH.mp4?tag=10', 'bitrate': 256000}, {'contentType': 'video/mp4', 'url': 'https://video.twimg.com/ext_tw_video/1327364204442087424/pu/vid/636x360/RChdQ_JEC1-APly5.mp4?tag=10', 'bitrate': 832000}, {'contentType': 'application/x-mpegURL', 'url': 'https://video.twimg.com/ext_tw_video/1327364204442087424/pu/pl/Rx-R4wTa34LGPnOr.m3u8?tag=10', 'bitrate': None}], 'duration': 45.398, 'type': 'video'}], 'retweetedTweet': None, 'quotedTweet': None, 'mentionedUsers': None}","{'username': 'ambra_1D_26', 'displayname': 'its.me', 'id': 2288884901, 'description': 'Buena m√∫sica con buenos libros bajo una noche estrellada es mi idea de perfecci√≥n.', 'rawDescription': 'Buena m√∫sica con buenos libros bajo una noche estrellada es mi idea de perfecci√≥n.', 'descriptionUrls': [], 'verified': False, 'created': '2014-01-17T23:08:37+00:00', 'followersCount': 917, 'friendsCount': 1482, 'statusesCount': 27623, 'favouritesCount': 9005, 'listedCount': 17, 'mediaCount': 155, 'location': 'Countrie- World', 'protected': False, 'linkUrl': None, 'linkTcourl': None, 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1354587126122344452/QxuwYsH9_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/2288884901/1481411696', 'url': 'https://twitter.com/ambra_1D_26'}",ambra_1D_26,917,1482
4,2020-11-13,"La Polic√≠a peruana est√° tras los pasos de la 'chama' Johanna Rodr√≠guez, quien habr√≠a robado 100.000 soles (unos 30.000 d√≥lares) a un hombre de 67 a√±os en Lima. https://t.co/N3I9yagZ3O",1327396298102862080,['http://ht.ly/htjX30rjXo9'],1,3,9,1,1327396298102862080,es,,,"{'username': 'DiarioExtraEc', 'displayname': 'Diario Extra', 'id': 175447500, 'description': 'Cuenta oficial de Diario Extra. Siempre inform√°ndote primero y mejor.', 'rawDescription': 'Cuenta oficial de Diario Extra. Siempre inform√°ndote primero y mejor.', 'descriptionUrls': [], 'verified': False, 'created': '2010-08-06T16:48:47+00:00', 'followersCount': 199830, 'friendsCount': 350, 'statusesCount': 152937, 'favouritesCount': 1327, 'listedCount': 617, 'mediaCount': 76271, 'location': 'Guayaquil, Ecuador', 'protected': False, 'linkUrl': 'http://extra.ec/', 'linkTcourl': 'http://t.co/9bvW2Tlsom', 'profileImageUrl': 'https://pbs.twimg.com/profile_images/1369327702096936965/_Crwpd0T_normal.jpg', 'profileBannerUrl': 'https://pbs.twimg.com/profile_banners/175447500/1616464486', 'url': 'https://twitter.com/DiarioExtraEc'}",DiarioExtraEc,199830,350


0


8

In [41]:
stats

[['data/raw_data\\brasilEvento3.xlsx', 118026, 30896, 77035, 0],
 ['data/raw_data\\colombiaEvento1.xlsx', 241812, 74388, 299236, 0],
 ['data/raw_data\\colombiaEvento2.xlsx', 406395, 68444, 293559, 0],
 ['data/raw_data\\colombiaEvento3.xlsx', 444270, 58768, 199960, 0],
 ['data/raw_data\\ecuadorEvento1.xlsx', 156768, 34702, 178861, 0],
 ['data/raw_data\\ecuadorEvento2.xlsx', 204141, 36157, 207256, 0],
 ['data/raw_data\\peruEvento1.xlsx', 98730, 44464, 249682, 0],
 ['data/raw_data\\peruEvento3.xlsx', 138416, 27061, 173650, 0]]