# An√°lise
Script para limpar e categorizar a base de dados de tweets. Ao final, o programa salva arquivos `.csv` com os valores de frequ√™ncia de uso e "unicidade" para cada palavra dos candidatos.

In [1]:
import glob
import pandas as pd
import numpy as np
import string
import re

In [2]:
# L√™ os arquivos
files = glob.glob('../data/bases-completas/*.csv')

In [3]:
# Cria um dataframe vazio e adiciona os arquivos de cada candidato
columns = ['id', 'datetime', 'created_at', 'text', 'file', 'twitter_handle']
df = pd.DataFrame(columns=columns)

In [4]:
# Junta todos os csvs em um √∫nico dataframe
for file in files:
    temp_df = pd.read_csv(file)
    temp_df['file'] = file
    temp_df['twitter_handle'] = temp_df.file.str.extract('../data/bases-completas/(\w+).csv')
    df = df.append(temp_df)
    df = df.reset_index().drop('index', axis=1) # Cria √≠ndices √∫nicos

  """


In [5]:
# Transforma a coluna datetime em objeto temporal
df.datetime = pd.to_datetime(df.datetime, format="%Y-%m-%d %H:%M:%S")
# Mant√©m apenas os que n√£o s√£o RT
df = df[~df.text.str.startswith("RT")]
# Pega apenas tweets a partir de 27-09-2017 - data a partir da qual temos tweets de todos os candidatos
df = df[df.datetime >= pd.to_datetime("2017-09-28 00:00:00", format="%Y-%m-%d %H:%M:%S")]
# Derrupa duplicatas retornadas eventualmente pela api do twitter
df = df.drop_duplicates()

In [6]:
# Captura os nomes reais de cada candidato
def get_names(row):
    if row.twitter_handle == 'cirogomes':
        name = 'Ciro Gomes'
    if row.twitter_handle == 'collor':
        name = 'Fernando Collor'
    if row.twitter_handle == 'geraldoalckmin':
        name = 'Geraldo Alckmin'
    if row.twitter_handle == 'GuilhermeBoulos':
        name = 'Guilherme Boulos'
    if row.twitter_handle == 'jairbolsonaro':
        name = 'Jair Bolsonaro'
    if row.twitter_handle == 'joaoamoedonovo':
        name = 'Jo√£o Amoedo'
    if row.twitter_handle == 'lulapelobrasil':
        name = 'Lula'
    if (row.twitter_handle == 'ManuelaDavila') or (row.twitter_handle == 'manudeputada'):
        name = "Manuela d'√Åvila"
    if row.twitter_handle == 'RodrigoMaia':
        name = 'Rodrigo Maia'
    if row.twitter_handle == 'silva_marina':
        name = 'Marina Silva'
    if row.twitter_handle == 'MichelTemer':
        name = 'Michel Temer'
    if row.twitter_handle == 'alvarodias_':
        name = '√Ålvaro Dias'
    if row.twitter_handle == 'jaqueswagner':
        name = 'Jaques Wagner'
    if row.twitter_handle == 'Haddad_Fernando':
        name = 'Fernando Haddad'
    if row.twitter_handle == 'meirelles':
        name = 'Henrique Meirelles'
    if row.twitter_handle == 'joaquimboficial':
        name = 'Joaquim Barbosa'
        
    return pd.Series({'name':name})

df['name'] = df.apply(get_names, axis=1)

In [7]:
# Salva o df com todos os tweets a partir da data de an√°lise para um arquivo
# Esse arquivo ser√° usado para mostrar os tweets na visualiza√ß√£o
df.to_csv('../data/bases-recorte-temporal/todos-candidatos.csv', index=False)

In [8]:
# Cria v√°rios dataframes diferentes, um para os tweets de cada candidato
lula = df[df.name=='Lula']
ciro = df[df.name=='Ciro Gomes']
bolsonaro = df[df.name=='Jair Bolsonaro']
marina = df[df.name=='Marina Silva']
alckmin = df[df.name=='Geraldo Alckmin']
temer = df[df.name=='Michel Temer']
maia = df[df.name=='Rodrigo Maia']
collor = df[df.name=='Fernando Collor']
amoedo = df[df.name=='Jo√£o Amoedo']
boulos = df[df.name=='Guilherme Boulos']
manuela = df[df.name=="Manuela d'√Åvila"]
alvaro = df[df.name=="√Ålvaro Dias"]
wagner = df[df.name=="Jaques Wagner"]
haddad = df[df.name=="Fernando Haddad"]
meirelles = df[df.name=="Henrique Meirelles"]
joaquim = df[df.name=="Joaquim Barbosa"]

In [9]:
# Salva o df com todos os tweets a partir da data de an√°lise para um arquivo .csv
# Esse arquivo ser√° usado para mostrar os tweets na visualiza√ß√£o
lula.to_csv('../data/bases-recorte-temporal/lula.csv', index=False)
ciro.to_csv('../data/bases-recorte-temporal/ciro.csv', index=False)
bolsonaro.to_csv('../data/bases-recorte-temporal/bolsonaro.csv', index=False)
marina.to_csv('../data/bases-recorte-temporal/marina.csv', index=False)
alckmin.to_csv('../data/bases-recorte-temporal/alckmin.csv', index=False)
temer.to_csv('../data/bases-recorte-temporal/temer.csv', index=False)
maia.to_csv('../data/bases-recorte-temporal/maia.csv', index=False)
collor.to_csv('../data/bases-recorte-temporal/collor.csv', index=False)
amoedo.to_csv('../data/bases-recorte-temporal/amoedo.csv', index=False)
boulos.to_csv('../data/bases-recorte-temporal/boulos.csv', index=False)
manuela.to_csv('../data/bases-recorte-temporal/manuela.csv', index=False)
alvaro.to_csv('../data/bases-recorte-temporal/alvaro.csv', index=False)
wagner.to_csv('../data/bases-recorte-temporal/wagner.csv', index=False)
haddad.to_csv('../data/bases-recorte-temporal/haddad.csv', index=False)
meirelles.to_csv('../data/bases-recorte-temporal/meirelles.csv', index=False)
joaquim.to_csv('../data/bases-recorte-temporal/joaquim.csv', index=False)

In [10]:
emojistring = '''üòÄ üòÅ üòÇ ü§£ üòÉ üòÑ üòÖ üòÜ üòâ üòä üòã üòé üòç üòò üòó üòô üòö ‚ò∫Ô∏è üôÇ ü§ó ü§© ü§î ü§® üòê üòë üò∂ üôÑ üòè üò£ üò• üòÆ ü§ê üòØ üò™ üò´ üò¥ üòå üòõ üòú üòù ü§§ üòí üòì üòî üòï üôÉ ü§ë üò≤ ‚òπÔ∏è üôÅ üòñ üòû üòü üò§ üò¢ üò≠ üò¶ üòß üò® üò© ü§Ø üò¨ üò∞ üò± üò≥ ü§™ üòµ üò° üò† ü§¨ üò∑ ü§í ü§ï ü§¢ ü§Æ ü§ß üòá ü§† ü§° ü§• ü§´ ü§≠ üßê ü§ì üòà üëø üëπ üë∫ üíÄ üëª üëΩ ü§ñ üí© üò∫ üò∏ üòπ üòª üòº üòΩ üôÄ üòø üòæ
üë∂ üë¶ üëß üë® üë© üë¥ üëµ üë®‚Äç‚öïÔ∏è üë©‚Äç‚öïÔ∏è üë®‚Äçüéì üë©‚Äçüéì üë®‚Äç‚öñÔ∏è üë©‚Äç‚öñÔ∏è üë®‚Äçüåæ üë©‚Äçüåæ üë®‚Äçüç≥ üë©‚Äçüç≥ üë®‚Äçüîß üë©‚Äçüîß üë®‚Äçüè≠ üë©‚Äçüè≠ üë®‚Äçüíº üë©‚Äçüíº üë®‚Äçüî¨ üë©‚Äçüî¨ üë®‚Äçüíª üë©‚Äçüíª üë®‚Äçüé§ üë©‚Äçüé§ üë®‚Äçüé® üë©‚Äçüé® üë®‚Äç‚úàÔ∏è üë©‚Äç‚úàÔ∏è üë®‚ÄçüöÄ üë©‚ÄçüöÄ üë®‚Äçüöí üë©‚Äçüöí üëÆ üëÆ‚Äç‚ôÇÔ∏è üëÆ‚Äç‚ôÄÔ∏è üïµ üïµÔ∏è‚Äç‚ôÇÔ∏è üïµÔ∏è‚Äç‚ôÄÔ∏è üíÇ üíÇ‚Äç‚ôÇÔ∏è üíÇ‚Äç‚ôÄÔ∏è üë∑ üë∑‚Äç‚ôÇÔ∏è üë∑‚Äç‚ôÄÔ∏è ü§¥ üë∏ üë≥ üë≥‚Äç‚ôÇÔ∏è üë≥‚Äç‚ôÄÔ∏è üë≤ üßï üßî üë± üë±‚Äç‚ôÇÔ∏è üë±‚Äç‚ôÄÔ∏è ü§µ üë∞ ü§∞ ü§± üëº üéÖ ü§∂ üßô‚Äç‚ôÄÔ∏è üßô‚Äç‚ôÇÔ∏è üßö‚Äç‚ôÄÔ∏è üßö‚Äç‚ôÇÔ∏è üßõ‚Äç‚ôÄÔ∏è üßõ‚Äç‚ôÇÔ∏è üßú‚Äç‚ôÄÔ∏è üßú‚Äç‚ôÇÔ∏è üßù‚Äç‚ôÄÔ∏è üßù‚Äç‚ôÇÔ∏è üßû‚Äç‚ôÄÔ∏è üßû‚Äç‚ôÇÔ∏è üßü‚Äç‚ôÄÔ∏è üßü‚Äç‚ôÇÔ∏è üôç üôç‚Äç‚ôÇÔ∏è üôç‚Äç‚ôÄÔ∏è üôé üôé‚Äç‚ôÇÔ∏è üôé‚Äç‚ôÄÔ∏è üôÖ üôÖ‚Äç‚ôÇÔ∏è üôÖ‚Äç‚ôÄÔ∏è üôÜ üôÜ‚Äç‚ôÇÔ∏è üôÜ‚Äç‚ôÄÔ∏è üíÅ üíÅ‚Äç‚ôÇÔ∏è üíÅ‚Äç‚ôÄÔ∏è üôã üôã‚Äç‚ôÇÔ∏è üôã‚Äç‚ôÄÔ∏è üôá üôá‚Äç‚ôÇÔ∏è üôá‚Äç‚ôÄÔ∏è ü§¶ ü§¶‚Äç‚ôÇÔ∏è ü§¶‚Äç‚ôÄÔ∏è ü§∑ ü§∑‚Äç‚ôÇÔ∏è ü§∑‚Äç‚ôÄÔ∏è üíÜ üíÜ‚Äç‚ôÇÔ∏è üíÜ‚Äç‚ôÄÔ∏è üíá üíá‚Äç‚ôÇÔ∏è üíá‚Äç‚ôÄÔ∏è üö∂ üö∂‚Äç‚ôÇÔ∏è üö∂‚Äç‚ôÄÔ∏è üèÉ üèÉ‚Äç‚ôÇÔ∏è üèÉ‚Äç‚ôÄÔ∏è üíÉ üï∫ üëØ üëØ‚Äç‚ôÇÔ∏è üëØ‚Äç‚ôÄÔ∏è üßñ‚Äç‚ôÄÔ∏è üßñ‚Äç‚ôÇÔ∏è üï¥ üó£ üë§ üë• üë´ üë¨ üë≠ üíè üë®‚Äç‚ù§Ô∏è‚Äçüíã‚Äçüë® üë©‚Äç‚ù§Ô∏è‚Äçüíã‚Äçüë© üíë üë®‚Äç‚ù§Ô∏è‚Äçüë® üë©‚Äç‚ù§Ô∏è‚Äçüë© üë™ üë®‚Äçüë©‚Äçüë¶ üë®‚Äçüë©‚Äçüëß üë®‚Äçüë©‚Äçüëß‚Äçüë¶ üë®‚Äçüë©‚Äçüë¶‚Äçüë¶ üë®‚Äçüë©‚Äçüëß‚Äçüëß üë®‚Äçüë®‚Äçüë¶ üë®‚Äçüë®‚Äçüëß üë®‚Äçüë®‚Äçüëß‚Äçüë¶ üë®‚Äçüë®‚Äçüë¶‚Äçüë¶ üë®‚Äçüë®‚Äçüëß‚Äçüëß üë©‚Äçüë©‚Äçüë¶ üë©‚Äçüë©‚Äçüëß üë©‚Äçüë©‚Äçüëß‚Äçüë¶ üë©‚Äçüë©‚Äçüë¶‚Äçüë¶ üë©‚Äçüë©‚Äçüëß‚Äçüëß üë®‚Äçüë¶ üë®‚Äçüë¶‚Äçüë¶ üë®‚Äçüëß üë®‚Äçüëß‚Äçüë¶ üë®‚Äçüëß‚Äçüëß üë©‚Äçüë¶ üë©‚Äçüë¶‚Äçüë¶ üë©‚Äçüëß üë©‚Äçüëß‚Äçüë¶ üë©‚Äçüëß‚Äçüëß ü§≥ üí™ üëà üëâ ‚òùÔ∏è üëÜ üñï üëá ‚úåÔ∏è ü§û üññ ü§ò üñê ‚úã üëå üëç üëé ‚úä üëä ü§õ ü§ú ü§ö üëã ü§ü ‚úçÔ∏è üëè üëê üôå ü§≤ üôè ü§ù üíÖ üëÇ üëÉ üë£ üëÄ üëÅ üß† üëÖ üëÑ üíã

üëì üï∂ üëî üëï üëñ üß£ üß§ üß• üß¶ üëó üëò üëô üëö üëõ üëú üëù üéí üëû üëü üë† üë° üë¢ üëë üëí üé© üéì üß¢ ‚õë üíÑ üíç üåÇ üíº
üëêüèª üôåüèª üëèüèª üôèüèª üëçüèª üëéüèª üëäüèª ‚úäüèª ü§õüèª ü§úüèª ü§ûüèª ‚úåüèª ü§òüèª üëåüèª üëàüèª üëâüèª üëÜüèª üëáüèª ‚òùüèª ‚úãüèª ü§öüèª üñêüèª üññüèª üëãüèª ü§ôüèª üí™üèª üñïüèª ‚úçüèª ü§≥üèª üíÖüèª üëÇüèª üëÉüèª üë∂üèª üë¶üèª üëßüèª üë®üèª üë©üèª üë±üèª‚Äç‚ôÄÔ∏è üë±üèª üë¥üèª üëµüèª üë≤üèª üë≥üèª‚Äç‚ôÄÔ∏è üë≥üèª üëÆüèª‚Äç‚ôÄÔ∏è üëÆüèª üë∑üèª‚Äç‚ôÄÔ∏è üë∑üèª üíÇüèª‚Äç‚ôÄÔ∏è üíÇüèª üïµüèª‚Äç‚ôÄÔ∏è üïµüèª üë©üèª‚Äç‚öïÔ∏è üë®üèª‚Äç‚öïÔ∏è üë©üèª‚Äçüåæ üë®üèª‚Äçüåæ üë©üèª‚Äçüç≥ üë®üèª‚Äçüç≥ üë©üèª‚Äçüéì üë®üèª‚Äçüéì üë©üèª‚Äçüé§ üë®üèª‚Äçüé§ üë©üèª‚Äçüè´ üë®üèª‚Äçüè´ üë©üèª‚Äçüè≠ üë®üèª‚Äçüè≠ üë©üèª‚Äçüíª üë®üèª‚Äçüíª üë©üèª‚Äçüíº üë®üèª‚Äçüíº üë©üèª‚Äçüîß üë®üèª‚Äçüîß üë©üèª‚Äçüî¨ üë®üèª‚Äçüî¨ üë©üèª‚Äçüé® üë®üèª‚Äçüé® üë©üèª‚Äçüöí üë®üèª‚Äçüöí üë©üèª‚Äç‚úàÔ∏è üë®üèª‚Äç‚úàÔ∏è üë©üèª‚ÄçüöÄ üë®üèª‚ÄçüöÄ üë©üèª‚Äç‚öñÔ∏è üë®üèª‚Äç‚öñÔ∏è ü§∂üèª üéÖüèª üë∏üèª ü§¥üèª üë∞üèª ü§µüèª üëºüèª ü§∞üèª üôáüèª‚Äç‚ôÄÔ∏è üôáüèª üíÅüèª üíÅüèª‚Äç‚ôÇÔ∏è üôÖüèª üôÖüèª‚Äç‚ôÇÔ∏è üôÜüèª üôÜüèª‚Äç‚ôÇÔ∏è üôãüèª üôãüèª‚Äç‚ôÇÔ∏è ü§¶üèª‚Äç‚ôÄÔ∏è ü§¶üèª‚Äç‚ôÇÔ∏è ü§∑üèª‚Äç‚ôÄÔ∏è ü§∑üèª‚Äç‚ôÇÔ∏è üôéüèª üôéüèª‚Äç‚ôÇÔ∏è üôçüèª üôçüèª‚Äç‚ôÇÔ∏è üíáüèª üíáüèª‚Äç‚ôÇÔ∏è üíÜüèª üíÜüèª‚Äç‚ôÇÔ∏è üï¥üèª üíÉüèª üï∫üèª üö∂üèª‚Äç‚ôÄÔ∏è üö∂üèª üèÉüèª‚Äç‚ôÄÔ∏è üèÉüèª üèãüèª‚Äç‚ôÄÔ∏è üèãüèª ü§∏üèª‚Äç‚ôÄÔ∏è ü§∏üèª‚Äç‚ôÇÔ∏è ‚õπüèª‚Äç‚ôÄÔ∏è ‚õπüèª ü§æüèª‚Äç‚ôÄÔ∏è ü§æüèª‚Äç‚ôÇÔ∏è üèåüèª‚Äç‚ôÄÔ∏è üèåüèª üèÑüèª‚Äç‚ôÄÔ∏è üèÑüèª üèäüèª‚Äç‚ôÄÔ∏è üèäüèª ü§Ωüèª‚Äç‚ôÄÔ∏è ü§Ωüèª‚Äç‚ôÇÔ∏è üö£üèª‚Äç‚ôÄÔ∏è üö£üèª üèáüèª üö¥üèª‚Äç‚ôÄÔ∏è üö¥üèª üöµüèª‚Äç‚ôÄÔ∏è üöµüèª ü§πüèª‚Äç‚ôÄÔ∏è ü§πüèª‚Äç‚ôÇÔ∏è üõÄüèª

üëêüèº üôåüèº üëèüèº üôèüèº üëçüèº üëéüèº üëäüèº ‚úäüèº ü§õüèº ü§úüèº ü§ûüèº ‚úåüèº ü§òüèº üëåüèº üëàüèº üëâüèº üëÜüèº üëáüèº ‚òùüèº ‚úãüèº ü§öüèº üñêüèº üññüèº üëãüèº ü§ôüèº üí™üèº üñïüèº ‚úçüèº ü§≥üèº üíÖüèº üëÇüèº üëÉüèº üë∂üèº üë¶üèº üëßüèº üë®üèº üë©üèº üë±üèº‚Äç‚ôÄÔ∏è üë±üèº üë¥üèº üëµüèº üë≤üèº üë≥üèº‚Äç‚ôÄÔ∏è üë≥üèº üëÆüèº‚Äç‚ôÄÔ∏è üëÆüèº üë∑üèº‚Äç‚ôÄÔ∏è üë∑üèº üíÇüèº‚Äç‚ôÄÔ∏è üíÇüèº üïµüèº‚Äç‚ôÄÔ∏è üïµüèº üë©üèº‚Äç‚öïÔ∏è üë®üèº‚Äç‚öïÔ∏è üë©üèº‚Äçüåæ üë®üèº‚Äçüåæ üë©üèº‚Äçüç≥ üë®üèº‚Äçüç≥ üë©üèº‚Äçüéì üë®üèº‚Äçüéì üë©üèº‚Äçüé§ üë®üèº‚Äçüé§ üë©üèº‚Äçüè´ üë®üèº‚Äçüè´ üë©üèº‚Äçüè≠ üë®üèº‚Äçüè≠ üë©üèº‚Äçüíª üë®üèº‚Äçüíª üë©üèº‚Äçüíº üë®üèº‚Äçüíº üë©üèº‚Äçüîß üë®üèº‚Äçüîß üë©üèº‚Äçüî¨ üë®üèº‚Äçüî¨ üë©üèº‚Äçüé® üë®üèº‚Äçüé® üë©üèº‚Äçüöí üë®üèº‚Äçüöí üë©üèº‚Äç‚úàÔ∏è üë®üèº‚Äç‚úàÔ∏è üë©üèº‚ÄçüöÄ üë®üèº‚ÄçüöÄ üë©üèº‚Äç‚öñÔ∏è üë®üèº‚Äç‚öñÔ∏è ü§∂üèº üéÖüèº üë∏üèº ü§¥üèº üë∞üèº ü§µüèº üëºüèº ü§∞üèº üôáüèº‚Äç‚ôÄÔ∏è üôáüèº üíÅüèº üíÅüèº‚Äç‚ôÇÔ∏è üôÖüèº üôÖüèº‚Äç‚ôÇÔ∏è üôÜüèº üôÜüèº‚Äç‚ôÇÔ∏è üôãüèº üôãüèº‚Äç‚ôÇÔ∏è ü§¶üèº‚Äç‚ôÄÔ∏è ü§¶üèº‚Äç‚ôÇÔ∏è ü§∑üèº‚Äç‚ôÄÔ∏è ü§∑üèº‚Äç‚ôÇÔ∏è üôéüèº üôéüèº‚Äç‚ôÇÔ∏è üôçüèº üôçüèº‚Äç‚ôÇÔ∏è üíáüèº üíáüèº‚Äç‚ôÇÔ∏è üíÜüèº üíÜüèº‚Äç‚ôÇÔ∏è üï¥üèº üíÉüèº üï∫üèº üö∂üèº‚Äç‚ôÄÔ∏è üö∂üèº üèÉüèº‚Äç‚ôÄÔ∏è üèÉüèº üèãüèº‚Äç‚ôÄÔ∏è üèãüèº ü§∏üèº‚Äç‚ôÄÔ∏è ü§∏üèº‚Äç‚ôÇÔ∏è ‚õπüèº‚Äç‚ôÄÔ∏è ‚õπüèº ü§æüèº‚Äç‚ôÄÔ∏è ü§æüèº‚Äç‚ôÇÔ∏è üèåüèº‚Äç‚ôÄÔ∏è üèåüèº üèÑüèº‚Äç‚ôÄÔ∏è üèÑüèº üèäüèº‚Äç‚ôÄÔ∏è üèäüèº ü§Ωüèº‚Äç‚ôÄÔ∏è ü§Ωüèº‚Äç‚ôÇÔ∏è üö£üèº‚Äç‚ôÄÔ∏è üö£üèº üèáüèº üö¥üèº‚Äç‚ôÄÔ∏è üö¥üèº üöµüèº‚Äç‚ôÄÔ∏è üöµüèª ü§πüèº‚Äç‚ôÄÔ∏è ü§πüèº‚Äç‚ôÇÔ∏è üõÄüèº

üëêüèΩ üôåüèΩ üëèüèΩ üôèüèΩ üëçüèΩ üëéüèΩ üëäüèΩ ‚úäüèΩ ü§õüèΩ ü§úüèΩ ü§ûüèΩ ‚úåüèΩ ü§òüèΩ üëåüèΩ üëàüèΩ üëâüèΩ üëÜüèΩ üëáüèΩ ‚òùüèΩ ‚úãüèΩ ü§öüèΩ üñêüèΩ üññüèΩ üëãüèΩ ü§ôüèΩ üí™üèΩ üñïüèΩ ‚úçüèΩ ü§≥üèΩ üíÖüèΩ üëÇüèΩ üëÉüèΩ üë∂üèΩ üë¶üèΩ üëßüèΩ üë®üèΩ üë©üèΩ üë±üèΩ‚Äç‚ôÄÔ∏è üë±üèΩ üë¥üèΩ üëµüèΩ üë≤üèΩ üë≥üèΩ‚Äç‚ôÄÔ∏è üë≥üèΩ üëÆüèΩ‚Äç‚ôÄÔ∏è üëÆüèΩ üë∑üèΩ‚Äç‚ôÄÔ∏è üë∑üèΩ üíÇüèΩ‚Äç‚ôÄÔ∏è üíÇüèΩ üïµüèΩ‚Äç‚ôÄÔ∏è üïµüèΩ üë©üèΩ‚Äç‚öïÔ∏è üë®üèΩ‚Äç‚öïÔ∏è üë©üèΩ‚Äçüåæ üë®üèΩ‚Äçüåæ üë©üèΩ‚Äçüç≥ üë®üèΩ‚Äçüç≥ üë©üèΩ‚Äçüéì üë®üèΩ‚Äçüéì üë©üèΩ‚Äçüé§ üë®üèΩ‚Äçüé§ üë©üèΩ‚Äçüè´ üë®üèΩ‚Äçüè´ üë©üèΩ‚Äçüè≠ üë®üèΩ‚Äçüè≠ üë©üèΩ‚Äçüíª üë®üèΩ‚Äçüíª üë©üèΩ‚Äçüíº üë®üèΩ‚Äçüíº üë©üèΩ‚Äçüîß üë®üèΩ‚Äçüîß üë©üèΩ‚Äçüî¨ üë®üèΩ‚Äçüî¨ üë©üèΩ‚Äçüé® üë®üèΩ‚Äçüé® üë©üèΩ‚Äçüöí üë®üèΩ‚Äçüöí üë©üèΩ‚Äç‚úàÔ∏è üë®üèΩ‚Äç‚úàÔ∏è üë©üèΩ‚ÄçüöÄ üë®üèΩ‚ÄçüöÄ üë©üèΩ‚Äç‚öñÔ∏è üë®üèΩ‚Äç‚öñÔ∏è ü§∂üèΩ üéÖüèΩ üë∏üèΩ ü§¥üèΩ üë∞üèΩ ü§µüèΩ üëºüèΩ ü§∞üèΩ üôáüèΩ‚Äç‚ôÄÔ∏è üôáüèΩ üíÅüèΩ üíÅüèΩ‚Äç‚ôÇÔ∏è üôÖüèΩ üôÖüèΩ‚Äç‚ôÇÔ∏è üôÜüèΩ üôÜüèΩ‚Äç‚ôÇÔ∏è üôãüèΩ üôãüèΩ‚Äç‚ôÇÔ∏è ü§¶üèΩ‚Äç‚ôÄÔ∏è ü§¶üèΩ‚Äç‚ôÇÔ∏è ü§∑üèΩ‚Äç‚ôÄÔ∏è ü§∑üèΩ‚Äç‚ôÇÔ∏è üôéüèΩ üôéüèΩ‚Äç‚ôÇÔ∏è üôçüèΩ üôçüèΩ‚Äç‚ôÇÔ∏è üíáüèΩ üíáüèΩ‚Äç‚ôÇÔ∏è üíÜüèΩ üíÜüèΩ‚Äç‚ôÇÔ∏è üï¥üèº üíÉüèΩ üï∫üèΩ üö∂üèΩ‚Äç‚ôÄÔ∏è üö∂üèΩ üèÉüèΩ‚Äç‚ôÄÔ∏è üèÉüèΩ üèãüèΩ‚Äç‚ôÄÔ∏è üèãüèΩ ü§∏üèΩ‚Äç‚ôÄÔ∏è ü§∏üèΩ‚Äç‚ôÇÔ∏è ‚õπüèΩ‚Äç‚ôÄÔ∏è ‚õπüèΩ ü§æüèΩ‚Äç‚ôÄÔ∏è ü§æüèΩ‚Äç‚ôÇÔ∏è üèåüèΩ‚Äç‚ôÄÔ∏è üèåüèΩ üèÑüèΩ‚Äç‚ôÄÔ∏è üèÑüèΩ üèäüèΩ‚Äç‚ôÄÔ∏è üèäüèΩ ü§ΩüèΩ‚Äç‚ôÄÔ∏è ü§ΩüèΩ‚Äç‚ôÇÔ∏è üö£üèΩ‚Äç‚ôÄÔ∏è üö£üèΩ üèáüèΩ üö¥üèΩ‚Äç‚ôÄÔ∏è üö¥üèΩ üöµüèΩ‚Äç‚ôÄÔ∏è üöµüèΩ ü§πüèΩ‚Äç‚ôÄÔ∏è ü§πüèΩ‚Äç‚ôÇÔ∏è üõÄüèΩ

üëêüèæ üôåüèæ üëèüèæ üôèüèæ üëçüèæ üëéüèæ üëäüèæ ‚úäüèæ ü§õüèæ ü§úüèæ ü§ûüèæ ‚úåüèæ ü§òüèæ üëåüèæ üëàüèæ üëâüèæ üëÜüèæ üëáüèæ ‚òùüèæ ‚úãüèæ ü§öüèæ üñêüèæ üññüèæ üëãüèæ ü§ôüèæ üí™üèæ üñïüèæ ‚úçüèæ ü§≥üèæ üíÖüèæ üëÇüèæ üëÉüèæ üë∂üèæ üë¶üèæ üëßüèæ üë®üèæ üë©üèæ üë±üèæ‚Äç‚ôÄÔ∏è üë±üèæ üë¥üèæ üëµüèæ üë≤üèæ üë≥üèæ‚Äç‚ôÄÔ∏è üë≥üèæ üëÆüèæ‚Äç‚ôÄÔ∏è üëÆüèæ üë∑üèæ‚Äç‚ôÄÔ∏è üë∑üèæ üíÇüèæ‚Äç‚ôÄÔ∏è üíÇüèæ üïµüèæ‚Äç‚ôÄÔ∏è üïµüèæ üë©üèæ‚Äç‚öïÔ∏è üë®üèæ‚Äç‚öïÔ∏è üë©üèæ‚Äçüåæ üë®üèæ‚Äçüåæ üë©üèæ‚Äçüç≥ üë®üèæ‚Äçüç≥ üë©üèæ‚Äçüéì üë®üèæ‚Äçüéì üë©üèæ‚Äçüé§ üë®üèæ‚Äçüé§ üë©üèæ‚Äçüè´ üë®üèæ‚Äçüè´ üë©üèæ‚Äçüè≠ üë®üèæ‚Äçüè≠ üë©üèæ‚Äçüíª üë®üèæ‚Äçüíª üë©üèæ‚Äçüíº üë®üèæ‚Äçüíº üë©üèæ‚Äçüîß üë®üèæ‚Äçüîß üë©üèæ‚Äçüî¨ üë®üèæ‚Äçüî¨ üë©üèæ‚Äçüé® üë®üèæ‚Äçüé® üë©üèæ‚Äçüöí üë®üèæ‚Äçüöí üë©üèæ‚Äç‚úàÔ∏è üë®üèæ‚Äç‚úàÔ∏è üë©üèæ‚ÄçüöÄ üë®üèæ‚ÄçüöÄ üë©üèæ‚Äç‚öñÔ∏è üë®üèæ‚Äç‚öñÔ∏è ü§∂üèæ üéÖüèæ üë∏üèæ ü§¥üèæ üë∞üèæ ü§µüèæ üëºüèæ ü§∞üèæ üôáüèæ‚Äç‚ôÄÔ∏è üôáüèæ üíÅüèæ üíÅüèæ‚Äç‚ôÇÔ∏è üôÖüèæ üôÖüèæ‚Äç‚ôÇÔ∏è üôÜüèæ üôÜüèæ‚Äç‚ôÇÔ∏è üôãüèæ üôãüèæ‚Äç‚ôÇÔ∏è ü§¶üèæ‚Äç‚ôÄÔ∏è ü§¶üèæ‚Äç‚ôÇÔ∏è ü§∑üèæ‚Äç‚ôÄÔ∏è ü§∑üèæ‚Äç‚ôÇÔ∏è üôéüèæ üôéüèæ‚Äç‚ôÇÔ∏è üôçüèæ üôçüèæ‚Äç‚ôÇÔ∏è üíáüèæ üíáüèæ‚Äç‚ôÇÔ∏è üíÜüèæ üíÜüèæ‚Äç‚ôÇÔ∏è üï¥üèæ üíÉüèæ üï∫üèæ üö∂üèæ‚Äç‚ôÄÔ∏è üö∂üèæ üèÉüèæ‚Äç‚ôÄÔ∏è üèÉüèæ üèãüèæ‚Äç‚ôÄÔ∏è üèãüèæ ü§∏üèæ‚Äç‚ôÄÔ∏è ü§∏üèæ‚Äç‚ôÇÔ∏è ‚õπüèæ‚Äç‚ôÄÔ∏è ‚õπüèæ ü§æüèæ‚Äç‚ôÄÔ∏è ü§æüèæ‚Äç‚ôÇÔ∏è üèåüèæ‚Äç‚ôÄÔ∏è üèåüèæ üèÑüèæ‚Äç‚ôÄÔ∏è üèÑüèæ üèäüèæ‚Äç‚ôÄÔ∏è üèäüèæ ü§Ωüèæ‚Äç‚ôÄÔ∏è ü§Ωüèæ‚Äç‚ôÇÔ∏è üö£üèæ‚Äç‚ôÄÔ∏è üö£üèæ üèáüèæ üö¥üèæ‚Äç‚ôÄÔ∏è üö¥üèæ üöµüèæ‚Äç‚ôÄÔ∏è üöµüèæ ü§πüèæ‚Äç‚ôÄÔ∏è ü§πüèæ‚Äç‚ôÇÔ∏è üõÄüèæ

üëêüèø üôåüèø üëèüèø üôèüèø üëçüèø üëéüèø üëäüèø ‚úäüèø ü§õüèø ü§úüèø ü§ûüèø ‚úåüèø ü§òüèø üëåüèø üëàüèø üëâüèø üëÜüèø üëáüèø ‚òùüèø ‚úãüèø ü§öüèø üñêüèø üññüèø üëãüèø ü§ôüèø üí™üèø üñïüèø ‚úçüèø ü§≥üèø üíÖüèø üëÇüèø üëÉüèø üë∂üèø üë¶üèø üëßüèø üë®üèø üë©üèø üë±üèø‚Äç‚ôÄÔ∏è üë±üèø üë¥üèø üëµüèø üë≤üèø üë≥üèø‚Äç‚ôÄÔ∏è üë≥üèø üëÆüèø‚Äç‚ôÄÔ∏è üëÆüèø üë∑üèø‚Äç‚ôÄÔ∏è üë∑üèø üíÇüèø‚Äç‚ôÄÔ∏è üíÇüèø üïµüèø‚Äç‚ôÄÔ∏è üïµüèø üë©üèø‚Äç‚öïÔ∏è üë®üèø‚Äç‚öïÔ∏è üë©üèø‚Äçüåæ üë®üèø‚Äçüåæ üë©üèø‚Äçüç≥ üë®üèø‚Äçüç≥ üë©üèø‚Äçüéì üë®üèø‚Äçüéì üë©üèø‚Äçüé§ üë®üèø‚Äçüé§ üë©üèø‚Äçüè´ üë®üèø‚Äçüè´ üë©üèø‚Äçüè≠ üë®üèø‚Äçüè≠ üë©üèø‚Äçüíª üë®üèø‚Äçüíª üë©üèø‚Äçüíº üë®üèø‚Äçüíº üë©üèø‚Äçüîß üë®üèø‚Äçüîß üë©üèø‚Äçüî¨ üë®üèø‚Äçüî¨ üë©üèø‚Äçüé® üë®üèø‚Äçüé® üë©üèø‚Äçüöí üë®üèø‚Äçüöí üë©üèø‚Äç‚úàÔ∏è üë®üèø‚Äç‚úàÔ∏è üë©üèø‚ÄçüöÄ üë®üèø‚ÄçüöÄ üë©üèø‚Äç‚öñÔ∏è üë®üèø‚Äç‚öñÔ∏è ü§∂üèø üéÖüèø üë∏üèø ü§¥üèø üë∞üèø ü§µüèø üëºüèø ü§∞üèø üôáüèø‚Äç‚ôÄÔ∏è üôáüèø üíÅüèø üíÅüèø‚Äç‚ôÇÔ∏è üôÖüèø üôÖüèø‚Äç‚ôÇÔ∏è üôÜüèø üôÜüèø‚Äç‚ôÇÔ∏è üôãüèø üôãüèø‚Äç‚ôÇÔ∏è ü§¶üèø‚Äç‚ôÄÔ∏è ü§¶üèø‚Äç‚ôÇÔ∏è ü§∑üèø‚Äç‚ôÄÔ∏è ü§∑üèø‚Äç‚ôÇÔ∏è üôéüèø üôéüèø‚Äç‚ôÇÔ∏è üôçüèø üôçüèø‚Äç‚ôÇÔ∏è üíáüèø üíáüèø‚Äç‚ôÇÔ∏è üíÜüèø üíÜüèø‚Äç‚ôÇÔ∏è üï¥üèø üíÉüèø üï∫üèø üö∂üèø‚Äç‚ôÄÔ∏è üö∂üèø üèÉüèø‚Äç‚ôÄÔ∏è üèÉüèø üèãüèø‚Äç‚ôÄÔ∏è üèãüèø ü§∏üèø‚Äç‚ôÄÔ∏è ü§∏üèø‚Äç‚ôÇÔ∏è ‚õπüèø‚Äç‚ôÄÔ∏è ‚õπüèø ü§æüèø‚Äç‚ôÄÔ∏è ü§æüèø‚Äç‚ôÇÔ∏è üèåüèø‚Äç‚ôÄÔ∏è üèåüèø üèÑüèø‚Äç‚ôÄÔ∏è üèÑüèø üèäüèø‚Äç‚ôÄÔ∏è üèäüèø ü§Ωüèø‚Äç‚ôÄÔ∏è ü§Ωüèø‚Äç‚ôÇÔ∏è üö£üèø‚Äç‚ôÄÔ∏è üö£üèø üèáüèø üö¥üèø‚Äç‚ôÄÔ∏è üö¥üèø üöµüèø‚Äç‚ôÄÔ∏è üöµüèø ü§πüèø‚Äç‚ôÄÔ∏è ü§πüèø‚Äç‚ôÇÔ∏è üõÄüèø

üê∂ üê± üê≠ üêπ üê∞ ü¶ä üêª üêº üê® üêØ ü¶Å üêÆ üê∑ üêΩ üê∏ üêµ üôä üôâ üôä üêí üêî üêß üê¶ üê§ üê£ üê• ü¶Ü ü¶Ö ü¶â ü¶á üê∫ üêó üê¥ ü¶Ñ üêù üêõ ü¶ã üêå üêö üêû üêú üï∑ üï∏ üê¢ üêç ü¶é ü¶Ç ü¶Ä ü¶ë üêô ü¶ê üê† üêü üê° üê¨ ü¶à üê≥ üêã üêä üêÜ üêÖ üêÉ üêÇ üêÑ ü¶å üê™ üê´ üêò ü¶è ü¶ç üêé üêñ üêê üêè üêë üêï üê© üêà üêì ü¶É üïä üêá üêÅ üêÄ üêø üêæ üêâ üê≤ üåµ üéÑ üå≤ üå≥ üå¥ üå± üåø ‚òòÔ∏è üçÄ üéç üéã üçÉ üçÇ üçÅ üçÑ üåæ üíê üå∑ üåπ ü•Ä üåª üåº üå∏ üå∫ üåé üåç üåè üåï üåñ üåó üåò üåë üåí üåì üåî üåö üåù üåû üåõ üåú üåô üí´ ‚≠êÔ∏è üåü ‚ú® ‚ö°Ô∏è üî• üí• ‚òÑÔ∏è ‚òÄÔ∏è üå§ ‚õÖÔ∏è üå• üå¶ üåà ‚òÅÔ∏è üåß ‚õà üå© üå® ‚òÉÔ∏è ‚õÑÔ∏è ‚ùÑÔ∏è üå¨ üí® üå™ üå´ üåä üíß üí¶ ‚òîÔ∏è

üçè üçé üçê üçä üçã üçå üçâ üçá üçì üçà üçí üçë üçç ü•ù ü•ë üçÖ üçÜ ü•í ü•ï üåΩ üå∂ ü•î üç† üå∞ ü•ú üçØ ü•ê üçû ü•ñ üßÄ ü•ö üç≥ ü•ì ü•û üç§ üçó üçñ üçï üå≠ üçî üçü ü•ô üåÆ üåØ ü•ó ü•ò üçù üçú üç≤ üç• üç£ üç± üçõ üçö üçô üçò üç¢ üç° üçß üç® üç¶ üç∞ üéÇ üçÆ üç≠ üç¨ üç´ üçø üç© üç™ ü•õ üçº ‚òïÔ∏è üçµ üç∂ üç∫ üçª ü•Ç üç∑ ü•É üç∏ üçπ üçæ ü•Ñ üç¥ üçΩ

‚öΩÔ∏è üèÄ üèà ‚öæÔ∏è üéæ üèê üèâ üé± üèì üè∏ ü•Ö üèí üèë üèè ‚õ≥Ô∏è üèπ üé£ ü•ä ü•ã ‚õ∏ üéø ‚õ∑ üèÇ üèãÔ∏è‚Äç‚ôÄÔ∏è üèãÔ∏è ü§∫ ü§º‚Äç‚ôÄÔ∏è ü§º‚Äç‚ôÇÔ∏è ü§∏‚Äç‚ôÄÔ∏è ü§∏‚Äç‚ôÇÔ∏è ‚õπÔ∏è‚Äç‚ôÄÔ∏è ‚õπÔ∏è ü§æ‚Äç‚ôÄÔ∏è ü§æ‚Äç‚ôÇÔ∏è üèåÔ∏è‚Äç‚ôÄÔ∏è üèåÔ∏è üèÑ‚Äç‚ôÄÔ∏è üèÑ üèä‚Äç‚ôÄÔ∏è üèä ü§Ω‚Äç‚ôÄÔ∏è ü§Ω‚Äç‚ôÇÔ∏è üö£‚Äç‚ôÄÔ∏è üö£ üèá üö¥‚Äç‚ôÄÔ∏è üö¥ üöµ‚Äç‚ôÄÔ∏è üöµ üéΩ üèÖ üéñ ü•á ü•à ü•â üèÜ üèµ üéó üé´ üéü üé™ ü§π‚Äç‚ôÄÔ∏è ü§π‚Äç‚ôÇÔ∏è üé≠ üé® üé¨ üé§ üéß üéº üéπ ü•Å üé∑ üé∫ üé∏ üéª üé≤ üéØ üé≥ üéÆ üé∞

üöó üöï üöô üöå üöé üèé üöì üöë üöí üöê üöö üöõ üöú üõ¥ üö≤ üõµ üèç üö® üöî üöç üöò üöñ üö° üö† üöü üöÉ üöã üöû üöù üöÑ üöÖ üöà üöÇ üöÜ üöá üöä üöâ üöÅ üõ© ‚úàÔ∏è üõ´ üõ¨ üöÄ üõ∞ üí∫ üõ∂ ‚õµÔ∏è üõ• üö§ üõ≥ ‚õ¥ üö¢ ‚öìÔ∏è üöß ‚õΩÔ∏è üöè üö¶ üö• üó∫ üóø üóΩ ‚õ≤Ô∏è üóº üè∞ üèØ üèü üé° üé¢ üé† ‚õ± üèñ üèù ‚õ∞ üèî üóª üåã üèú üèï ‚õ∫Ô∏è üõ§ üõ£ üèó üè≠ üè† üè° üèò üèö üè¢ üè¨ üè£ üè§ üè• üè¶ üè® üè™ üè´ üè© üíí üèõ ‚õ™Ô∏è üïå üïç üïã ‚õ© üóæ üéë üèû üåÖ üåÑ üå† üéá üéÜ üåá üåÜ üèô üåÉ üåå üåâ üåÅ

‚åöÔ∏è üì± üì≤ üíª ‚å®Ô∏è üñ• üñ® üñ± üñ≤ üïπ üóú üíΩ üíæ üíø üìÄ üìº üì∑ üì∏ üìπ üé• üìΩ üéû üìû ‚òéÔ∏è üìü üì† üì∫ üìª üéô üéö üéõ ‚è± ‚è≤ ‚è∞ üï∞ ‚åõÔ∏è ‚è≥ üì° üîã üîå üí° üî¶ üïØ üóë üõ¢ üí∏ üíµ üí¥ üí∂ üí∑ üí∞ üí≥ üíé ‚öñÔ∏è üîß üî® ‚öí üõ† ‚õè üî© ‚öôÔ∏è ‚õì üî´ üí£ üî™ üó° ‚öîÔ∏è üõ° üö¨ ‚ö∞Ô∏è ‚ö±Ô∏è üè∫ üîÆ üìø üíà ‚öóÔ∏è üî≠ üî¨ üï≥ üíä üíâ üå° üöΩ üö∞ üöø üõÅ üõÄ üõé üîë üóù üö™ üõã üõè üõå üñº üõç üõí üéÅ üéà üéè üéÄ üéä üéâ üéé üèÆ üéê ‚úâÔ∏è üì© üì® üìß üíå üì• üì§ üì¶ üè∑ üì™ üì´ üì¨ üì≠ üìÆ üìØ üìú üìÉ üìÑ üìë üìä üìà üìâ üóí üóì üìÜ üìÖ üìá üóÉ üó≥ üóÑ üìã üìÅ üìÇ üóÇ üóû üì∞ üìì üìî üìí üìï üìó üìò üìô üìö üìñ üîñ üîó üìé üñá üìê üìè üìå üìç üìå üéå üè≥Ô∏è üè¥ üèÅ üè≥Ô∏è‚Äçüåà ‚úÇÔ∏è üñä üñã ‚úíÔ∏è üñå üñç üìù ‚úèÔ∏è üîç üîé üîè üîê üîí üîì

‚ù§Ô∏è üíõ üíö üíô üíú üñ§ üíî ‚ù£Ô∏è üíï üíû üíì üíó üíñ üíò üíù üíü ‚òÆÔ∏è ‚úùÔ∏è ‚ò™Ô∏è üïâ ‚ò∏Ô∏è ‚ú°Ô∏è üîØ üïé ‚òØÔ∏è ‚ò¶Ô∏è üõê ‚õé ‚ôàÔ∏è ‚ôâÔ∏è ‚ôäÔ∏è ‚ôãÔ∏è ‚ôåÔ∏è ‚ôçÔ∏è ‚ôéÔ∏è ‚ôèÔ∏è ‚ôêÔ∏è ‚ôëÔ∏è ‚ôíÔ∏è ‚ôìÔ∏è üÜî ‚öõÔ∏è üâë ‚ò¢Ô∏è ‚ò£Ô∏è üì¥ üì≥ üà∂ üàöÔ∏è üà∏ üà∫ üà∑Ô∏è ‚ú¥Ô∏è üÜö üíÆ üâê „äôÔ∏è „äóÔ∏è üà¥ üàµ üàπ üà≤ üÖ∞Ô∏è üÖ±Ô∏è üÜé üÜë üÖæÔ∏è üÜò ‚ùå ‚≠ïÔ∏è üõë ‚õîÔ∏è üìõ üö´ üíØ üí¢ ‚ô®Ô∏è üö∑ üöØ üö≥ üö± üîû üìµ üö≠ ‚ùóÔ∏è ‚ùï ‚ùì ‚ùî ‚ÄºÔ∏è ‚ÅâÔ∏è üîÖ üîÜ „ÄΩÔ∏è ‚ö†Ô∏è üö∏ üî± ‚öúÔ∏è üî∞ ‚ôªÔ∏è ‚úÖ üàØÔ∏è üíπ ‚ùáÔ∏è ‚ú≥Ô∏è ‚ùé üåê üí† ‚ìÇÔ∏è üåÄ üí§ üèß üöæ ‚ôøÔ∏è üÖøÔ∏è üà≥ üàÇÔ∏è üõÇ üõÉ üõÑ üõÖ üöπ üö∫ üöº üöª üöÆ üé¶ üì∂ üàÅ üî£ ‚ÑπÔ∏è üî§ üî° üî† üÜñ üÜó üÜô üÜí üÜï üÜì 0Ô∏è‚É£ 1Ô∏è‚É£ 2Ô∏è‚É£ 3Ô∏è‚É£ 4Ô∏è‚É£ 5Ô∏è‚É£ 6Ô∏è‚É£ 7Ô∏è‚É£ 8Ô∏è‚É£ 9Ô∏è‚É£ üîü üî¢ #Ô∏è‚É£ *Ô∏è‚É£ ‚ñ∂Ô∏è ‚è∏ ‚èØ ‚èπ ‚è∫ ‚è≠ ‚èÆ ‚è© ‚è™ ‚è´ ‚è¨ ‚óÄÔ∏è üîº üîΩ ‚û°Ô∏è ‚¨ÖÔ∏è ‚¨ÜÔ∏è ‚¨áÔ∏è ‚ÜóÔ∏è ‚ÜòÔ∏è ‚ÜôÔ∏è ‚ÜñÔ∏è ‚ÜïÔ∏è ‚ÜîÔ∏è ‚Ü™Ô∏è ‚Ü©Ô∏è ‚§¥Ô∏è ‚§µÔ∏è üîÄ üîÅ üîÇ üîÑ üîÉ üéµ üé∂ ‚ûï ‚ûñ ‚ûó ‚úñÔ∏è üí≤ üí± ‚Ñ¢Ô∏è ¬©Ô∏è ¬ÆÔ∏è „Ä∞Ô∏è ‚û∞ ‚ûø üîö üîô üîõ üîù ‚úîÔ∏è ‚òëÔ∏è üîò ‚ö™Ô∏è ‚ö´Ô∏è üî¥ üîµ üî∫ üîª üî∏ üîπ üî∂ üî∑ üî≥ üî≤ ‚ñ™Ô∏è ‚ñ´Ô∏è ‚óæÔ∏è ‚óΩÔ∏è ‚óºÔ∏è ‚óªÔ∏è ‚¨õÔ∏è ‚¨úÔ∏è üîà üîá üîâ üîä üîî üîï üì£ üì¢ üëÅ‚Äçüó® üí¨ üí≠ üóØ ‚ô†Ô∏è ‚ô£Ô∏è ‚ô•Ô∏è ‚ô¶Ô∏è üÉè üé¥ üÄÑÔ∏è üïê üïë üïí üïì üïî üïï üïñ üïó üïò üïô üïö üïõ üïú üïù üïû üïü üï† üï° üï¢ üï£ üï§ üï• üï¶ üïß

üè≥Ô∏è üè¥ üèÅ üö© üè≥Ô∏è‚Äçüåà üá¶üá´ üá¶üáΩ üá¶üá± üá©üáø üá¶üá∏ üá¶üá© üá¶üá¥ üá¶üáÆ üá¶üá∂ üá¶üá¨ üá¶üá∑ üá¶üá≤ üá¶üáº üá¶üá∫ üá¶üáπ üá¶üáø üáßüá∏ üáßüá≠ üáßüá© üáßüáß üáßüáæ üáßüá™ üáßüáø üáßüáØ üáßüá≤ üáßüáπ üáßüá¥ üáßüá¶ üáßüáº üáßüá∑ üáÆüá¥ üáªüá¨ üáßüá≥ üáßüá¨ üáßüá´ üáßüáÆ üá∞üá≠ üá®üá≤ üá®üá¶ üáÆüá® üá®üáª üáßüá∂ üá∞üáæ üá®üá´ üáπüá© üá®üá± üá®üá≥ üá®üáΩ üá®üá® üá®üá¥ üá∞üá≤ üá®üá¨ üá®üá© üá®üá∞ üá®üá∑ üá®üáÆ üá≠üá∑ üá®üá∫ üá®üáº üá®üáæ üá®üáø üá©üá∞ üá©üáØ üá©üá≤ üá©üá¥ üá™üá® üá™üá¨ üá∏üáª üá¨üá∂ üá™üá∑ üá™üá™ üá™üáπ üá™üá∫ üá´üá∞ üá´üá¥ üá´üáØ üá´üáÆ üá´üá∑ üá¨üá´ üáµüá´ üáπüá´ üá¨üá¶ üá¨üá≤ üá¨üá™ üá©üá™ üá¨üá≠ üá¨üáÆ üá¨üá∑ üá¨üá± üá¨üá© üá¨üáµ üá¨üá∫ üá¨üáπ üá¨üá¨ üá¨üá≥ üá¨üáº üá¨üáæ üá≠üáπ üá≠üá≥ üá≠üá∞ üá≠üá∫ üáÆüá∏ üáÆüá≥ üáÆüá© üáÆüá∑ üáÆüá∂ üáÆüá™ üáÆüá≤ üáÆüá± üáÆüáπ üáØüá≤ üáØüáµ üéå üáØüá™ üáØüá¥ üá∞üáø üá∞üá™ üá∞üáÆ üáΩüá∞ üá∞üáº üá∞üá¨ üá±üá¶ üá±üáª üá±üáß üá±üá∏ üá±üá∑ üá±üáæ üá±üáÆ üá±üáπ üá±üá∫ üá≤üá¥ üá≤üá∞ üá≤üá¨ üá≤üáº üá≤üáæ üá≤üáª üá≤üá± üá≤üáπ üá≤üá≠ üá≤üá∂ üá≤üá∑ üá≤üá∫ üáæüáπ üá≤üáΩ üá´üá≤ üá≤üá© üá≤üá® üá≤üá≥ üá≤üá™ üá≤üá∏ üá≤üá¶ üá≤üáø üá≤üá≤ üá≥üá¶ üá≥üá∑ üá≥üáµ üá≥üá± üá≥üá® üá≥üáø üá≥üáÆ üá≥üá™ üá≥üá¨ üá≥üá∫ üá≥üá´ üá∞üáµ üá≤üáµ üá≥üá¥ üá¥üá≤ üáµüá∞ üáµüáº üáµüá∏ üáµüá¶ üáµüá¨ üáµüáæ üáµüá™ üáµüá≠ üáµüá≥ üáµüá± üáµüáπ üáµüá∑ üá∂üá¶ üá∑üá™ üá∑üá¥ üá∑üá∫ üá∑üáº üáºüá∏ üá∏üá≤ üá∏üá¶ üá∏üá≥ üá∑üá∏ üá∏üá® üá∏üá± üá∏üá¨ üá∏üáΩ üá∏üá∞ üá∏üáÆ üá¨üá∏ üá∏üáß üá∏üá¥ üáøüá¶ üá∞üá∑ üá∏üá∏ üá™üá∏ üá±üá∞ üáßüá± üá∏üá≠ üá∞üá≥ üá±üá® üáµüá≤ üáªüá® üá∏üá© üá∏üá∑ üá∏üáø üá∏üá™ üá®üá≠ üá∏üáæ üáπüáº üáπüáØ üáπüáø üáπüá≠ üáπüá± üáπüá¨ üáπüá∞ üáπüá¥ üáπüáπ üáπüá≥ üáπüá∑ üáπüá≤ üáπüá® üáπüáª üáªüáÆ üá∫üá¨ üá∫üá¶ üá¶üá™ üá¨üáß üè¥Û†ÅßÛ†Å¢Û†Å•Û†ÅÆÛ†ÅßÛ†Åø üè¥Û†ÅßÛ†Å¢Û†Å≥Û†Å£Û†Å¥Û†Åø üè¥Û†ÅßÛ†Å¢Û†Å∑Û†Å¨Û†Å≥Û†Åø üá∫üá∏ üá∫üáæ üá∫üáø üáªüá∫ üáªüá¶ üáªüá™ üáªüá≥ üáºüá´ üá™üá≠ üáæüá™ üáøüá≤ üáøüáº
'''.replace(" ","")

Vamos criar uma fun√ß√£o para remover os termos que se iniciam com `#`, `@` `http`, de modo a retirar hashtags, mentions e links.

In [11]:
def clean(row, string_with_chars_to_remove):
    
    # Cria uma lista de palavras
    words = row.text.split()
    
    # Remove hashtags, mentions e links
    words = [word for word in words if ( (word[0] not in ['#', '@']) 
             and (word.startswith('http') is False)
             and (word.startswith('www.') is False)
             and (word.startswith('t.co') is False)
             and (word.startswith('bit.ly') is False)
             and (word.startswith('goo.gl') is False)
             and (word.startswith('migre.me') is False) )
            ]

    # Remove qualquer termo que n√£o contenha nenhum caractere do alfabeto, incluindo acentos
    words = [word for word in words if any(letter.isalpha() for letter in word)]
    
    # Remove pontua√ß√£o do come√ßo e final das palavras
    for i in range(len(words)):
        words[i] = words[i].strip((string.punctuation + emojistring))
    
    # Remove emojis do meio de palavras
    # https://gist.github.com/Alex-Just/e86110836f3f93fe7932290526529cd1
    RE_EMOJI = re.compile('[\U00010000-\U0010ffff]', flags=re.UNICODE)
    for i in range(len(words)):
        words[i] = RE_EMOJI.sub(r'', words[i])
        
    text = ' '.join(words)
     
    return pd.Series({'text':text})

In [12]:
# Aplica a fun√ß√£o
df['text'] = df.apply(clean, args=(emojistring,), axis=1)

In [13]:
# Recria os dataframes de candidatos, agora para analisar, sem os caracteres especiais
lula = df[df.name=='Lula']
ciro = df[df.name=='Ciro Gomes']
bolsonaro = df[df.name=='Jair Bolsonaro']
marina = df[df.name=='Marina Silva']
alckmin = df[df.name=='Geraldo Alckmin']
temer = df[df.name=='Michel Temer']
maia = df[df.name=='Rodrigo Maia']
collor = df[df.name=='Fernando Collor']
amoedo = df[df.name=='Jo√£o Amoedo']
boulos = df[df.name=='Guilherme Boulos']
manuela = df[df.name=="Manuela d'√Åvila"]
alvaro = df[df.name=="√Ålvaro Dias"]
wagner = df[df.name=="Jaques Wagner"]
haddad = df[df.name=="Fernando Haddad"]
meirelles = df[df.name=="Henrique Meirelles"]
joaquim = df[df.name=="Joaquim Barbosa"]

## Tokenizar
Cria um segundo dataframe com os percentuais de uso de cada palavra

In [14]:
from textblob import TextBlob
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfVectorizer
import nltk
from nltk import tokenize

In [15]:
# Lista de palavras para ignorar usando os pacotes do NLTK
stop_words = nltk.corpus.stopwords.words('portuguese')

In [16]:
# Cria um tokenizador usando textblob
def textblob_tokenizer(str_input):
    blob = TextBlob(str_input.lower())
    tokens = blob.words
    words = [token for token in tokens if (len(token) >= 2)] # Pega apenas palavras maiores que tr√™s letras
    return words

In [30]:
def calculate(df, candidate, twitter_handle):
    
    # Filtra o dataframe para manter apenas os demais
    others = df[df.twitter_handle!=twitter_handle] # Retirar este coment√°rio para permitir uma compara√ß√£o
                                                    # de palavras do candidato X palavras de todos menos o candidato.
                                                    # Com o coment√°rio ativo, a compara√ß√£o √© candidatos X todos
    # Define um vetorizador par os resultados
    vec = CountVectorizer(tokenizer=textblob_tokenizer,
                      stop_words=stop_words)
    print('"vec" defined')
    
    # 'Fit' na coluna de tweets
    matrix_candidate = vec.fit_transform(candidate.text)
    print('"matrix_candidate" defined')

    # E retorna um novo dataframe
    candidate_words = pd.DataFrame(matrix_candidate.toarray(), columns=vec.get_feature_names())
    print('"candidate_words" defined')

    # Repete o processo para o dataframe 'other'
    matrix_other = vec.fit_transform(others.text)
    print('"matrix_other" defined')
    other_words = pd.DataFrame(matrix_other.toarray(), columns=vec.get_feature_names())
    print('"other_words" defined')

    # Transpondo os arquivos para que as palavras fiquem em eixo verical
    candidate_words =  candidate_words.transpose().reset_index() 
    other_words = other_words.transpose().reset_index()
    print('Index reseted')
    
    # Diminui decimais
    candidate_words = candidate_words.round(5)
    other_words = other_words.round(5)

    # Descobrir quantas vezes uma palavra √© usada
    candidate_words['__sum_candidate'] = candidate_words.sum(axis=1) # Os dois '_' evitam confundir com a palavra 'soma'
    other_words['__sum_others'] = other_words.sum(axis=1) # Os dois '_' evitam confundir com a palavra 'soma'
    print('Sum calculated')

    # Descobrir o total de palavras em cada um dos dataframes
    candidate_words['__total_candidate'] = candidate_words.__sum_candidate.sum(axis=0)
    other_words['__total_others'] = other_words.__sum_others.sum(axis=0)
    print('Total calculated')

    # Descobrir os 'ratios' tamb√©m
    candidate_words['__ratio_candidate'] = (candidate_words['__sum_candidate'] / candidate_words['__total_candidate']) * 10000
    other_words['__ratio_others'] = (other_words['__sum_others'] /  other_words['__total_others']) * 10000
    print('Ratio calculated')

    # Cria um √∫nico dataframe mesclando os dois. Mant√©m todos os termos (outer join)
    results = candidate_words.merge(other_words, on='index', how='outer') # Note que a coluna 'index' se refere √†s PALAVRAS
    print('Merge performed')

    # Calcula quantas vezes √© mais prov√°vel de aparecer em cada grupo
    results["more_likely_candidate"] = results.__ratio_candidate / results.__ratio_others
    results["more_likely_others"] = results.__ratio_others / results.__ratio_candidate
    print('Likelihood calculated')
 
    # Calcula total e ratios somados
    results['__sum_all'] = (results.__sum_candidate + results.__sum_others)
    results['__total_all'] = (results.__total_candidate + results.__total_others)
    results['__ratio_all'] = (results.__sum_all / results.__total_all) * 10000
    print("All ratios calculated")
    
    # Mantendo apenas as colunas com informa√ß√£o num√©rica
    results = results[['index','__sum_candidate','__sum_others',
                       '__total_candidate','__total_others',
                       '__ratio_candidate', '__ratio_others',
                       'more_likely_candidate', 'more_likely_others',
                       '__sum_all', '__total_all', '__ratio_all']]
    print('Columns filtered')
    
    
    # Muda o cabe√ßalho de 'index' para 'word'
    results.columns = ['word','__sum_candidate','__sum_others',
                       '__total_candidate','__total_others',
                       '__ratio_candidate', '__ratio_others',
                       'more_likely_candidate', 'more_likely_others',
                       '__sum_all', '__total_all', '__ratio_all']
    print('Columns renamed')

    # Cria uma coluna com identificador
    results['candidate'] = twitter_handle
    
    # Arredonda
    results = results.round(decimals=5)

    # Salva os resultados que contenham nan para a soma de palavras dos outros, 
    # ou seja, salva as palavras usadas apenas pelo candidato em quest√£o
    results_unique = results[results['__sum_others'].isnull()]

    # Derruba palavras n√£o usadas pelo candidato, que ter√£o um NaN no meio.
    results = results.dropna()
    

    return results, results_unique

In [31]:
# Defina uma fun√ß√£o para salvar
def save_csv(k, v, directory):
    path = directory + k + '-matrix.csv'   
    v.to_csv(path, index=False, encoding='UTF-8')

In [33]:
%%time
# Aplica a an√°lise para cada candidato, salvando os resultados em um dicion√°rio
results = {}
dfs = [lula, ciro, bolsonaro, marina, 
       alckmin, temer, maia, collor, amoedo, 
       boulos, manuela, alvaro, haddad, wagner,
       meirelles, joaquim]
for candidate_df, twitter_handle in zip(dfs, ['lulapelobrasil', 'cirogomes', 'jairbolsonaro', 'silva_marina', 
                                          'geraldoalckmin', 'MichelTemer', 'RodrigoMaia', 'collor', 'joaoamoedonovo',
                                          'GuilhermeBoulos', 'ManuelaDavila',  'alvarodias_',
                                          'Haddad_Fernando','jaqueswagner', 'meirelles', 'joaquimboficial']):
    print(twitter_handle + ':')
    results[twitter_handle], results_unique[twitter_handle] = calculate(df, candidate_df, twitter_handle)
    print()

lulapelobrasil:
"vec" defined
"matrix_candidate" defined
"candidate_words" defined
"matrix_other" defined
"other_words" defined
Index reseted
Sum calculated
Total calculated
Ratio calculated
Merge performed
Likelihood calculated
All ratios calculated
Columns filtered
Columns renamed

cirogomes:
"vec" defined
"matrix_candidate" defined
"candidate_words" defined
"matrix_other" defined
"other_words" defined
Index reseted
Sum calculated
Total calculated
Ratio calculated
Merge performed
Likelihood calculated
All ratios calculated
Columns filtered
Columns renamed

jairbolsonaro:
"vec" defined
"matrix_candidate" defined
"candidate_words" defined
"matrix_other" defined
"other_words" defined
Index reseted
Sum calculated
Total calculated
Ratio calculated
Merge performed
Likelihood calculated
All ratios calculated
Columns filtered
Columns renamed

silva_marina:
"vec" defined
"matrix_candidate" defined
"candidate_words" defined
"matrix_other" defined
"other_words" defined
Index reseted
Sum calcula

In [34]:
# Salva cada item do dicion√°rio em um csv separado
for k,v in results.items():
    save_csv(k, v, '../data/matrix-geral/')