# buscador-da-ditadura
Esse script recebe diversos arquivos .csv, já limpos e bem formatados, e detecta quais deles contém menções à Ditadura Militar.

#### Importa pacotes

In [1]:
import pandas as pd
import re
from unidecode import unidecode

#### Lê os dados externos e formata strings

In [2]:
df = pd.read_csv("../data/csvs/discursos_jair_bolsonaro.csv")

In [3]:
df["CLEAN_CONTENT_LOWERCASE"]    = df.CLEAN_CONTENT.str.lower()
df["FULL_CLEAN_QUOTE_LOWERCASE"] = df.FULL_CLEAN_QUOTE.str.lower()

#### Define palavras chave para buscar no discurso
Para encontrar pronunciamentos em que Bolsonaro mencionou a Ditadura Militar, vamos definir uma sério de palavras-chave relacionadas ao tema e checar se elas foram usadas em cada um dos discursos coletados.

Importante notar que vamos passar um *unidecode* nas palavras, para que elas ficam sem caracteres especiais, da mesma maneira que a transcrição dos discursos.

#### Descobre quais palavras-chave foram usadas

In [46]:
# Descobre quais palavras foram encontradas em cada discurso
def find_words(string, keywords):
    
    used_words = [ ]
    
    for word in keywords:
        
        regex = re.compile( "\\b" + word + "\\b" )
        matches = re.findall( regex, string.lower() )
        
        if matches != [ ] :
            matches = set(matches)
            used_words.extend( matches )
            
    return used_words

#### Encapsula as funções acima em métodos df.apply

In [53]:
def apply_find_words(row, keywords):
    
    used_words = find_words(row.FULL_CLEAN_QUOTE, keywords)
    
    if used_words != [ ]:
        mentions_keywords = True
    else:
        mentions_keywords = False
        
    return pd.Series({
        "MENTIONS_KEYWORDS" : mentions_keywords,
        "USED_WORDS"        : used_words
    })

#### Executa a operação

In [56]:
def run_script():
    
    df = pd.read_csv("../data/csvs/discursos_jair_bolsonaro.csv")
    
    keywords = [ 

        # Termos genéricos para falar do proceso histórico
        "31 de março",
        "1964",
        "64",
        "ai-5",
        "anistia",
        "contragolpe",
        "ditadura",
        "golpe",
        "governo militar",
        "regime militar",
        "revolução",

        # Citações aos presidentes militares ou outras lideranças
        "castelo branco",
        "castello branco",
        "costa e silva",
        "mario kozel filho",
        "médici",
        "geisel",
        "figueiredo",
        "sergio fleury",
        "ustra",

        # TO DO:
        # Recuperar lista com nomes dos 377 nomes apontados
        # como responsáveis por violações de Direitos Humanos
        # na Comissão da Verdade

        # Nomes de inimigos do Estado durante a ditadura
        # ou de episódios de resistência ao regime
        "aln",
        "araguaia",
        "colina",
        "guerrilha",
        "lamarca",
        "m3g",
        "marighella",
        "molipo",
        "mr-8",
        "mr-21",
        "mr-26",
        "mrmn",
        "prt",
        # "ran",
        "var-palmares",
        "vpr",

        # Instituições
        "comissao da verdade",
        "doi-codi",
        "dops",
        "sni",

        # Nome de outras pessoas direta ou indiretamente envolvidas com o regime
        "elbrick", # Charles Burke, embaixador americano
        "herzog",
        "vladmir herzog",
        "vladimir herzog",
        "joao goulart",
        "goulart",
        "jango",

    ]
    
    found_words = df.apply(apply_find_words, args = (keywords,), axis = 1)
    df = df.join(found_words)
    
    df.to_csv("../data/csvs/discursos_jair_bolsonaro.csv")
    
    return df

In [57]:
run_script()

Unnamed: 0,CLEAN_CONTENT,FILE,ORIGINAL_CONTENT,SESSION_DATE,SESSION_TYPE,SPEAKER_COUNT,FULL_CLEAN_QUOTE,FULL_ORIGINAL_QUOTE,MENTIONS_KEYWORDS,USED_WORDS
0,O SR. JAIR BOLSONARO (PP-RJ. Sem revisao do or...,../data/txts/plenario/14122010-15h32-BREVES CO...,O SR. JAIR BOLSONARO (PP-RJ. Sem revisão do or...,2010-12-14,BREVES COMUNICACOES,1,"Sr. Presidente, Sras. e Srs. Deputados, primei...","Sr. Presidente, Sras. e Srs. Deputados, primei...",False,[]
1,O SR. JAIR BOLSONARO (PP-RJ. Sem revisao do or...,../data/txts/plenario/21092011-13h58-BREVES CO...,O SR. JAIR BOLSONARO (PP-RJ. Sem revisão do or...,2011-09-21,BREVES COMUNICACOES,1,"Sr. Presidente, Sras. e Srs. Deputados, mais u...","Sr. Presidente, Sras. e Srs. Deputados, mais u...",True,"[anistia, ditadura, araguaia, comissao da verd..."
2,O SR. JAIR BOLSONARO (PP-RJ. Sem revisao do or...,../data/txts/plenario/17062009-16h18-ORDEM DO ...,O SR. JAIR BOLSONARO (PP-RJ. Sem revisão do or...,2009-06-17,ORDEM DO DIA,1,"Sr. Presidente, talvez eu seja o unico Deputad...","Sr. Presidente, talvez eu seja o único Deputad...",False,[]
3,O SR. JAIR BOLSONARO (PTB-RJ. Sem revisao do o...,../data/txts/plenario/10112004-12h00-BREVES CO...,O SR. JAIR BOLSONARO (PTB-RJ. Sem revisão do o...,2004-11-10,BREVES COMUNICACOES,1,"Sr. Presidente, Sras. e Srs. Deputados, todos ...","Sr. Presidente, Sras. e Srs. Deputados, todos ...",False,[]
4,O SR. JAIR BOLSONARO (PP-RJ. Sem revisao do or...,../data/txts/plenario/26102005-14h26-PEQUENO E...,O SR. JAIR BOLSONARO (PP-RJ. Sem revisão do or...,2005-10-26,PEQUENO EXPEDIENTE,1,"Sr. Presidente, meu prezado Deputado Inocencio...","Sr. Presidente, meu prezado Deputado Inocêncio...",True,"[anistia, ditadura, regime militar, herzog, vl..."
5,O SR. JAIR BOLSONARO (PPB-RJ. Sem revisao do o...,../data/txts/plenario/29112000-15h18-BREVES CO...,O SR. JAIR BOLSONARO (PPB-RJ. Sem revisão do o...,2000-11-29,BREVES COMUNICACOES,1,"Sr. Presidente, Sras. e Srs. Deputados, vou fa...","Sr. Presidente, Sras. e Srs. Deputados, vou fa...",False,[]
6,O SR. JAIR BOLSONARO (PP-RJ. Pela ordem. Sem r...,../data/txts/plenario/01122010-14h26-PEQUENO E...,O SR. JAIR BOLSONARO (PP-RJ. Pela ordem. Sem r...,2010-12-01,PEQUENO EXPEDIENTE,1,"Sr. Presidente, na semana passada por tres dia...","Sr. Presidente, na semana passada por três dia...",False,[]
7,O SR. JAIR BOLSONARO (PP-RJ. Pela ordem. Sem r...,../data/txts/plenario/30042013-10h30-BREVES CO...,O SR. JAIR BOLSONARO (PP-RJ. Pela ordem. Sem r...,2013-04-30,BREVES COMUNICACOES,1,"Sr. Presidente, no ultimo domingo, no SBT, a a...","Sr. Presidente, no último domingo, no SBT, a a...",False,[]
8,O SR. JAIR BOLSONARO (PTB-RJ. Sem revisao do o...,../data/txts/plenario/13032003-14h18-PEQUENO E...,O SR. JAIR BOLSONARO (PTB-RJ. Sem revisão do o...,2003-03-13,PEQUENO EXPEDIENTE,1,a,"Sr. Presidente, abordarei assunto deveras polê...",False,[]
9,O SR. JAIR BOLSONARO (Bloco/PP-RJ. Pela ordem....,../data/txts/plenario/06112013-16h06-BREVES CO...,O SR. JAIR BOLSONARO (Bloco/PP-RJ. Pela ordem....,2013-11-06,BREVES COMUNICACOES,1,"E muito tempo, Sr. Presidente. Meus companheir...","É muito tempo, Sr. Presidente. Meus companheir...",False,[]
