# Text Mining com Python e Whoosh: Cartas Brasileiras (PHPB-Ba)

### Valter Moreno

**Fundação Getúlio Vargas (FGV)**<br/>
**Mestrado em Matemática Aplicada (EMAp)**<br/>
**Sistemas de Recuperação de Informação - 2019**<br/>

## Objetivos do projeto

Neste projeto, vamos analisar os manuscritos modernizados do Corpus Eletrônico de Documentos Históricos do Sertão [CE-DOHS](http://www.tycho.iel.unicamp.br/cedohs/corpora.html).

## Corpus analisado

O Corpus Compartilhado Diacrônico – Cartas Brasileiras (PHPB-Ba) é disponibilizado no website do projeto Plataforma Corpus Eletrônico de Documentos Históricos do Sertão [CE-DOHS]. O projeto é coordenado por Zenaide de Oliveira Novais Carneiro (UEFS/Fapesb/CNPq) e Mariana Fagundes de Oliveira Lacerda (UEFS/Fapesb).

O corpus analisado neste projeto consiste de 1.185 cartas com datas no período de 1823 a 2000. As cartas provêm de 14 corporas distintos, listados no [website do CE-DOHS](http://www.tycho.iel.unicamp.br/cedohs/corpora.html).

## Análise

### Importação de bibliotecas

In [1]:
import os.path
import pandas as pd
import numpy as np
import glob

import re

import string
from string import punctuation

from collections import defaultdict

from spellchecker import SpellChecker

import spacy
nlp = spacy.load("pt_core_news_sm")

from gensim import corpora
from gensim import models

import nltk
from nltk.tokenize import WordPunctTokenizer
from nltk.corpus import stopwords
from nltk.stem.snowball import PortugueseStemmer

from whoosh.index import create_in, open_dir
from whoosh.fields import *
from whoosh.analysis import RegexTokenizer, LanguageAnalyzer, StopFilter, LowercaseFilter, StemFilter
from whoosh.qparser import QueryParser
from whoosh.query import Phrase

pd.set_option('display.max_colwidth', -1) # Customização do display de dataframes para que
                                          # todo o conteúdo das colunas seja mostrado

### Importação dos textos do corpus

O corpus de 1.185 cartas foi carregado num vetor do R. O conteúdo do primeiro arquivo carregado é mostrado abaixo.


In [2]:
caminho = "CE-DOHS/*.txt"
arquivos  = glob.glob(caminho)
print('Há um total de', len(arquivos), 'no diretório do corpus.', '\n')
print('Nomes dos seis primeiros arquivos:')
for i in range(0,6):
    print(arquivos[i])

Há um total de 2370 no diretório do corpus. 

Nomes dos seis primeiros arquivos:
CE-DOHS\01-AAD-17-04-1962-mod.txt
CE-DOHS\01-AAD-17-04-1962-orig.txt
CE-DOHS\01-ACST-14-01-1952-mod.txt
CE-DOHS\01-ACST-14-01-1952-orig.txt
CE-DOHS\01-AFS-28-04-1956-mod.txt
CE-DOHS\01-AFS-28-04-1956-orig.txt


Como pode ser visto acima, os arquivos baixados do CE-DOHS incluem as cartas originais e as cartas com o português modernizado. Em nossa análise, usaremos apenas as cartas com o português modernizado.

### Extração de metadados e texto dos arquivos

Os arquivos do CE-DOHS incluem metadados em seu cabeçalho. Identificamos os seguintes campos:

  * Identificação do corpus
  * Nome da pesqisadora  
  * Identificação da carta
  * Nome do autor da carta
  * Nome do destinatário
  * Data da carta
  * Identificação de carta modernizada
  * Identificação da codificação (UTF-8)
  * Número da carta
  * Descrição do manuscrito (ex., local de arquivo, tipo de papel)
  
Criamos um dataframe com os metadados relevantes (identificação da carta, autor, destinatário, e data), além do próprio texto do documento. O texto de cada carta foi processado da seguinte forma:

  * removemos espaços desnecessários dos nomes dos remetentes e destinatários; 
  * tranformamos as cadeias de caracter das datas originais em datas;
  * removemos o cabeçalho, com os metadados do arquivo; parte deles foi aproveitada para preencher os valores de identificação da carta, autor, destinatário, e data;
  * removemos o texto explicativo geralmente adicionado a cada carta, com informações tais como o tipo de papel usado, o número de folhas, onde a carta estava guardada, etc.
  * removemos notas inseridas no manuscrito para identificar mudanças de página, rasuras, borrados, etc.
  * removemos notas de rodapé, tipicamente explicando que anotações foram feitas no manuscrito

In [3]:
def data_id(id):
    data_num = re.compile('[0-9]{2}-[0-9]{2}-[0-9]{4}')
    data = data_num.findall(id)
    if data:
        try:
            return pd.to_datetime(data[0], format='%d-%m-%Y')
        except:
            return np.NaN
    else:
        return np.NaN

cartas = pd.DataFrame(columns=['id', 'de', 'para', 'data', 'texto'])

meses = ('janeiro','fevereiro','mar','abril','maio','junho', 'julho','agosto','setembro','outubro','novembro','dezembro')

for root, dirs, files in os.walk(r'CE-DOHS'):
    if files:
        for fileid in files:
            
            if not fileid.endswith('-mod.txt'):
                continue
            
            with open(os.path.join(root, fileid), mode="r", encoding="utf-8") as doc:
                id = fileid
                
                texto = doc.read()
                
                linhas = texto.splitlines()
                
                de = [autor.replace(u'|:| Autor:', '').strip() \
                         for autor in linhas \
                         if u'|:| Autor:' in autor][0]
                de = " ".join(de.split())
                                
                para = [destino.replace(u'|:| Destinatário:', '').strip() \
                         for destino in linhas \
                         if u'|:| Destinatário:' in destino][0]
                para = " ".join(para.split())
                
                data = [dt.replace(u'|:| Data:', '').strip(' .').lower() \
                         for dt in linhas \
                         if u'|:| Data:' in dt][0]
                
                mes = [mes for mes in meses if mes in data]
                               
                if mes:
                    data = data.replace(mes[0], '/' + str(meses.index(mes[0]) + 1) + '/')
                    
                data_num = re.compile('[0-9\/]')
                data = data_num.findall(data)
                data = ''.join(data)
                
                try:
                    data = pd.to_datetime(data, infer_datetime_format=True)
                    if pd.isna(data):
                        data = data_id(id)
                except:
                    data = data_id(id)
                                                
                texto = linhas[15:len(linhas)]
                texto = '\n'.join(texto)
                texto = texto.replace('\n\n[pag]\n\n', '')
                texto = re.sub('\[footer:([\\n a-zA-Z0-9áàâãéèêíïóôõöúçñÁÀÂÃÉÈÍÏÓÔÕÖÚÇÑ.#\"‘’“”]*)\]',
                                 '', texto)
                texto = re.sub('\[header:[ ]*\]', '\n', texto)
                texto = re.sub('[|]*[ ]*[Ff]l. [0-9] [rv]', ' ', texto)
                texto = re.sub('[0-9][ ]*Rasura[do]*[ .]*', ' ', texto)
                texto = re.sub('[0-9][ ]*Borrado[ .]*', ' ', texto)
                texto = re.sub('\[[ ]*[Rr]ubrica[ ]*\]', ' ', texto)
                texto = re.sub('\[[ ]*[Rr]asura[ ]*\]', ' ', texto)
                texto = re.sub('\[[ ]*[Ii]nint[ ]*.[ ]*\]', ' ', texto)
                texto = texto.strip()
                
                new_row = {'id': id, 'de': de, 'para': para, 'data': data, 'texto': texto}
                cartas = cartas.append(new_row, ignore_index=True)

Seguem as cinco primeiras linhas do dataframe criado, com as cinco primeiras cartas processadas.

In [4]:
cartas.head(5)

Unnamed: 0,id,de,para,data,texto
0,01-AAD-17-04-1962-mod.txt,Arnaldo Andrade Dias (apócrifo),Maria de Lourdes de Lima Oliveira,1962-04-17,"São Paulo 17 de abril 1962\n\n Inesquicível Lurdes\n\n Adeus ao longe ,\n\n Em uma tarde tristonho , cheio de saudade , que peguei em minha rude caneta para te escrever dando as minhas notícias , que 1 de saúde vou bem só o que me mata 2 é a cruel se 3 lembrança de você .\n\n Talvez você não acredite meu amor mais quando chega 4 o domingo fico na impressão que a tarde vou te ver e a inda mais aumenta o meu sofrer pois já estou arrependido da hora que me ausentei de lá . Embora já sabia que não suportava viver ausente de te meu amor , tentei só para sofrer , parece-me que tu és a única pessoa que Deus deixou para eu amar com todo amor que meu jovem coração encerra .\n\n\n\n Sem mais abraços fortes para você e aceite mil recordações .\n\n deste que te ama sem falsidade até o fim , do seu amor que muito te quer .\n\n Arnaldo Andrade Dias"
1,01-ACST-14-01-1952-mod.txt,Antonio Carneiro da Silva Tuy,Maria de Souza Estrela,1952-01-14,"Fazenda Bom Jardim 14 – 1 – 52 .\n\n Minha querida noiva Maria . Enviu-o os mesmos ... “Beijinhos.” Faço votos sinceros ao Divino Criador , que paz seja sempre o teu amparo.” E aos teus , que para mim será grande reforma de satisfação . Se com os méritos de Deus ; acolhermos singular transformação e vigor . 1 Eu e todos vamos na forma do costume . Em segundo lugar te falo que fomos bem de viagem . Tudo mais tu me relata , e[m] observação . Nada de abuso . O mais , o próprio tempo está incumbido para tudo . Sim , tu não notou quanto nós te abusamos ? Te deixamos muito abatida com os incômodos . Já quer que eu volte sexta-feira . Espere , vou empregar meios de ir . Sonhei contigo esta noite . Te abraçando e te beijando , dentro de uma casa , que muito silenciosa estava ; parecia ser nossa . A ti meus agradecimentos , votos e cuidados . Estou grato pelo presente , muito obrigado Segue estas bananinhas para tu , e minha mãe velha , para merendarem . E 20 litros de milho . Evandro envia-te as mesmas , e o velho . Um abraço em nossa mãe . Aceite minhas saudosas lembranças . A.C.S.T .\n\n Antonio Carneiro da Silva . 2\n\n <minha pena está – 2 – [ . ] – escarranchada.> 3\n\n 1 Há pontos aleatórios após a palavra .\n\n 2 Escrito na margem inferior .\n\n 3 Escrito verticalmente , de baixo para cima ."
2,01-AFS-28-04-1956-mod.txt,Antonio Fortunato da Silva.,João Carneiro de Oliveira.,1956-04-28,"Carrancudo 28 de Abril de 1956 Prezado queridinho estimado amigo Pitanga esta duas linha lhe dizer procura a notícia de você e todo seu todo meu vai como Deus quiser como vai o nosso inverno a qui faz muito sro nada fazer não patenmos 1 sem queridinho . p. compadres Pedro já esqueceu de mim não esqueça mande dizer como vai o senhor compadre eu estimo de longe de perto não posso adeus a te , se Deus quiser nada mais prezado seu amigo 2 sim meu queridinho amigo Augusto como vai amigo você também não esqueç[.]a 3 de mim lembra do nosso [?] passado se Deus mim ordem faço intenção de ir de pura de são João Deus e saber nada mais do seu prezado amigo\n\n Antonio Fortunato Silva Agsto Augusto lembrança daquela\n\n dei menina Maria Jertrudes meu Coração [?] a tina aimario\n\n 1 Após a palavra há traço vertical cortado por dois traços horizontais .\n\n 2 Após a palavra há traço vertical cortado por um traço horizontal .\n\n 3 Desgaste do papel devido à dobra ."
3,01-APACA-14-01-1980-mod.txt,Adelmário Carneiro de Araújo,Eliana de Oliveira Lima,1980-01-14,"Valente , 14 de janeiro de 1980\n\n Olá Amor tudo bem ?\n\n Olha querida espero que esta a encontre com paz e saúde juntamente com os seus manos e pais e familiares .\n\n Aninha quando você receber esta carta me responda logo por que estou com medo de você não receber esta e pensar que eu não lhe escrevi , por que tenho dúvidas no endereço que não conheço , mas aqui em Valente tudo bem , conheço tudo .\n\n Quando você subiu no ônibus me deu uma vontade tremenda de viajar com você pelo menos até em Feira de Santana mas quando a gente é empregado só pode sair aos sábados e feriados , minhas férias será de 15 - 04 à 13 - 05 - 80 um período de estudos mas assim mesmo vou sair uns 15 dias .\n\n Querido até hoje sinto sua falta , até hoje penso naqueles dias felizes que estava junto a ti com aquele , todo afeto todo amor e ternura com aquele teu sorriso doce , meigo com teus lábios sensíveis e aquele gesto de menina moça .\n\n Para mim você foi até hoje a menina que muito marcou em minha vida , se você estivesse aqui perto de mim eu não ficaria um dia sem ti ver por que você é uma menina linda e sabe sair com um namorado < ↑ você é > uma garota simples que não tem medo da realidade , para mim você foi meu ideal , só falta você vir aqui para morar ou eu morar ai em Salvador agora que trabalhe perto para eu lhe encontrar todos os dias . Você me falou na foto da moto eu mandei hoje o nosso filme para a Sandra , assim que chegar eu lhe envio as fotos .\n\n Eliana menina linda menina que mora no sertão Para que ficar triste agora Se tu estás em meu coração\n\n Eliana garota inteligente Não sei como conseguir te encontrar mas só sei que tu és linda E te quero e quero muito para te amar .\n\n Se eu fosse um jardineiro te daria uma flor Como sou um estudante te darei o meu amor . Sem mais do seu inesquecível que nunca te esquece 1 .\n\n Beijos e beijos do seu .\n\n Adelmário ( Maro )\n\n De lembranças a Angela e todo o pessoal legal dai ."
4,01-ARAB-13-12-1829-mod.txt,Antonio Rodriguez de Araujo Basto,Senhor Manoel Ignacio da Cunha e Menezes,1829-12-13,"Ilustríssimo e Excelentíssimo Senhor Manoel Ignacio daCunha e Menezes\n\n Rio 13 de Dezembro de 1829 .\n\n Meu amigo e Senhor . A sua carta de 6 do mês próximo passado me deu grande satisfação por trazer-me não só a notícia da sua feliz viagem , como a de ter achado com saúde toda a sua Família , á quem rendo os meus respeitos , que igualmente são dirigidos por minha mulher , a qual agradece os cumprimentos de Vossa Excelência , dando-lhe o parabéns de se – achar restituído ao seio da sua cara Família , sendo nestes sentimentos acompanhada por meu sogro , e sogra 1 , que muito se – recomendam . Desejando á Vossa Excelência saúde , e venturas passo á solicitar com instância que me- empregue no seu serviço , pois sempre me – achará pronto por ser Rogo á Vossa Excelência me – recomende aos Excelentíssimos Senhores Telles , e Antonio e Augusto . De Vossa Excelência Amigo reconhecido , e criado obrigado\n\n Antonio Rodriguez de Araujo Basto ."


### Indexação dos documentos no Whoosh

Usamos o módulo [Whoosh](https://whoosh.readthedocs.io/en/latest/index.html) para criar o índice dos documentos e adicionar o texto das cartas e os metadados. Isso é feito por meio de um esquema ([*schema*](https://whoosh.readthedocs.io/en/latest/schema.html)), que define os campos que conterão as informações sobre os documentos indexados. 

O esquema criado contém os seguintes campos (com os seus tipos entre parênteses):

  - id (ID único): nome do arquivo
  - de (TEXT): remetente da carta
  - para (TEXT): destinatário
  - data (DATETIME): data da carta
  - texto (TEXT): texto da carta pré-processado
  
Quando um documento é adicionado ao índice criado com base num esquema, um analizador (*analyzer*) é chamado para processar as informações associadas ao documento e guadar os resultados nos campos correspondentes (https://whoosh.readthedocs.io/en/latest/schema.html). Para campos do tipo TEXT, são guardadas a frequência com que termos (*tokens*) aparecem e as suas posições no texto.

No Whoosh, um analizador é geralmente composto por um tokenizador (*tokenizer*) e um ou mais filtros (*filters*) (https://whoosh.readthedocs.io/en/latest/api/analysis.html). O tokenizador quebra o texto fornecido em seus termos elementares (ex., palavras). Os filtros recebem esses termos e os transformam (ex., os convertem para minúsculas, eliminam palavras de uma lista de *stopwords*).

O analyzador padrão do Whoosh é o [StandardAnalyzer](https://whoosh.readthedocs.io/en/latest/api/analysis.html#whoosh.analysis.StandardAnalyzer), criado para processar documentos em inglês. Como os documentos do nosso corpus estão em português, foi necessário utilizar o [LanguageAnalyzer](https://whoosh.readthedocs.io/en/latest/api/analysis.html#whoosh.analysis.LanguageAnalyzer), que inclui os seguintes filtros:
  
  - *LowercaseFilter*: converte os termos para minúsculas
  - *StopFilter*: elimina termos correspondentes a palavras muito comuns e de pouco valor semântico (ex., artigos definidos e indefinidos), renumerando (ou não) a posição de ocorrência de cada termo remanescente no texto; 
  - *StemFilter*: remove sufixos de termos usando, geralmente, o algoritmo de Porter (https://whoosh.readthedocs.io/en/latest/api/analysis.html#whoosh.analysis.StemFilter)
  
Abaixo, vemos as línguas disponíveis no *LanguageAnalyzer* e verificamos se há função de *stemming* e uma lista de *stopwords* para o português:

In [5]:
from whoosh import lang
print('Línguas disponíveis:', lang.languages)
print('Stemmer em português disponível?', lang.has_stemmer('pt'))
print('Stopwords em português diponível?', lang.has_stopwords('pt'))

Línguas disponíveis: ('ar', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'hu', 'it', 'no', 'pt', 'ro', 'ru', 'es', 'sv', 'tr')
Stemmer em português disponível? True
Stopwords em português diponível? True


Como queríamos realizar buscas nos campos do remetente e do destinatário, não era possível usar o *languageAnalyzer* diretamente. No caso de nomes próprios, não podemos passar os termos para minúsculas, remover *stopwords*, ou fazer o *stemming*. Dessa forma, criamos outro *analyzer* apenas com o [RegexTokenizer](https://whoosh.readthedocs.io/en/latest/api/analysis.html#whoosh.analysis.RegexTokenizer). Os resultados gerados com ele são ilustrados abaixo. 

In [6]:
RexTokenizer = RegexTokenizer(expression='[a-zA-Z0-9áàâãéèêíïóôõöúçñÁÀÂÃÉÈÍÏÓÔÕÖÚÇÑ]*')
[token.text for token in RexTokenizer(u"Benicio, Álvares. da Conceição")]

['Benicio', '', '', 'Álvares', '', '', 'da', '', 'Conceição', '']

Para fins de avaliação dos resultados das nossas buscas, criamos também outro *analyzer* apenas com tokenizador *RegexTokenizer* e os filtros *LowercaseFilter* e *StopWords*. Mostramos abaixo o resultado para o texto da primeira carta em nosso corpus.

In [7]:
BaseAnalyzer = RegexTokenizer() | LowercaseFilter() | StopFilter(lang='pt')

lista = [token.text for token in BaseAnalyzer(cartas.texto[0])]
sorted(lista)

['17',
 '1962',
 'abraços',
 'abril',
 'aceite',
 'acredite',
 'adeus',
 'ama',
 'amar',
 'amor',
 'amor',
 'amor',
 'amor',
 'andrade',
 'arnaldo',
 'arrependido',
 'aumenta',
 'ausente',
 'ausentei',
 'bem',
 'caneta',
 'chega',
 'cheio',
 'coração',
 'cruel',
 'dando',
 'deixou',
 'deste',
 'deus',
 'dias',
 'domingo',
 'embora',
 'encerra',
 'escrever',
 'falsidade',
 'fico',
 'fim',
 'fortes',
 'hora',
 'impressão',
 'inda',
 'inesquicível',
 'jovem',
 'lembrança',
 'longe',
 'lurdes',
 'lá',
 'mata',
 'mil',
 'notícias',
 'parece',
 'paulo',
 'peguei',
 'pessoa',
 'pois',
 'quer',
 'recordações',
 'rude',
 'sabia',
 'saudade',
 'saúde',
 'sofrer',
 'sofrer',
 'suportava',
 'talvez',
 'tarde',
 'tarde',
 'tentei',
 'todo',
 'tristonho',
 'ver',
 'viver',
 'vou',
 'vou',
 'és',
 'única']

Para fins de comparação, segue o mesmo teste para o *languageAnalyzer*.

In [8]:
LanguageAnalyzerPt = LanguageAnalyzer(lang='pt')

lista = [token.text for token in LanguageAnalyzerPt(cartas.texto[0])]
sorted(lista)

['17',
 '1962',
 'abrac',
 'abril',
 'aceit',
 'acredit',
 'adeus',
 'ama',
 'amar',
 'amor',
 'amor',
 'amor',
 'amor',
 'andrad',
 'arnald',
 'arrepend',
 'aument',
 'ausent',
 'ausent',
 'bem',
 'canet',
 'cheg',
 'chei',
 'coraçã',
 'cruel',
 'dand',
 'deix',
 'dest',
 'deus',
 'dias',
 'doming',
 'embor',
 'encerr',
 'escrev',
 'falsidad',
 'fic',
 'fim',
 'fort',
 'hor',
 'impressã',
 'inda',
 'inesquic',
 'jov',
 'lembranc',
 'long',
 'lurd',
 'lá',
 'mat',
 'mil',
 'notíc',
 'parec',
 'paul',
 'pegu',
 'pesso',
 'pois',
 'quer',
 'record',
 'rud',
 'sab',
 'saudad',
 'saúd',
 'sofr',
 'sofr',
 'suport',
 'talvez',
 'tard',
 'tard',
 'tent',
 'tod',
 'tristonh',
 'ver',
 'viv',
 'vou',
 'vou',
 'és',
 'únic']

A definição do analizador pode ser feita na própria definição do esquema. Inicialmente, criamos o esquema e o índice (a partir do esquema), e indexamos os documentos do nosso corpus usando o *analyzer* baseado apenas no *RegexTokenizer* e o *analyzer* baseado no *LanguageAnalyzer* sem o filtro de *stemming*.

In [9]:
if os.path.exists('index_cartas'):
   for file in os.listdir('index_cartas'):
        file_path = os.path.join('index_cartas', file)
        if os.path.isfile(file_path):
            os.remove(file_path)
   os.rmdir('index_cartas')

In [10]:
schema = Schema(id=ID(unique=True, stored=True), 
                de=TEXT(stored=True,
                        analyzer=RegexTokenizer(expression='[a-zA-Z0-9áàâãéèêíïóôõöúçñÁÀÂÃÉÈÍÏÓÔÕÖÚÇÑ]*')), 
                para=TEXT(stored=True,
                          analyzer=RegexTokenizer(expression='[a-zA-Z0-9áàâãéèêíïóôõöúçñÁÀÂÃÉÈÍÏÓÔÕÖÚÇÑ]*')), 
                data=DATETIME(stored=True), 
                texto=TEXT(stored=True,  
                           analyzer=RegexTokenizer() | LowercaseFilter() | StopFilter(lang='pt')))

os.mkdir('index_cartas')
ix = create_in('index_cartas', schema)

writer = ix.writer()

for i in cartas.index:
    if pd.isna(cartas.de[i]):
        cartas.de[i] = ''
        
    if pd.isna(cartas.para[i]):
        cartas.para[i] = '' 
    
    if pd.isna(cartas.data[i]):
        writer.add_document(id=cartas.id[i], 
                            de=cartas.de[i], 
                            para=cartas.para[i], 
                            texto=cartas.texto[i])
    else:
        writer.add_document(id=cartas.id[i], 
                            de=cartas.de[i], 
                            para=cartas.para[i], 
                            data=cartas.data[i], 
                            texto=cartas.texto[i])
writer.commit()

### Buscas (Questão 1 da Lista 1):

O corpus analisado inclui 43 cartas escritas por Benício Penalva, comerciante de peles de Itapicuru, para o Coronel Cícero Dantas Martins, Barão de Jeremoabo (1880-1903). As cinco primeiras são listadas a seguir, juntamete com os temas tratados em cada uma delas.

In [11]:
jeremoabo = cartas.loc[cartas.de.str.startswith('Benicio Penalva'), :].copy()
jeremoabo['tema'] = ['emprego, educação, saúde', 'política', 'emprego, política', 'emprego, política', 'outros', 
                     'outros', 'emprego', 'emprego', 'emprego, educação', 'emprego', 'emprego', 'política', 
                     'política', 'política', 'política, saúde', 'política', 'política', 'política', 'política', 
                     'política', 'política', 'política, saúde', 'política, saúde', 'política, saúde', 'política', 
                     'política', 'política', 'política', 'política', 'política', 'política, educação', 'política', 
                     'política', 'política', 'política, saúde', 'política, saúde', 'emprego, saúde', 'política', 
                     'política', 'política, saúde', 'política', 'educação, emprego', 'emprego, política']
jeremoabo.head(5)

Unnamed: 0,id,de,para,data,texto,tema
716,354-BPF-27-03-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-03-27,"Meu caro Primo compadre e amigo Sr. Barão .\n\n Bahia 27 de Março de 1890\n\n Aqui cheguei com minha família no dia 15 deste e só no dia 25 - pude ir a casa do Doutor Salustio , e não o encontrando , tornei hoje , e com ele estive conversando : apresentei-lhe a carta de Vossa Excelência como me ordenou . Disse-me o Doutor Salustio , que soube estarem esperando hoje pelo Visconde 5 do- Guahy , e que não sabia se era exata essa notícia : preveni ao- Doutor Salustio para falar ao Guahy , sobre um emprego no novo hospital da misericórdia , segundo Vossa Excelência me ter dito que queria ver se podia obter com o Guahy um bom emprego para mim-\n\n no dito hospital . Vossa Excelência sabe que muito e muito preciso , e que só me arrisquei a vir com a família para esta capital , com único fim de dar a meus filhos uma educação mais ou menos regular , - pois é o meu maior desideratum . Já matriculei dois meninos- no Lyceo , e minha filha hoje , foi 6 também matriculada no externato normal de Senhoras . Se eu puder conseguir os meus- desejos , é um meio de vida que dou a ela , visto não termos outro de que possa ela viver . Sua afilhada , e o do Doutor Severino , ainda não pôde levá-los a escola , por faltar- me um\n\n atestado médico , de como não sofrem moléstia alguma contagiosa , do 7 que só poderei dar andamento depois da semana Santa . Tenho andado tanto aqui , que já 8 me doem as pernas , de maneiras que , para caminhar , é em marcha muito lenta . Tenho feito muita despesa com as arrumações dos meninos , bem entendido , de conformidade a minhas forças , por que cada um vive como pode , e- como sabe , não tenho recursos . Provisoriamente estou morando- na rua do Alvo , nº 201 – 2º andar , em quanto procuro uma roça para ir tendo alguma cousa com que possa ir dando a sub-\n\n a subsistência a meus filhos : Deus é grande e não desampara- a ninguém , principalmente a quem faz diligência com fé nele . Logo que ache a roça e arrende , preciso comprar uns burros 9 , e- desde já lhe previno , por serem os de Vossa Excelência reforçados . Meu filho Francisco , desde que aqui- chegou , entrou em tratamento com o Doutor Ribeiro dos Santos , por se achar sofrendo bastante dos olhos . Aqui tem chovido alguma cousa , e consta-me que por lá também ; Deus permita que continue . Sua Comadre está muito satisfeita aqui , - por ter o mesmo desejo que eu\n\n tenho de ver os filhos educados . Não temos tido alteração em nossa saúde graças a Deus . Muito estimo que ao lado da Excelentíssima Baronesa frua perfeita saúde e todos os- bens . Abençõe sua afilhada , e disponha sempre com a maior- franqueza , do pouco préstimo deste que com muita estima e- melhor consideração é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva . P. S. Recebeu uma carta com a- escritura para o Sr. Boaventura ? Remetia pelo correio do Timbó- que devia seguir no dia 17 deste .\n\n O mesmo","emprego, educação, saúde"
717,355-BPF-13-08-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-08-13,"Meu Prezado Primo compadre e amigo Sr. Barão\n\n Bahia 13 de Agosto de 1890\n\n Anteontem estive com Joãozinho , por tê-lo encontrado no comércio , e- perguntando-lhe por Vossa Excelência , disse-me estar incomodado de sua saúde , o- que muito sinto : desejando que ao receber esta , se ache vigoroso ao lado da Excelentíssima Baronesa , com quem receberá nossas felicitações . O que há de mais importante aqui é a grande questão de esgotos 10 que não lhe é mais estranho . O marechal Hermes está mal de saúde , ouvi dizer que os- médicos o privarão de falar e que de vez em quando apresenta-lhe uma- hemorragia de sangue . O < redator > 11 do pequeno jornal tem brilhado\n\n nessa grande questão de esgotos , ultimamente disse que se o governador não sabia governar , que descesse dessa cadeira e intregasse-a a outro , esta frase é relativa aos indigentes da seca . Temos eleição no dia 15 de setembro 12 como sabe , e aqui estou sempre a- suas ordens , deliberando Vossa Excelência como melhor entender . No dia 17 , está anunciado uma grande reunião para formar-se o partido nacional , o que me diz a respeito ? Aqui ou em qualquer parte que esteja contará sempre com o meu fraco serviço . Tem chovido bastante aqui . Abençõe sua afilhada e dê- suas ordens a este que com toda\n\n estima , consideração e respeito é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva",política
718,356-BPF-19-09-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-09-19,"Meu Prezado Primo compadre e amigo Sr. Barão .\n\n Bahia 19 de Setembro 13 de 1890\n\n Desejo que com a Excelentíssima Baronesa frua perfeita saúde e todos o bens . Hoje encontrei-me no Comércio- com Joãozinho , e perguntando por Totonho , disse-me estar bom . Até hoje está o seu nome incluído na lista- dos candidatos mais votados , e terei grande prazer se for eleito . Como sei que Vossa Excelência é amigo do Conselheiro Virgilio Damasio , e está ele na administração do estado , peço-lhe , de sendo-lhe possível , obter com ele o lugar de inspetor da linha telegráfica do governo , no Estado de gergipe [*] 14 , numa seção que está vaga\n\n e adida ao inspetor Antonio Ribeiro , ou outro lugar aqui na Capital , que Vossa Excelência julgar conveniente . O Doutor Loizio , continua- na administração de engenheiro- geral dos telégrafos , pelo que ju julgo que não lhe será muito difícil conseguir para mim o lugar de inspetor , como peço . Vossa Excelência não ignora que muito preciso , por ser este uma meio fácil de conseguir a educação de meus filhos . Fiquei admirado não ter Vossa Excelência um só voto no Palácio [...] 15 ( termo do Conde ) ao passo que o Doutor Severino teve no Barração 180 - Como se explica isto ? ! Abençõe- sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
719,357-BPF-01-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-01-10,"Meu Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 1º de outubro 16 de 1890\n\n Desejo a continuação de sua preciosa saúde ao lado da Excelentíssima Baronesa com quem receberá nossas visitas . Sua carta de 24 , foi-me entregue a 29 do próximo passado a qual respondo . Deixo de procurar o Doutor Severino , por me ligar ele pouca ou nenhuma importância , tanto assim , que estou aqui nesta capital desde o dia 15 de Março , e morando ele perto de mim , não achou ainda um instante para vir a meu pobre rancho , mas , sem levar isto em consideração , votei nele , para assim cumprir um dever de gratidão , já como parente e já mesmo como amigo Fiquei admiradíssimo o modo por- que foi Vossa Excelência tratado no 8º distrito , bem entendido , nos colégios onde o Severino tem mais força , ao passo que no seu distrito teve ele explendida votação em todos os colégios . Antes da eleição procurei o Doutor Salustio para o mesmo emprego que lhe mandei falar , e ele depois de ter dado algumas providências para cientificar-se donde vinha a nomeação , respondeu-me que não podia , por depender da capital federal , onde não tinha força , em vista disto , deixo de procurá-lo para não me tornar imprudente . No dia 3 deste , não mandando Deus o contrário , sigo para Alagoinhas e dali vou ao engenho , voltando outra vez para Alagoinhas , onde estarei todos os sábados , pois a necessidade obriga-me - a expor-me a tudo ( com dignidade ) e viver separado da família , buscando os meios de nossa subsistência . Vivo sempre resignado com os infortúnios da sorte , Deus um dia se compadecerá de mim ! Já tinha sabido da traição que a última hora fez- lhe o Doutor João Dantas , não me causando porém admiração . Abençõe sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que com- muita estima e consideração é De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
720,358-BPF-05-10-1890-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-05-10,"Meu Prezado Primo compadre e amigo Sr. Barão .\n\n Timbó 5 de outubro 17 de 90 -\n\n Desejo-lhe e a Excelentíssima Baronesa a continuação de perfeita saúde e todos os bens . ontem cheguei aqui e saio amanhã em compras de fumo em Camissão , e como muito tenho que viajar , preciso comprar um burro que aguente-me o trabalho , pelo que , se- tem algum que sirva para minha montada e que não seja muito caro , querendo- vender , me responda , mandando o preço . Sua resposta deve ser dirigida a mim na estação do Sítio do Meio , onde sempre devo estar . Deixei minha família sem novidade graças a Deus Abençõe sua afilhada e dê suas-\n\n ordens a este que com toda estima e consideração é de\n\n Vossa Excelência\n\n Primo compadre e amigo pelo Coração\n\n Benicio Penalva",outros


Em 33 das cartas, Benício trata de disputas políticas e de ameaças e traições de pessoas ligadas ao Barão de Jeremoabo. Há inclusive menções a atentados e assassinatos relaciondados a essas disputas. Em 11, solicita colocações para ele mesmo ou para seu filho Francisco; em nove, trata de problemas de saúde seus e de sua família; em quatro, da educação de seus filhos. 

Utilizamos esse subjconto de documentos para testar e avaliar as funcionalidades de busca oferecidas pelo Whoosh.

Primeiro, criamos um objeto de busca (*searcher*) para o índice gerado anteriormente. O objeto de busca possui métodos úteis para obter informações do índice, como *lexicon* (https://whoosh.readthedocs.io/en/latest/searching.html), que retorna as cadeias de caracter (termos ou *tokens*) geradas para um dado campo. Mostramos abaixo exemplos de tokens gerados para os campos *texto* e *de*.

In [12]:
searcher = ix.searcher()
termos = [x.decode('utf-8') for x in list(searcher.lexicon("texto"))]
nomes =  [x.decode('utf-8') for x in list(searcher.lexicon("de"))]

In [13]:
print('Total de termos para o campo "texto":', len(termos))
print(termos[0:len(termos):500])

Total de termos para o campo "texto": 22328
['00', '43', 'acharei', 'agradeçamos', 'ana', 'apt', 'atrasamos', 'beneficiar', 'caixaqui', 'caótico', 'colchão', 'confianças', 'conversar', 'cânticos', 'deram', 'desvaneceram', 'dobrado', 'encarniçado', 'escondidas', 'exames', 'faças', 'fra', 'goze', 'ildefonso', 'influem', 'itinerário', 'legoas', 'machos', 'melhorando', 'mpromissos', 'novilha', 'ouvidos', 'pena', 'podera', 'pretencioso', 'pródigo', 'receberemos', 'reporte', 'romaria', 'seite', 'sonhos', 'telefonar', 'trambalhões', 'vaqueijada', 'voce']


In [14]:
print('Total de termos para o campo "de":', len(nomes))
print(nomes[0:len(nomes):50])

Total de termos para o campo "de": 678
['', 'Angelica', 'Belisario', 'Clarival', 'Dr', 'Fortunato', 'Inácio', 'Leal', 'Mariana', 'Nolasco', 'Pitanga', 'Salvador', 'Telles', 'Zulmira']


Em seguida, criamos um objeto do tipo *QueryParser*, informando o campo padrão que será o objeto das buscas e o esquema do índice em as buscas serão feitas. O próximo passo é chamar o método *parse* com a busca representada como uma cadeia de caracteres (https://whoosh.readthedocs.io/en/latest/querylang.html).

In [15]:
busca = 'de:"Benicio Penalva" AND texto:(política OR partido)'

qp = QueryParser("texto", schema=ix.schema)
q = qp.parse(busca)
print(q)

(de:"Benicio  Penalva " AND (texto:política OR texto:partido))


O método *search* recebe uma busca processada pelo método *parse* e retorna um objeto do tipo *Results*. Para que todos os resultados obtidos sejam incluídos no objeto gerado, deve-se especificar 'limit=None'. 

In [16]:
s = ix.searcher()

resultados = s.search(q, limit=None, terms=True)

print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')

if resultados.has_matched_terms():
    matched = [(campo, termo.decode('utf-8')) for campo, termo in resultados.matched_terms()]
    print('Termos com match:\n', matched)

hits=[]

for hit in resultados:
    hits.append(hit)

Foram gerados scores para  10 documento(s)
Termos com match:
 [('de', 'Penalva'), ('de', 'Benicio'), ('texto', 'política'), ('texto', 'partido'), ('de', '')]


In [17]:
#if resultados.has_exact_length():
#    print("Score gerado para", found, "de exatamente", len(results), "documentos.")
#else:
#    low = resultados.estimated_min_length()
#    high = resultados.estimated_length()
#    print("Score gerado para", found, "de", low, "a", high, "documentos.")

Das 33 cartas que tratavam de questões políticas, apenas 10 foram encontradas. Seguem os documentos:

In [18]:
recuperados = jeremoabo.loc[jeremoabo.id.isin([hit['id'] for hit in hits]), :]
recuperados

Unnamed: 0,id,de,para,data,texto,tema
717,355-BPF-13-08-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-08-13,"Meu Prezado Primo compadre e amigo Sr. Barão\n\n Bahia 13 de Agosto de 1890\n\n Anteontem estive com Joãozinho , por tê-lo encontrado no comércio , e- perguntando-lhe por Vossa Excelência , disse-me estar incomodado de sua saúde , o- que muito sinto : desejando que ao receber esta , se ache vigoroso ao lado da Excelentíssima Baronesa , com quem receberá nossas felicitações . O que há de mais importante aqui é a grande questão de esgotos 10 que não lhe é mais estranho . O marechal Hermes está mal de saúde , ouvi dizer que os- médicos o privarão de falar e que de vez em quando apresenta-lhe uma- hemorragia de sangue . O < redator > 11 do pequeno jornal tem brilhado\n\n nessa grande questão de esgotos , ultimamente disse que se o governador não sabia governar , que descesse dessa cadeira e intregasse-a a outro , esta frase é relativa aos indigentes da seca . Temos eleição no dia 15 de setembro 12 como sabe , e aqui estou sempre a- suas ordens , deliberando Vossa Excelência como melhor entender . No dia 17 , está anunciado uma grande reunião para formar-se o partido nacional , o que me diz a respeito ? Aqui ou em qualquer parte que esteja contará sempre com o meu fraco serviço . Tem chovido bastante aqui . Abençõe sua afilhada e dê- suas ordens a este que com toda\n\n estima , consideração e respeito é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva",política
744,371-BPF-25-12-1896-mod.txt,Benicio Penalva de Faria.,Benicio Penalva de Faria.,1896-12-25,"Prezado compadre e amigo Senhor Barão\n\n Bahia 25 de Dezembro de 1896 .\n\n Que com minha Excelentíssima Comadre e Thotonio tenha tido boas festas e que o novo ano lhes seja venturoso , - muito estimamos , aceitando com todos nossas visitas . Sua carta de 16 deste , em resposta as minhas de 18 e 25 do passado e de 5 e- 11 deste , me foi entregue no dia 22 - V. não se persuadia que o povo do Conselheiro recuava perante a força Federal , embora fosse ele em número- muito inferior ? Já desenganou-se ? O Conselheiro e os 64 fanáticos dele , estão- muito audazes , mas creio , que se derem um novo combate , como espera-se , ficarão aniquilados para sempre , por que a força 65 que para alí seguiu , [de]ve 66 constar de 500 praças , entre [li] nha 67 e polícia , e foi muito bem ar[ma]da 68 e municiada ; Creio que levarão 6 ou 8 metralhadoras e 2 canhões Brupe , e quando puserem estas armas de guerra a funcionar em [li] nha 69 de combate , é um arra [so] 70 por que os conselheiristas não [conhe]cendo 71 o perigo , virão morrer braço a braço , e aí a fuzilaria fará a maior carnificina . Sinto muito a morte sas crianças , mas do outro povo não , por que nenhum deles está [ali] 72 sem um fim de pervesidade . Quanto ao Senhor Salles Souza , não procuro interpelá-lo , por estar [....] 73 constantemente inconveniente e não\n\n desejo entrar com ele em certas averiguações . Por sua carta , vejo que o seu prejuízo nas Fazendas , é enorme , e nem podia deixar de ser , visto sua ausência , delas , a 14 anos , e ainda mais , com a- dificuldades de encontrar vaqueiros que tenhão interesse . Então não toma parte na eleição de 30 deste mês ? Acho-lhe razão , e melhor seria que abandonasse de vez a política , por que , a não ser uma oposição séria em todo o Estado e bem- arregimentada , não vale apenas : mas com que garantias ficão os seus amigos que tanto se sacrificarão , acarretando as maiores odeosidades , por contarem com o seu apoio e do Doutor José Gonsalves ? Ficão entregues a mercê das iras dos dominantes da época , não é assim ? O Doutor José Gonsalves , cada vez mais se afunda no abismo da inocência , e depois virá apresentar razões frívolas para defender-se . Quem foi o culpado de toda esta guerra inglória que temos sofrido , e continuaremos , talvez para sempre ? Forão os soldados do partido , ou os seus Diretores ? A debandada é extraordinária , principalmente aqui na capital . É bem escusado dizer-lhe , que sempre me encontrará firme a seu lado , sejão quais forem as circunstâncias , muito embora o meu apoio seja insignificante . Passamos regularmente graças a Deus Abençõe - sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração B. Penalva 74\n\n 74 Grafismo .",política
745,372-BPF-12-02-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-12-02,"Prezado Primo compadre e amigo Sr. Barão .\n\n Bahia 12 de Fevereiro de 1897 .\n\n No dia 7 a 1 hora da tarde me foi entregue sua carta de 5 deste mês , e- como não houvesse mais tempo a aproveitar o correio , mesmo levando na estrada de ferro , por isso só hoje respondo . Estimo a continuação de sua vigorosa saúde , de minha Excelentíssima Comadre e Thotonio , com quem receberá minhas visitas . A Senhora de Joãozinho e o recém nascido , estão sem alteração na sua saúde , segundo disse-me ele anteontem . Amanhã deve chegar no Timbó o seu tambor , segundo disse- me o dono da fundição . No domingo seguiu o Moreira Cezar para Queimadas , indo assistir o seu embarque “ o governador ” que tem se rebaixado ao último furo , com m[e]do 75 do Moreira Cezar ; ontem segui[u] 76 o resto do 9º batalhão , e aqui chegou o 16 , que dizem seguirá brevem [ente] para os Canudos uma ala , fican [do] 77 a outra dando a guarnição ao esta [do] 78 . O Correio de Notícias veio com- muito arrojo contra o major Fe [bro]nio 79 , mas depois recuou-m[e] 80 - seravelmente , dizendo até , que esta [va] 81 pronto a dar as satisfações que quizessem . O Moreira Cezar quan [do] 82 soltou foi entender-se com o governador e constava que el [es] 83 almoçarão juntos . É tanta mentira que não se pode afirmar co[u]sa 84 alguma . Já 85 foi publica [do] 86\n\n no Diário da Bahia uma carta do Doutor José Gonsalves dirigida ao Doutor Filgueiras apoiando a nova organização do partido e afirmando aqui estar no dia 7 de Março para dar o seu voto , com o que muito animou aos amigos e desgostou aos adversários , que estão se queimando de raiva . É preciso não esmorecer-se e continuar-se desassombradamente , e com toda precisão , do contrário estamos perdidos , por que , se continuar este nefasto governo sem oposição , em breves dias ficaremos reduzidos ao nada . Não é preciso dizer-lhes , que como soldado , contará < sempre > com o meu diminuto auxílio , por que me conhece de longa data , e sabe que sempre estarei a seu lado , sejam quais for as circunstâncias . O Major Febronio tem escrito alguns artigos contra o Vianna , que são dignos de ler-se , e o correio nada tem respondido . Passo regularmente graças a Deus . Aceite um abraço do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 87\n\n 87 Grafismo .",política
747,374-BPF-28-06-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-06-28,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 28 de Junho de 1897 .\n\n Sendo hoje dia do seu aniversário , o felicito , e bem assim a toda Excelentíssima Família , por ter o creador lhe- concedido mais um ano de sua preciosa existência , para completa satisfação de todos os entes de sua Excelentíssima Família e bem assim , de todos os seus amigos ; permittindo o mesmo Deus , que esta sua existência se prolongue por muitos anos , aureolada de todas as felicidades ; é o que de coração lhe pode desejar o seu Primo compadre e amigo pelo Coração ( continua ) Benicio Penalva ( vire ) . Em continuação .\n\n No dia 26 , sábado , chegou o- nosso amigo Doutor Filgueiras e muito animado ; fui com outros amigos recebê-lo a bordo e o acompanhamos até a redação do “ O Republicano ” , e dali , até sua residência . O reconhecimento do nosso amigo , a meu ver , equivale a subida do nosso partido , e em vista da crise política que se desenrola na Capital Federal , devemos unirmo-nos como um só , para sustentarmos a Constituição de 24 de Fevereiro , violada pelo Presidente da República e seus amigos ; a ocasião é a mais oportuna possível para darmos combate a esses maragatos , defraudadores das 89 rendas públicas , e que vivem calcando- aos pés os nossos mais sagrados direitos de cidadãos livres ! Sinto , que melhores condições intelectuais e pecuniárias , estejam aquém do 90 meu desideratum , o que por esse motivo poderosíssimo , não posso provar o quanto em mim se passa ! Já 91 vou indo melhor do meu incômodo , a mais família passa regularmente , graças a Deus Abençõe sua afilhada e aceite um abraço do seu\n\n Primo compadre e Amigo pelo Coração\n\n B. Penalva 92\n\n 8 \n\n 9 \n\n 9 \n\n 92 Graifsmo .",política
760,382-BPF-29-11-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-11-29,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 29 de novembro 26 de 1897 .\n\n So meio dia , chegando em casa , de vinda da Estrada de ferro , onde com outros amigos fui receber o Doutor José Ignacio , que fôra intimado para comparecer a polícia , recebi sua carta de 26 e incluso uma para o Bahia , que farei todo o possível entregá-la hoje em mão própria . O Doutor José Ignacio veio com a Senhora e logo que saltou aqui na Estação , foi intimado ao preso ; por 27 um oficial para seguir á Polícia , respondeu-lhe que sim , mas , que primeiramente ia almoçar , o [0] 28 oficial foi delicado , respondendo- lhe que não o privava de ir almoçar , e tomamos um bonde expresso que para esse fim , já os nossos amigos tinham providenciado e seguimos para o nosso destino ; no Comércio tive precisão de saltar do bon[de] 29 para tratar de um negócio , e os 30 outros amigos , seguirão todos com o Doutor José Inacio e o tal oficial , de sorte que , até escrever-lhe esta , não soube mais o que houve , o que mais tarde irei tomar indagação , para poder lhe adiantar mais alguma cousa . Isto de criação de um novo partido , é especulação dos nossos adversários , para mais nos enfraquecer : Entendo que a oca[si]ão 31 é a mais oportuna possível , para estarmos todos unidos como um só , do contrário seremos engolidos , por esses bandidos . Toda essa perseguição é por causa da eleição de 1º de Março , para a qual devemos trabalhar com todas\n\n as forças , que seremos os vencedores , salvo se os nossos amigos fraquejarem , por temidos . A perseguição é extraordinária , mais em todo o caso , não devemos esmorecer . O Doutor João Dantas Coelho , chegou , e foi logo a Polícia e também derão-lhe logo liberdade , tanto que segue amanhã e deve ser o portador desta carta . Segundo o que ouvir dizer , saiu-se bem no interrogatório que fizerão . O glycério está em São Paulo , e a “ Nação , razão de nosso partido alí , tem brilhado , assim como o nosso Republicano . Então diz V. que fiz o José Lopes fazer uma viagem doida , e forçando-lhe a escrever a vapor ? Creio que cumpri com o meu dever , em vista dos ocorridos , por que não lhe apanharão de surpresa , como desejavam . O Terencinho está em casa do Pai na Estação do Sítio do Meio , posso lhe garantir , por que no dia 20 quando fui ao Timbó embarquei-me com o Pai dele e este disse-me estar ele em casa , e na minha volta no dia 22 , o vi na janela e disse-lhe adeus , mesmo do trem . Os nossos adversários hão de fazer tanta cousa , que depois não poderão sair- se do cipoal que estão 32 tecendo . Estimo a continuação de sua vigorosa saúde e todos os bens , e bem assim de toda Excelentíssima Família , com quem receberá nossas sinceras visitas . Escrevi-lhe pela mala de sábado , noticiando-lhe o estado do Doutor Domingos Mello , que a meu ver , está liquidado ; ainda hoje fui visitá-lo , e achei o no mesmo ou talvez pior , tanto que notei um enfraquecimento cerebral nele , devido talvez ao abatimento em que está . Passamos regularmente graças a Deus . Meu beijo a Cicero , e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva P. S. Depois que lhe escrevi esta fui procurar saber notícias do Doutor José Ignacio e do Doutor João Dantas Coelho , este encontrei na cidade Baixa , com Arlindo Leoni e disse-me não seguir hoje , por ter recebido nova intimação , para ir a Polícia , amanhã , e o Doutor José Ignacio encontrei o em casa do Doutor Filgueiras a noite [*] 33 , e disse-me já o terem despachado , é o que sei até o presente . Bahia 29 de Novembro 34 de 1897 . Benicio Penalva de Faria\n\n 33 Por "" noite ""\n\n 34 No original está grafado "" 9 bro "" .",política
763,385-BPF-17-01-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-01-17,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 17 de Janeiro de 1898\n\n Por Joãozinho , que segue amanhã , recebi suas cartas de 21 do mês findo e 10 deste . Estimo a continuação de sua vigorosa saúde e bem assim de toda Excelentíssima Família com quem receberá minhas sinceras visitas e saudades . Já foi publicado no “ Republicano ” o manifesto do general Glycério convocando todos os amigos à concorrer ao pleito de 1º de Março , e em meu fraco entender não devemos deixar correr a revelia , e sim trabalharmos todos unificados a um só , por que não sabemos o que será o dia da manhã . As Candidaturas dos Doutores Lauro Sodré e Fernando Lôbo , não nos deve ser indiferente por forma alguma , muito = embora tenhamos a certeza de não ser eles os reconhecidos . Estão publican[do] o interrogatório do antentado [*] 41 do dia 5 de novembro 42 , e querem por força encravar o Doutor Manuel Victorino e General Glycerio como cúmplices no atentado , somente com o fim , daquele não presidir as secções da Câmara da verificação de poderes , e este não tomar parte nas mesmas secções ; Estão publicando o inquerito . Parece-me que o Estado de sítio não será prorrogado , ( isto é não , ) por que , a banda[lhei]ra 43 que eles tem feito , é de tal ordem , que estão envergonhados , e não sei mesmo que saída darão a semelhante força ; Est[ão] empregando a intriga entre os nossos amigos como sucedeu com o Martins\n\n Junior , mas este já veio a imprensa desmascará los , o mesmo estão fazendo por todos os- Estados , com o fim de esmorecer a oposição . São uns Saltimbancos ! O Néro está- danado com o Arlindo Leone , por não ter- este se prestado as infâmias que ele queria , neste ponto , considero o Arlindo um homem de bem . O nosso “ Republicano ” vai mal nas finanças , por não haver capital para o custeio , e ficaremos perdidos sem a [...] 44 se perdermos o nosso orgão , único elemento que mostra ainda respirarmos , se por circunstâncias pecuniárias , for obrigado a fechar , estamos perdidos para sempre ; e está em condições tais de quebradeira , que suponho não chegar a 1º de Março .\n\n Como havemos de ficar , se nos faltar o 1º elemento que constitui a vida de um partido , mormente numa emergência desta , em vespera de uma eleição tão renhida como esta ? V. não falou em circunferência e nem em diâmetro , e sim , em sua nota , e na carta á Severiano , dizia o seguinte : que os parafusos tinham 14 centímetros , e que dobrada as pontas , achar-se-ia o centro , por isso ficamos sem saber deliberar , até mesmo os encarregados da fundição , disto como , metade de 14 são 7 , e nessas condições era impossível mandar-se preparar os parafusos por ser uma grossura extraordinária , além disto , não- mandou o comprimento da parte su- superior da chaveta , á ponta do parafuso , e nem tão pouco disse se queria com as porcas ou sem elas ; por que , tendo lá as porcas dos que estão servindo , não convém perdê-las , e nem também se podia preparar outras iguais , sem 45 saber se a grossura- exata ; por estas razões , as quais julgo judiciosas deixamos de fazer a encomenda , esperando novas ordens sua . João foi agora a fundição , e não- me avisou , e disse-me ter encomendado a caldeira . Fico certo das S. 46 de- feijões e sobre isso já falei á Severiano para ir recebê-las e dar o destino competente : Se V. não teve de sua lavra , para que toma esse cuidado conosco , tendo mais essa despesa ? Agradeço-lhe a lembrança que sempre- tem de mim . O nosso amigo Doutor Mello está aí com a família , dê-lhe lembranças . Passo regularmente graças a Deus Minha família deve estar hoje , ou aliás , desde sábado 15 deste , em casa de minha sogra . Sempre a seu dispor tem o pouco préstimo do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 47\n\n 47 Grafismo .",política
764,386-BPF-07-03-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-07-03,"Prezado compadre e amigo Senhor Barão .\n\n Bahia 7 de Março de 1898 .\n\n Recebi ontem sua carta de 2 vinda pelo Doutor José Dantas e estimo que com toda Excelentíssima Família continue a- gozar perfeita saúde e todos os bens , recebendo nossas sinceras visitas . Aqui na capital foi uma abstenção quase completa de ambos os lados , tendo apesar disso o- Campos <Salles> mais de mil votos de maioria ; o Lauro perdeu em todas as freguesias , exceto na da Li , aqui obteve uma maioria , creio que de mais de cem votos ; finalmente foi uma vergonha inaudita . O seu manifesto foi uma bom[ba] que explodiu contra nós , e uma grande arma para os adversários . No- Paraná houve ferimentos e mortes , vencendo o Lauro e em Santa Catharina , creio que também foi vencedor . Permita dizer-lhe , que pode o seu manifesto ter sido muito acertado , mas em meu modo de pensar , foi um desastre político para o nosso partido , na emergência em que estamos . Aqui na Lapa , freguesia de São Pedro , há uma casa que lhe serve e está exposta a venda , mas depende ainda da proprietária achar uma outra menor para comprar : A casa é onde os bondes de Nasarett fazem curva para o São Bento , entenda bem , os bondes que vem de Nasareth para São Bento , quase defronte do convento da Lapa , ou para melhor dizer , é a que faz quina na curva da Lapa . O Doutor Ruy Barbosa requereu habeas- corpus em favor dos presos desterrados , e o supremo Tribunal Federal , concedeu por unanimidade de votos , marcando o dia 48 26 deste mês para se apresentarem . Fico certo de entregar as chaves de uma casa ao Capitão Mariano , mas Thotonio 49 só me entregou a chave da porta da rua , não me dizendo onde tinha deixado as outras . O Republicano de anteontem transcreveo o protesto do\n\n Doutor Manoel Victorino e deu princípio a transcrição do manifesto do mesmo , cujas peças estão dignas de lê-se , não perca . O Doutor Mello seguiu no dia 1º para Ilhéus . Passamos regularmente graças a Deus , visitas a todos e um beijo no pequeno Cicero . Abençõe sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 50\n\n 50 Grafismo .",política
775,391-BPF-05-01-1900-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1900-05-01,"Prezado compadre e amigo Senhor Barão .\n\n Bahia 5 de Janeiro de 1900 . A melhor saúde ao lado de todos os entes que lhe são caros , muito estimo , aureolada de todas as felicidades e aceitando nossas visitas 57 . Por intermédio do Senhor Augusto da Silva Ribeiro lhe escrevi , remetendo-lhe a “ Bahia ” do “ Jornal de Notícias ” de 2 para lhe ir adiantando notícias da eleição , de acordo com o seu pedido , e não mandei mais nenhuma gazeta por falta de portador para o Timbó , e mesmo ; o correio- de Domingo , é provavel levar sem correspondência . Fui a redação da “ A Bahia ” e dei o seu nome e o endereço , segundo sua ordem , e por tanto , terça feira , 9 do Corrente , V. deve recebê-la . Segundo publicação da Bahia os nossos Candidatos são vencedores , exceto porém , o Santos Pereira , que está muito longe . As bandalheiras oficiais não lhe são estranhas , e por conseguinte deixo de mencioná-las , por que V. verá no resultado da “ A Bahia ” de ontem . Então o seu ex-cozinheiro disse , que eu dissera correr por sua conta a despesa da viagem da mulher dele , e toda 58 < á > mais ? Esta é igual ao que disse ele , ter eu dito , ser V. obrigado a sustentá-la ! Nesse\n\n caso não havia vida melhor ! Desde Domingo não vejo o Doutor Filgueiras e outros amigos nossos , de sorte que , só 59 sei , o que tem publicado 60 as gazetas . Houve uma abstenção terrível na eleição , como já previa , pela- frieza que observava , e lhe mandei dizer . Afinal foi o Néro- forçado a aceitar a Candidatura do Severino , que para mim , é igual a ele ou pior , e veremos o resultado . ... Se não houver uma mudança política , forçada pelas circunstâncias da ocasião , e que esta gente desapareça das altas posições sociais , nada faremos , e ficarão Senhores\n\n perpétuos deste Estado , digno de melhor sorte ! Passamos regularmente graças a- Deus e aceite o abraço do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 61\n\n 61 Grafismo .",política
778,394-BPF-28-10-1900-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1900-10-28,"Prezado Primo compadre e amigo Senhor Barão\n\n Bahia 28 de Outubro de 1900 Descendo ao Comércio na 3ª feira soube não ter seguido como me disse , e por três vezes o procurei no armazém do Motta e Silva e não o encontrei . Estimo que tenha feito boa viagem e que achasse minha Excelentíssima Comadre e todos os mais entes de sua verdadeira estima , no gozo da melhor saúde e todos os bens , recebendo minhas visitas , e dando aos seus inocentes Nettinhos um beijo . Tendo havido ultimamente algumas alterações na magistratura do nosso Estado , como sejão , remoções , nomeações , etc , e estando eu com o meu parente Doutor Raul Passos , - que é promotor do Tucano , este- mostrou-se me receioso de ser removido da comarca onde serve , por pertencer ela ao 5º distrito , onde V. é influência política ; pelo que eu disse-lhe que não havia motivo para receios , visto como estava certo que V. não o perseguiria . Sei perfeitamente que V. não pode depositar confiança nele , por ser filho desse- seu adversário e inimigo ; mas- lhe posso afirmar que é um bom moço , além de que ele mesmo teve- ocasião de dizer-me que era simplesmente magistrado e não político . Acresce ainda a circunstância de ser ele um moço principiante e com família , a quem certamente uma remoção é penoso , por que , como V. bem sabe , presentemente uma mudança acarreta 71 grandes despesas . Devendo eu atenções ao Raul por finezas que me fez , quando preparador de Villa Rica , na questão do nosso amigo João Albano que alí era processado por crime de- morte , e desejando retribuir-lhe essas finezas , resolvi espontaneamente escrever-lhe esta interessando-me por sua permanência no Tucano . Com a vista melhor conversaremos a respeito . Como sempre tem ao seu dispor o pouco préstimo do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 72\n\n 7 \n\n 72 Grafismo .",política
780,396-BPF-21-09-1902-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1902-09-21,"Prezado Primo compadre e amigo Senhor Barão\n\n Bahia 21 de setembro 75 de 1902 .\n\n Muito estimo que com minha Excelentíssima Comadre e todos os mais entes que lhe são caros , se ache fruindo vigorosa saúde , aureolada de todas as felicidades , dando um beijo de inocência a seus idolatrados netinhos , e aceitando nossas sinceras e saudosas visitas . Aqui cheguei de Theophilo Ottoni , (Minas) , no dia 15 do Corrente , tendo ido levar minha nora . Aqui chegando , soube , que é- bem possível – O Coronel Anizio Pinto Cardôso e outros , obterem o arrendamento efetivo da estrada de ferro ex-ingleza e ramal do-\n\n Timbó , pelo que , novamente lhe peço , no caso afirmativo , de não esquecer-se do pedido que lhe fiz , para [ser] 76 o meu filho Francisco coloca[do] 77 nessa estrada , como engenheiro [che]fe 78 do tráfego e locomoção , pois V. , sabe que somos pobres e precisamos 79 muito ganhar dinheiro , afim de p[o]dermos 80 viver com decência na [...] 81 cidade ; e não tendo para quem apelar se não para V. , queira desculpar minha exigência , por que , - os candidatos , ao logar , sem dúvid[a] 82 serão em grande número , e por- conseguinte , é preciso que de antemão V. previna-se com o- Coronel Anisio e outros sócios pretendentes do dito arrendamento Consta-me que o Doutor Filgueiras seguiu ontem para o Rio a mandado do Doutor Severino para tratar desse negócio , e é bem possível conseguir . Amanhã , está marcada uma reunião do partido republicano para tratar da chapa dos candidatos a eleição federal , e segundo consta-me , é Thotonio um <dos> escolhidos , o que muito me satisfará . Passamos regularmente e aceite o abraço sincero do seu\n\n Primo e amigo pelo Coração P. S. B. Penalva 83\n\n Amanhã sigo com sua Comadre e Laura para o Timbó . 84 O mesmo\n\n 83 Grafismo .\n\n 84 Traço .","emprego, política"


In [19]:
total = []
for i in recuperados.tema:
    total.append('política' in i)
    
print('Documento recuperados que tratam de política:', sum(total))

r = sum(total)/33
print('Revocação:', r)

p = sum(total)/len(recuperados.tema)
print('Precisão:', p)

Documento recuperados que tratam de política: 10
Revocação: 0.30303030303030304
Precisão: 1.0


In [20]:
s.close() # fechamos a busca

Os 10 documentos encontrados realmente dizem respeito à política. Dessa forma, a **revocação** do nosso método de busca foi de 10/33 = 30,3%, e a **precisão**, de 100%. 

Em seguida, para fins de comparação, repetimos a mesma busca utilizando o *analyzer* anterior para o campo 'texto' com um filtro de *stemming* adicional. Isso corresponde ao uso do *LanguageAnalyzer*. 

Para que o novo *analyzer* fosse utilizado nas buscas, foi necessário reconstruir o índice. 

In [21]:
schema = Schema(id=ID(unique=True, stored=True), 
                de=TEXT(stored=True,
                        analyzer=RegexTokenizer(expression='[a-zA-Z0-9áàâãéèêíïóôõöúçñÁÀÂÃÉÈÍÏÓÔÕÖÚÇÑ]*')), 
                para=TEXT(stored=True,
                          analyzer=RegexTokenizer(expression='[a-zA-Z0-9áàâãéèêíïóôõöúçñÁÀÂÃÉÈÍÏÓÔÕÖÚÇÑ]*')), 
                data=DATETIME(stored=True), 
                texto=TEXT(stored=True,  
                           analyzer=LanguageAnalyzer(lang='pt')))

ix = create_in('index_cartas', schema)

writer = ix.writer()

for i in cartas.index:
    if pd.isna(cartas.de[i]):
        cartas.de[i] = ''
        
    if pd.isna(cartas.para[i]):
        cartas.para[i] = '' 
    
    if pd.isna(cartas.data[i]):
        writer.add_document(id=cartas.id[i], 
                            de=cartas.de[i], 
                            para=cartas.para[i], 
                            texto=cartas.texto[i])
    else:
        writer.add_document(id=cartas.id[i], 
                            de=cartas.de[i], 
                            para=cartas.para[i], 
                            data=cartas.data[i], 
                            texto=cartas.texto[i])
writer.commit()

Reindexados os documentos, realizamos a mesma busca:

In [22]:
busca = 'de:"Benicio Penalva" AND texto:(política OR partido)'

qp = QueryParser("texto", schema=ix.schema)
q = qp.parse(busca)

s = ix.searcher()

resultados = s.search(q, limit=None, terms=True)

print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')

if resultados.has_matched_terms():
    matched = [(campo, termo.decode('utf-8')) for campo, termo in resultados.matched_terms()]
    print('Termos com match:\n', matched)

hits=[]

for hit in resultados:
    hits.append(hit)

Foram gerados scores para  14 documento(s)
Termos com match:
 [('de', 'Penalva'), ('de', 'Benicio'), ('texto', 'part'), ('de', ''), ('texto', 'polít')]


Os documentos recuperados foram os seguintes:

In [23]:
recuperados = jeremoabo.loc[jeremoabo.id.isin([hit['id'] for hit in hits]), :]
recuperados

Unnamed: 0,id,de,para,data,texto,tema
717,355-BPF-13-08-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-08-13,"Meu Prezado Primo compadre e amigo Sr. Barão\n\n Bahia 13 de Agosto de 1890\n\n Anteontem estive com Joãozinho , por tê-lo encontrado no comércio , e- perguntando-lhe por Vossa Excelência , disse-me estar incomodado de sua saúde , o- que muito sinto : desejando que ao receber esta , se ache vigoroso ao lado da Excelentíssima Baronesa , com quem receberá nossas felicitações . O que há de mais importante aqui é a grande questão de esgotos 10 que não lhe é mais estranho . O marechal Hermes está mal de saúde , ouvi dizer que os- médicos o privarão de falar e que de vez em quando apresenta-lhe uma- hemorragia de sangue . O < redator > 11 do pequeno jornal tem brilhado\n\n nessa grande questão de esgotos , ultimamente disse que se o governador não sabia governar , que descesse dessa cadeira e intregasse-a a outro , esta frase é relativa aos indigentes da seca . Temos eleição no dia 15 de setembro 12 como sabe , e aqui estou sempre a- suas ordens , deliberando Vossa Excelência como melhor entender . No dia 17 , está anunciado uma grande reunião para formar-se o partido nacional , o que me diz a respeito ? Aqui ou em qualquer parte que esteja contará sempre com o meu fraco serviço . Tem chovido bastante aqui . Abençõe sua afilhada e dê- suas ordens a este que com toda\n\n estima , consideração e respeito é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva",política
735,368-BPF-31-01-1895-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1895-01-31,"Prezado Primo compadre e amigo Sr. Barão\n\n Bahia 31 de Janeiro de 1895 .\n\n Recebi sua carta de 23 deste , e muito estimo que com a Excelentíssima minha Comadre e seus caros filhos continue a gozar perfeita saúde e todos os bens da vida , recebendo com todos nossas sinceras visitas e saudades . ontem o Governador baixou o ato suspendendo a lei da organização da guarda municipal ; mas creio , que o Conselho e o Intendente , não se submeteu a semelhante arbitrariedade ; tanto assim , que consta-me ter feito hoje as- nomeações da dita guarda ou parte dela . O Senhor Governador , está- parecendo um governador de bob[ão] Consta que no Rio tem havi[do] 50 grande movimento dos E[studan]tes 51 da Escola militar e os Jacobi[nos] 52 com a Polícia e que alguns oficiais ou Generais tem apresentado-se em favor dos estudantes ; e por telegrama que vi no Jornal de Notícias , creio que de ontem ou anteontem , diz , estar a Armada de prontidão , pelo que , parece-me 53 que as cousas lá não vão boas . Parece-me que aqui haverá barulho antes do fim de Março , se o governador entender de fazer valer sua arbitrariedade . ontem recebi um telegrama de Barretto , dizendo-me que fizesse o filho , o estudante da Escola , seguir no primeiro vapor , e como ele [ai]nda 54 não chegou aqui , por isso [peço]-lhe 55 o favor de remeter-lhe a inclusa carta com toda brevidade , a fim dele não demorar-se mais- em casa dos Avós , visto a exigência do Pai . Sem dúvida alí no Rio é necessário a presença dele com brevidade . Já tirei minha patente e mandei ontem para a Comarca , acompanhada de uma procuração a fim de prestar o juramento e tomar posse . Recebi esta semana uma carta de meu filho , o que está no Rio , dizendo-me que consta estar o colera em Minas e já a um mês ou mais [...] 56 , e que aí no Rio também dizião ter aparecido alguns casos , mas que ele não acreditava , visto já estar com tanto tempo e a comunicação que tem aquele Estado-\n\n com o do Rio , todos os dias pelo trem de ferro , e não estar tudo devastado ; pela moléstia , e que o estado sanitário do Rio era presentemente o melhor possível ; o que faz-me também crer , que não é o cólera morbus que alí , como em Minas está graçando ; por que esta moléstia desenvolve-se com uma rapidez extraordinária , salvo porém , se agora ela vem mais moderada do que em 1856 . Os nossos amigos daqui , estão muito animados , mesmo com relação ao Comandante do Destrito , e creio que ele não será contra nós , visto o que tenho observado dos governistas : Noto neles uma frieza com o- Comandante , de sorte que , nem ao me- ao menos falão nele , e quando por acaso falão , conhece-se o constrangimento com que estão . O calor aqui é extraordinário . Se o Conselheiro Couto não tem recebido suas cartas , está provado que tem sido destraviadas [*] 57 . Passamos regularmente , graças a Deus . Eu porém , estou sofrendo inchação- nas pernas , de poucos dias para cá . Abençõe sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n Benicio Penalva de Faria 58 P. S.\n\n Até hoje nada de candidato nosso , e a opinião , quase geral , é que deve ser o Marechal Floriano .\n\n O mesmo\n\n 57 Por “ extraviadas ” .\n\n 58 Grafismo .","política, saúde"
743,370-BPF-22-02-1895-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1895-02-22,"Prezado Primo compadre e amigo Senhor Barão\n\n Bahia 22 de Fevereiro de 1895 .\n\n No dia 18 as 6 horas da tarde me- foi entregue sua prezada carta de 13 deste , e no mesmo envolucro vierão diversas , que entreguei a seus donos , sendo algumas entregues no mesmo dia 18 , e outras no dia 19 . Os nossos amigos requererão habeas corpus preventivo , em favor dos oficiais e- guardas municipais , e o tribunal de apelação , negou : o que não é de estranhar-se , pois já se sabe o propósito em que estão os Senhores governistas , de- alarmarem ou anarquisarem a esta capital : requererão para o supremo tri[bu]nal 61 Federal , digo , os nossos- amigos requererão para o supremo tribunal federal , e não soube mais em que ficou . Quanto a eleição do dia 3 de Março , vejo que é 62 trabalhar-se - de balde , por que , ainda vencendo-se , será o nosso candidato depurado , como já se viu o ano passado , e além disto , vejo pouco interesse nessa eleição , da parte dos nossos amigos , ao menos , aqui na Capital , pouco ou nada se fala nela . O Doutor Lago- disse-me que seguia para o Conde no dia 25 , e na Abbadia , o Argemiro pediu ao\n\n Conselheiro Couto para mandar um dos nossos amigos para guiá-los alí , e até o- fazer esta , não soube qual será o que vai , nem mesmo- sei se irá algum . Quanto ao Timbó , creio que seremos alí derrotados , visto a mesa ser a mesma- que presídio a eleição do Doutor Manoel Victorino , e ainda mais , estarem alguns amigos nossos desgostosos , com o procedimento que tiverão no Conde , por ocasião do Júri , que pôs em liberdade o assassino Martinho Pinto de Souza , que publicamente matou ao pobre Victor Nunes do Nascimento , em sua própria casa , e os nossos amigos do Conde , protegem- escandalosamente o assassino , tanto que , o livrarão por unanimidade de votos : V. sabe que todos nós temos nosso amor próprio , e aos parentes do morto , cabe resentir-se do procedimento que tiverão e continuão , os nossos amigos , protegendo o assassino . Não me nego de forma alguma ao seu serviço , mas sinto aparecer estes desgostos entre amigos , e mormente em um lugar como o Timbó , que precisamos trabalhar muito para combater os adversários , que alí dispõem de todos os elementos . Hoje escrevo ao Doutor Pedro Mendes sobre a eleição , segundo sua ordem , assim como escreverei a outros amigos prevenindo-os . Estimo que com minha Excelentíssima Comadre e seus caros filhos continue a gozar perfeita saúde e todos os bens , recebendo com todos nossas visitas e saudades . O Calor aqui continua extraordinário , e nada de chover . Abençõe sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n Benicio Penalva de Faria 63\n\n 63 Grafismo .",política
744,371-BPF-25-12-1896-mod.txt,Benicio Penalva de Faria.,Benicio Penalva de Faria.,1896-12-25,"Prezado compadre e amigo Senhor Barão\n\n Bahia 25 de Dezembro de 1896 .\n\n Que com minha Excelentíssima Comadre e Thotonio tenha tido boas festas e que o novo ano lhes seja venturoso , - muito estimamos , aceitando com todos nossas visitas . Sua carta de 16 deste , em resposta as minhas de 18 e 25 do passado e de 5 e- 11 deste , me foi entregue no dia 22 - V. não se persuadia que o povo do Conselheiro recuava perante a força Federal , embora fosse ele em número- muito inferior ? Já desenganou-se ? O Conselheiro e os 64 fanáticos dele , estão- muito audazes , mas creio , que se derem um novo combate , como espera-se , ficarão aniquilados para sempre , por que a força 65 que para alí seguiu , [de]ve 66 constar de 500 praças , entre [li] nha 67 e polícia , e foi muito bem ar[ma]da 68 e municiada ; Creio que levarão 6 ou 8 metralhadoras e 2 canhões Brupe , e quando puserem estas armas de guerra a funcionar em [li] nha 69 de combate , é um arra [so] 70 por que os conselheiristas não [conhe]cendo 71 o perigo , virão morrer braço a braço , e aí a fuzilaria fará a maior carnificina . Sinto muito a morte sas crianças , mas do outro povo não , por que nenhum deles está [ali] 72 sem um fim de pervesidade . Quanto ao Senhor Salles Souza , não procuro interpelá-lo , por estar [....] 73 constantemente inconveniente e não\n\n desejo entrar com ele em certas averiguações . Por sua carta , vejo que o seu prejuízo nas Fazendas , é enorme , e nem podia deixar de ser , visto sua ausência , delas , a 14 anos , e ainda mais , com a- dificuldades de encontrar vaqueiros que tenhão interesse . Então não toma parte na eleição de 30 deste mês ? Acho-lhe razão , e melhor seria que abandonasse de vez a política , por que , a não ser uma oposição séria em todo o Estado e bem- arregimentada , não vale apenas : mas com que garantias ficão os seus amigos que tanto se sacrificarão , acarretando as maiores odeosidades , por contarem com o seu apoio e do Doutor José Gonsalves ? Ficão entregues a mercê das iras dos dominantes da época , não é assim ? O Doutor José Gonsalves , cada vez mais se afunda no abismo da inocência , e depois virá apresentar razões frívolas para defender-se . Quem foi o culpado de toda esta guerra inglória que temos sofrido , e continuaremos , talvez para sempre ? Forão os soldados do partido , ou os seus Diretores ? A debandada é extraordinária , principalmente aqui na capital . É bem escusado dizer-lhe , que sempre me encontrará firme a seu lado , sejão quais forem as circunstâncias , muito embora o meu apoio seja insignificante . Passamos regularmente graças a Deus Abençõe - sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração B. Penalva 74\n\n 74 Grafismo .",política
745,372-BPF-12-02-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-12-02,"Prezado Primo compadre e amigo Sr. Barão .\n\n Bahia 12 de Fevereiro de 1897 .\n\n No dia 7 a 1 hora da tarde me foi entregue sua carta de 5 deste mês , e- como não houvesse mais tempo a aproveitar o correio , mesmo levando na estrada de ferro , por isso só hoje respondo . Estimo a continuação de sua vigorosa saúde , de minha Excelentíssima Comadre e Thotonio , com quem receberá minhas visitas . A Senhora de Joãozinho e o recém nascido , estão sem alteração na sua saúde , segundo disse-me ele anteontem . Amanhã deve chegar no Timbó o seu tambor , segundo disse- me o dono da fundição . No domingo seguiu o Moreira Cezar para Queimadas , indo assistir o seu embarque “ o governador ” que tem se rebaixado ao último furo , com m[e]do 75 do Moreira Cezar ; ontem segui[u] 76 o resto do 9º batalhão , e aqui chegou o 16 , que dizem seguirá brevem [ente] para os Canudos uma ala , fican [do] 77 a outra dando a guarnição ao esta [do] 78 . O Correio de Notícias veio com- muito arrojo contra o major Fe [bro]nio 79 , mas depois recuou-m[e] 80 - seravelmente , dizendo até , que esta [va] 81 pronto a dar as satisfações que quizessem . O Moreira Cezar quan [do] 82 soltou foi entender-se com o governador e constava que el [es] 83 almoçarão juntos . É tanta mentira que não se pode afirmar co[u]sa 84 alguma . Já 85 foi publica [do] 86\n\n no Diário da Bahia uma carta do Doutor José Gonsalves dirigida ao Doutor Filgueiras apoiando a nova organização do partido e afirmando aqui estar no dia 7 de Março para dar o seu voto , com o que muito animou aos amigos e desgostou aos adversários , que estão se queimando de raiva . É preciso não esmorecer-se e continuar-se desassombradamente , e com toda precisão , do contrário estamos perdidos , por que , se continuar este nefasto governo sem oposição , em breves dias ficaremos reduzidos ao nada . Não é preciso dizer-lhes , que como soldado , contará < sempre > com o meu diminuto auxílio , por que me conhece de longa data , e sabe que sempre estarei a seu lado , sejam quais for as circunstâncias . O Major Febronio tem escrito alguns artigos contra o Vianna , que são dignos de ler-se , e o correio nada tem respondido . Passo regularmente graças a Deus . Aceite um abraço do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 87\n\n 87 Grafismo .",política
747,374-BPF-28-06-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-06-28,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 28 de Junho de 1897 .\n\n Sendo hoje dia do seu aniversário , o felicito , e bem assim a toda Excelentíssima Família , por ter o creador lhe- concedido mais um ano de sua preciosa existência , para completa satisfação de todos os entes de sua Excelentíssima Família e bem assim , de todos os seus amigos ; permittindo o mesmo Deus , que esta sua existência se prolongue por muitos anos , aureolada de todas as felicidades ; é o que de coração lhe pode desejar o seu Primo compadre e amigo pelo Coração ( continua ) Benicio Penalva ( vire ) . Em continuação .\n\n No dia 26 , sábado , chegou o- nosso amigo Doutor Filgueiras e muito animado ; fui com outros amigos recebê-lo a bordo e o acompanhamos até a redação do “ O Republicano ” , e dali , até sua residência . O reconhecimento do nosso amigo , a meu ver , equivale a subida do nosso partido , e em vista da crise política que se desenrola na Capital Federal , devemos unirmo-nos como um só , para sustentarmos a Constituição de 24 de Fevereiro , violada pelo Presidente da República e seus amigos ; a ocasião é a mais oportuna possível para darmos combate a esses maragatos , defraudadores das 89 rendas públicas , e que vivem calcando- aos pés os nossos mais sagrados direitos de cidadãos livres ! Sinto , que melhores condições intelectuais e pecuniárias , estejam aquém do 90 meu desideratum , o que por esse motivo poderosíssimo , não posso provar o quanto em mim se passa ! Já 91 vou indo melhor do meu incômodo , a mais família passa regularmente , graças a Deus Abençõe sua afilhada e aceite um abraço do seu\n\n Primo compadre e Amigo pelo Coração\n\n B. Penalva 92\n\n 8 \n\n 9 \n\n 9 \n\n 92 Graifsmo .",política
759,381-BPF-20-11-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-11-20,"Prezado Primo compadre e amigo Excelentissimo Senhor Barão .\n\n Timbó 20 de novembro 20 de 1897 .\n\n ontem depois de já ter deitado na caixa uma carta para V. , ao meio dia recebi um chamado do Doutor Ribeiro- dos Santos , e como estav[a] 21 o almoço na mesa , fui primeiro almoçar e logo depois , quando já estava pronto para sair veio o criado novamente chamar-me ; segui imediatamente , e alí chegando encontrei com [com] o Doutor Ribeiro e Bahia ; perguntarão-me eles qual o meio mais fácil de lhe dar um aviso urgente , respondi que telegrafando para o Timbó , responderão-me que não era possível ser-lhe transmitido este aviso pelo telégrafo que dependia do maior sigilo ;\n\n em vista dessa respos[ta] 22 perguntei- lhes o que havia , responderão-me - havia ordem para ser V. preso , em vista da gravidade do caso ofereci-me para vir até aqui e por mim próprio lhe avisar para tomar suas cautelas . Depois o Bahia disse-me que a notícia vinha do Doutor Paulo Fontes , procurei entender-me com ele imediatamente o encontrando no grande Júri , disse-me 23 ele que soube por um empregado da polícia que o Vianna tramava sua prisão , e a força que para aí seguiu e que já aí está já era para esse fim , esta última parte é ilação que tiramos em vista de uma carta que saiu publicada no Republicano , que lhe remeto com outras gazetas pelo nosso amigo José Lopes de Almeida em quem deposito inteira confiança ; e lhe peço de- por ele responder-me imediatamente que pretendo voltar sem falta no dia 22 . Se o malvado Vianna trama contra V. estas misérias é de acordo com o Severino , que aliás ainda o julgo mais perverso do que o Vianna , basta ser mais inteligente . A prisão não é somente para V. e sim também para o- Doutor José Gonsalves e José Ignacio , para onde já seguiu- força : eles pretendem não somente lhes desfeitearem se não também , talvez mesmo eliminarem-nos . Tudo tem deve ter um paradeiro , até mesmo a perseguição . Hoje no encontro do trem vi Thotonio que decia para a Bahia , mas com a presteza do encontro nem ao menos 24 me foi possível falar-lhe . Não facilite as cousas , por que o negócio é- muito sério e gravíssimo . Estimo que com toda Excelentíssima Família goze saúde perfeita e todos os bens dando um beijo ao pequeno Cicero . Sempre a seu dispor tem o pouco préstimo do seu\n\n Primo compadre e Amigo pelo Coração\n\n B. Penalva 25\n\n 2 \n\n 25 Grafismo .",política
760,382-BPF-29-11-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-11-29,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 29 de novembro 26 de 1897 .\n\n So meio dia , chegando em casa , de vinda da Estrada de ferro , onde com outros amigos fui receber o Doutor José Ignacio , que fôra intimado para comparecer a polícia , recebi sua carta de 26 e incluso uma para o Bahia , que farei todo o possível entregá-la hoje em mão própria . O Doutor José Ignacio veio com a Senhora e logo que saltou aqui na Estação , foi intimado ao preso ; por 27 um oficial para seguir á Polícia , respondeu-lhe que sim , mas , que primeiramente ia almoçar , o [0] 28 oficial foi delicado , respondendo- lhe que não o privava de ir almoçar , e tomamos um bonde expresso que para esse fim , já os nossos amigos tinham providenciado e seguimos para o nosso destino ; no Comércio tive precisão de saltar do bon[de] 29 para tratar de um negócio , e os 30 outros amigos , seguirão todos com o Doutor José Inacio e o tal oficial , de sorte que , até escrever-lhe esta , não soube mais o que houve , o que mais tarde irei tomar indagação , para poder lhe adiantar mais alguma cousa . Isto de criação de um novo partido , é especulação dos nossos adversários , para mais nos enfraquecer : Entendo que a oca[si]ão 31 é a mais oportuna possível , para estarmos todos unidos como um só , do contrário seremos engolidos , por esses bandidos . Toda essa perseguição é por causa da eleição de 1º de Março , para a qual devemos trabalhar com todas\n\n as forças , que seremos os vencedores , salvo se os nossos amigos fraquejarem , por temidos . A perseguição é extraordinária , mais em todo o caso , não devemos esmorecer . O Doutor João Dantas Coelho , chegou , e foi logo a Polícia e também derão-lhe logo liberdade , tanto que segue amanhã e deve ser o portador desta carta . Segundo o que ouvir dizer , saiu-se bem no interrogatório que fizerão . O glycério está em São Paulo , e a “ Nação , razão de nosso partido alí , tem brilhado , assim como o nosso Republicano . Então diz V. que fiz o José Lopes fazer uma viagem doida , e forçando-lhe a escrever a vapor ? Creio que cumpri com o meu dever , em vista dos ocorridos , por que não lhe apanharão de surpresa , como desejavam . O Terencinho está em casa do Pai na Estação do Sítio do Meio , posso lhe garantir , por que no dia 20 quando fui ao Timbó embarquei-me com o Pai dele e este disse-me estar ele em casa , e na minha volta no dia 22 , o vi na janela e disse-lhe adeus , mesmo do trem . Os nossos adversários hão de fazer tanta cousa , que depois não poderão sair- se do cipoal que estão 32 tecendo . Estimo a continuação de sua vigorosa saúde e todos os bens , e bem assim de toda Excelentíssima Família , com quem receberá nossas sinceras visitas . Escrevi-lhe pela mala de sábado , noticiando-lhe o estado do Doutor Domingos Mello , que a meu ver , está liquidado ; ainda hoje fui visitá-lo , e achei o no mesmo ou talvez pior , tanto que notei um enfraquecimento cerebral nele , devido talvez ao abatimento em que está . Passamos regularmente graças a Deus . Meu beijo a Cicero , e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva P. S. Depois que lhe escrevi esta fui procurar saber notícias do Doutor José Ignacio e do Doutor João Dantas Coelho , este encontrei na cidade Baixa , com Arlindo Leoni e disse-me não seguir hoje , por ter recebido nova intimação , para ir a Polícia , amanhã , e o Doutor José Ignacio encontrei o em casa do Doutor Filgueiras a noite [*] 33 , e disse-me já o terem despachado , é o que sei até o presente . Bahia 29 de Novembro 34 de 1897 . Benicio Penalva de Faria\n\n 33 Por "" noite ""\n\n 34 No original está grafado "" 9 bro "" .",política
763,385-BPF-17-01-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-01-17,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 17 de Janeiro de 1898\n\n Por Joãozinho , que segue amanhã , recebi suas cartas de 21 do mês findo e 10 deste . Estimo a continuação de sua vigorosa saúde e bem assim de toda Excelentíssima Família com quem receberá minhas sinceras visitas e saudades . Já foi publicado no “ Republicano ” o manifesto do general Glycério convocando todos os amigos à concorrer ao pleito de 1º de Março , e em meu fraco entender não devemos deixar correr a revelia , e sim trabalharmos todos unificados a um só , por que não sabemos o que será o dia da manhã . As Candidaturas dos Doutores Lauro Sodré e Fernando Lôbo , não nos deve ser indiferente por forma alguma , muito = embora tenhamos a certeza de não ser eles os reconhecidos . Estão publican[do] o interrogatório do antentado [*] 41 do dia 5 de novembro 42 , e querem por força encravar o Doutor Manuel Victorino e General Glycerio como cúmplices no atentado , somente com o fim , daquele não presidir as secções da Câmara da verificação de poderes , e este não tomar parte nas mesmas secções ; Estão publicando o inquerito . Parece-me que o Estado de sítio não será prorrogado , ( isto é não , ) por que , a banda[lhei]ra 43 que eles tem feito , é de tal ordem , que estão envergonhados , e não sei mesmo que saída darão a semelhante força ; Est[ão] empregando a intriga entre os nossos amigos como sucedeu com o Martins\n\n Junior , mas este já veio a imprensa desmascará los , o mesmo estão fazendo por todos os- Estados , com o fim de esmorecer a oposição . São uns Saltimbancos ! O Néro está- danado com o Arlindo Leone , por não ter- este se prestado as infâmias que ele queria , neste ponto , considero o Arlindo um homem de bem . O nosso “ Republicano ” vai mal nas finanças , por não haver capital para o custeio , e ficaremos perdidos sem a [...] 44 se perdermos o nosso orgão , único elemento que mostra ainda respirarmos , se por circunstâncias pecuniárias , for obrigado a fechar , estamos perdidos para sempre ; e está em condições tais de quebradeira , que suponho não chegar a 1º de Março .\n\n Como havemos de ficar , se nos faltar o 1º elemento que constitui a vida de um partido , mormente numa emergência desta , em vespera de uma eleição tão renhida como esta ? V. não falou em circunferência e nem em diâmetro , e sim , em sua nota , e na carta á Severiano , dizia o seguinte : que os parafusos tinham 14 centímetros , e que dobrada as pontas , achar-se-ia o centro , por isso ficamos sem saber deliberar , até mesmo os encarregados da fundição , disto como , metade de 14 são 7 , e nessas condições era impossível mandar-se preparar os parafusos por ser uma grossura extraordinária , além disto , não- mandou o comprimento da parte su- superior da chaveta , á ponta do parafuso , e nem tão pouco disse se queria com as porcas ou sem elas ; por que , tendo lá as porcas dos que estão servindo , não convém perdê-las , e nem também se podia preparar outras iguais , sem 45 saber se a grossura- exata ; por estas razões , as quais julgo judiciosas deixamos de fazer a encomenda , esperando novas ordens sua . João foi agora a fundição , e não- me avisou , e disse-me ter encomendado a caldeira . Fico certo das S. 46 de- feijões e sobre isso já falei á Severiano para ir recebê-las e dar o destino competente : Se V. não teve de sua lavra , para que toma esse cuidado conosco , tendo mais essa despesa ? Agradeço-lhe a lembrança que sempre- tem de mim . O nosso amigo Doutor Mello está aí com a família , dê-lhe lembranças . Passo regularmente graças a Deus Minha família deve estar hoje , ou aliás , desde sábado 15 deste , em casa de minha sogra . Sempre a seu dispor tem o pouco préstimo do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 47\n\n 47 Grafismo .",política
764,386-BPF-07-03-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-07-03,"Prezado compadre e amigo Senhor Barão .\n\n Bahia 7 de Março de 1898 .\n\n Recebi ontem sua carta de 2 vinda pelo Doutor José Dantas e estimo que com toda Excelentíssima Família continue a- gozar perfeita saúde e todos os bens , recebendo nossas sinceras visitas . Aqui na capital foi uma abstenção quase completa de ambos os lados , tendo apesar disso o- Campos <Salles> mais de mil votos de maioria ; o Lauro perdeu em todas as freguesias , exceto na da Li , aqui obteve uma maioria , creio que de mais de cem votos ; finalmente foi uma vergonha inaudita . O seu manifesto foi uma bom[ba] que explodiu contra nós , e uma grande arma para os adversários . No- Paraná houve ferimentos e mortes , vencendo o Lauro e em Santa Catharina , creio que também foi vencedor . Permita dizer-lhe , que pode o seu manifesto ter sido muito acertado , mas em meu modo de pensar , foi um desastre político para o nosso partido , na emergência em que estamos . Aqui na Lapa , freguesia de São Pedro , há uma casa que lhe serve e está exposta a venda , mas depende ainda da proprietária achar uma outra menor para comprar : A casa é onde os bondes de Nasarett fazem curva para o São Bento , entenda bem , os bondes que vem de Nasareth para São Bento , quase defronte do convento da Lapa , ou para melhor dizer , é a que faz quina na curva da Lapa . O Doutor Ruy Barbosa requereu habeas- corpus em favor dos presos desterrados , e o supremo Tribunal Federal , concedeu por unanimidade de votos , marcando o dia 48 26 deste mês para se apresentarem . Fico certo de entregar as chaves de uma casa ao Capitão Mariano , mas Thotonio 49 só me entregou a chave da porta da rua , não me dizendo onde tinha deixado as outras . O Republicano de anteontem transcreveo o protesto do\n\n Doutor Manoel Victorino e deu princípio a transcrição do manifesto do mesmo , cujas peças estão dignas de lê-se , não perca . O Doutor Mello seguiu no dia 1º para Ilhéus . Passamos regularmente graças a Deus , visitas a todos e um beijo no pequeno Cicero . Abençõe sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 50\n\n 50 Grafismo .",política


In [24]:
total = []
for i in recuperados.tema:
    total.append('política' in i)
    
print('Documento recuperados que tratam de política:', sum(total))

r = sum(total)/33
print('Revocação:', r)

p = sum(total)/len(recuperados.tema)
print('Precisão:', p)

Documento recuperados que tratam de política: 14
Revocação: 0.42424242424242425
Precisão: 1.0


In [25]:
s.close() # fechamos a busca

Os 14 documentos encontrados realmente dizem respeito à política. Assim, o uso do filtro de *stemming* melhorou a **revocação** do método de busca, que aumentou para 14/33 = 42,4%. A **precisão** continuou em 100%.

### Buscas expandidas (Questão 2 da Lista 1):

Para tentarmos melhorar os resultados gerados com o mecanismo de busca definido acima, criamos listas com termos equivalentes relacionados a temas associados à política. As listas foram criadas com dicionários de sinônimos disponíveis na internet (https://www.dicionarioinformal.com.br/sinonimos/, https://www.sinonimos.com.br/, https://synonyms.reverso.net/dicionario-sinonimos/pt/) variações de tempos verbais e pessoa para verbos.

In [26]:
politica = ['abordagem', 'administração', 'aproximação', 'artimanha', 'astúcia', 'atenção', 'atuação',
            'ação', 'caminho', 'cavilação', 'civilidade', 'conduta', 'condução', 'conselho', 'consenso', 
            'cortesia', 'delicadeza', 'diabrura', 'diretiva', 'diretriz', 'direção', 'dolo', 'enfoque', 
            'engenho', 'esperteza', 'estratagema', 'estratégia', 'gauchada', 'governação', 
            'governo', 'indicação', 'iniciativa', 'instrução', 'ladinice', 'lábia', 'maciota', 
            'malícia', 'manha', 'maquiavelice', 'maquiavelismo', 'maranha', 'norma', 'organização', 
            'orientação', 'regime', 'ronha', 'sagacidade', 'sentido', 'solércia', 'sutileza', 
            'tática', 'traquinada', 'travessura', 'via']

In [27]:
partido = ['agremiação', 'associação', 'bando', 'divisão', 'facção', 'grupo', 'liga', 'parcela', 'partidário',
           'representação', 'seita', 'sociedade', 'tribo', 'união']

A nova busca é representada pela seguinte cadeia de caracteres:

In [28]:
politica.extend(partido)
sinonimos = set(politica)

busca = 'de:"Benicio Penalva" AND texto:(política OR partido'

for i in sinonimos:
    busca += ' OR ' + i
busca += ')'

print(busca)

de:"Benicio Penalva" AND texto:(política OR partido OR atenção OR consenso OR estratagema OR grupo OR governo OR sutileza OR estratégia OR cavilação OR conduta OR delicadeza OR regime OR maquiavelismo OR aproximação OR bando OR astúcia OR cortesia OR maquiavelice OR traquinada OR associação OR direção OR facção OR gauchada OR governação OR representação OR diretriz OR iniciativa OR parcela OR civilidade OR diretiva OR maranha OR ronha OR norma OR ladinice OR liga OR via OR caminho OR instrução OR união OR orientação OR manha OR tática OR administração OR organização OR seita OR ação OR sentido OR condução OR lábia OR partidário OR sagacidade OR sociedade OR atuação OR divisão OR tribo OR malícia OR artimanha OR indicação OR maciota OR agremiação OR esperteza OR abordagem OR dolo OR enfoque OR travessura OR solércia OR diabrura OR conselho OR engenho)


Utilizando a nova busca, repetimos o procedimento anterior, utilizando novamente o *LanguageAnalyzer*.

In [29]:
qp = QueryParser("texto", schema=ix.schema)
q = qp.parse(busca)

s = ix.searcher()

resultados = s.search(q, limit=None, terms=True)

print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')

if resultados.has_matched_terms():
    matched = [(campo, termo.decode('utf-8')) for campo, termo in resultados.matched_terms()]
    print('Termos com match:\n', matched)

hits=[]

for hit in resultados:
    hits.append(hit)

Foram gerados scores para  36 documento(s)
Termos com match:
 [('texto', 'caminh'), ('de', 'Penalva'), ('de', 'Benicio'), ('texto', 'band'), ('texto', 'indic'), ('texto', 'conselh'), ('texto', 'lig'), ('texto', 'govern'), ('texto', 'part'), ('texto', 'sent'), ('texto', 'engenh'), ('texto', 'civil'), ('texto', 'atençã'), ('texto', 'administr'), ('de', ''), ('texto', 'polít'), ('texto', 'organiz'), ('texto', 'uniã')]


Os 36 documentos obtidos foram os seguintes:

In [30]:
recuperados = jeremoabo.loc[jeremoabo.id.isin([hit['id'] for hit in hits]), :]
recuperados

Unnamed: 0,id,de,para,data,texto,tema
716,354-BPF-27-03-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-03-27,"Meu caro Primo compadre e amigo Sr. Barão .\n\n Bahia 27 de Março de 1890\n\n Aqui cheguei com minha família no dia 15 deste e só no dia 25 - pude ir a casa do Doutor Salustio , e não o encontrando , tornei hoje , e com ele estive conversando : apresentei-lhe a carta de Vossa Excelência como me ordenou . Disse-me o Doutor Salustio , que soube estarem esperando hoje pelo Visconde 5 do- Guahy , e que não sabia se era exata essa notícia : preveni ao- Doutor Salustio para falar ao Guahy , sobre um emprego no novo hospital da misericórdia , segundo Vossa Excelência me ter dito que queria ver se podia obter com o Guahy um bom emprego para mim-\n\n no dito hospital . Vossa Excelência sabe que muito e muito preciso , e que só me arrisquei a vir com a família para esta capital , com único fim de dar a meus filhos uma educação mais ou menos regular , - pois é o meu maior desideratum . Já matriculei dois meninos- no Lyceo , e minha filha hoje , foi 6 também matriculada no externato normal de Senhoras . Se eu puder conseguir os meus- desejos , é um meio de vida que dou a ela , visto não termos outro de que possa ela viver . Sua afilhada , e o do Doutor Severino , ainda não pôde levá-los a escola , por faltar- me um\n\n atestado médico , de como não sofrem moléstia alguma contagiosa , do 7 que só poderei dar andamento depois da semana Santa . Tenho andado tanto aqui , que já 8 me doem as pernas , de maneiras que , para caminhar , é em marcha muito lenta . Tenho feito muita despesa com as arrumações dos meninos , bem entendido , de conformidade a minhas forças , por que cada um vive como pode , e- como sabe , não tenho recursos . Provisoriamente estou morando- na rua do Alvo , nº 201 – 2º andar , em quanto procuro uma roça para ir tendo alguma cousa com que possa ir dando a sub-\n\n a subsistência a meus filhos : Deus é grande e não desampara- a ninguém , principalmente a quem faz diligência com fé nele . Logo que ache a roça e arrende , preciso comprar uns burros 9 , e- desde já lhe previno , por serem os de Vossa Excelência reforçados . Meu filho Francisco , desde que aqui- chegou , entrou em tratamento com o Doutor Ribeiro dos Santos , por se achar sofrendo bastante dos olhos . Aqui tem chovido alguma cousa , e consta-me que por lá também ; Deus permita que continue . Sua Comadre está muito satisfeita aqui , - por ter o mesmo desejo que eu\n\n tenho de ver os filhos educados . Não temos tido alteração em nossa saúde graças a Deus . Muito estimo que ao lado da Excelentíssima Baronesa frua perfeita saúde e todos os- bens . Abençõe sua afilhada , e disponha sempre com a maior- franqueza , do pouco préstimo deste que com muita estima e- melhor consideração é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva . P. S. Recebeu uma carta com a- escritura para o Sr. Boaventura ? Remetia pelo correio do Timbó- que devia seguir no dia 17 deste .\n\n O mesmo","emprego, educação, saúde"
717,355-BPF-13-08-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-08-13,"Meu Prezado Primo compadre e amigo Sr. Barão\n\n Bahia 13 de Agosto de 1890\n\n Anteontem estive com Joãozinho , por tê-lo encontrado no comércio , e- perguntando-lhe por Vossa Excelência , disse-me estar incomodado de sua saúde , o- que muito sinto : desejando que ao receber esta , se ache vigoroso ao lado da Excelentíssima Baronesa , com quem receberá nossas felicitações . O que há de mais importante aqui é a grande questão de esgotos 10 que não lhe é mais estranho . O marechal Hermes está mal de saúde , ouvi dizer que os- médicos o privarão de falar e que de vez em quando apresenta-lhe uma- hemorragia de sangue . O < redator > 11 do pequeno jornal tem brilhado\n\n nessa grande questão de esgotos , ultimamente disse que se o governador não sabia governar , que descesse dessa cadeira e intregasse-a a outro , esta frase é relativa aos indigentes da seca . Temos eleição no dia 15 de setembro 12 como sabe , e aqui estou sempre a- suas ordens , deliberando Vossa Excelência como melhor entender . No dia 17 , está anunciado uma grande reunião para formar-se o partido nacional , o que me diz a respeito ? Aqui ou em qualquer parte que esteja contará sempre com o meu fraco serviço . Tem chovido bastante aqui . Abençõe sua afilhada e dê- suas ordens a este que com toda\n\n estima , consideração e respeito é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva",política
718,356-BPF-19-09-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-09-19,"Meu Prezado Primo compadre e amigo Sr. Barão .\n\n Bahia 19 de Setembro 13 de 1890\n\n Desejo que com a Excelentíssima Baronesa frua perfeita saúde e todos o bens . Hoje encontrei-me no Comércio- com Joãozinho , e perguntando por Totonho , disse-me estar bom . Até hoje está o seu nome incluído na lista- dos candidatos mais votados , e terei grande prazer se for eleito . Como sei que Vossa Excelência é amigo do Conselheiro Virgilio Damasio , e está ele na administração do estado , peço-lhe , de sendo-lhe possível , obter com ele o lugar de inspetor da linha telegráfica do governo , no Estado de gergipe [*] 14 , numa seção que está vaga\n\n e adida ao inspetor Antonio Ribeiro , ou outro lugar aqui na Capital , que Vossa Excelência julgar conveniente . O Doutor Loizio , continua- na administração de engenheiro- geral dos telégrafos , pelo que ju julgo que não lhe será muito difícil conseguir para mim o lugar de inspetor , como peço . Vossa Excelência não ignora que muito preciso , por ser este uma meio fácil de conseguir a educação de meus filhos . Fiquei admirado não ter Vossa Excelência um só voto no Palácio [...] 15 ( termo do Conde ) ao passo que o Doutor Severino teve no Barração 180 - Como se explica isto ? ! Abençõe- sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
719,357-BPF-01-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-01-10,"Meu Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 1º de outubro 16 de 1890\n\n Desejo a continuação de sua preciosa saúde ao lado da Excelentíssima Baronesa com quem receberá nossas visitas . Sua carta de 24 , foi-me entregue a 29 do próximo passado a qual respondo . Deixo de procurar o Doutor Severino , por me ligar ele pouca ou nenhuma importância , tanto assim , que estou aqui nesta capital desde o dia 15 de Março , e morando ele perto de mim , não achou ainda um instante para vir a meu pobre rancho , mas , sem levar isto em consideração , votei nele , para assim cumprir um dever de gratidão , já como parente e já mesmo como amigo Fiquei admiradíssimo o modo por- que foi Vossa Excelência tratado no 8º distrito , bem entendido , nos colégios onde o Severino tem mais força , ao passo que no seu distrito teve ele explendida votação em todos os colégios . Antes da eleição procurei o Doutor Salustio para o mesmo emprego que lhe mandei falar , e ele depois de ter dado algumas providências para cientificar-se donde vinha a nomeação , respondeu-me que não podia , por depender da capital federal , onde não tinha força , em vista disto , deixo de procurá-lo para não me tornar imprudente . No dia 3 deste , não mandando Deus o contrário , sigo para Alagoinhas e dali vou ao engenho , voltando outra vez para Alagoinhas , onde estarei todos os sábados , pois a necessidade obriga-me - a expor-me a tudo ( com dignidade ) e viver separado da família , buscando os meios de nossa subsistência . Vivo sempre resignado com os infortúnios da sorte , Deus um dia se compadecerá de mim ! Já tinha sabido da traição que a última hora fez- lhe o Doutor João Dantas , não me causando porém admiração . Abençõe sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que com- muita estima e consideração é De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
721,359-BPF-17-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-10-17,"Meu Prezado Primo compadre e amigo .\n\n Alagoinhas 17 de outubro 18 de 1890\n\n Ontem aqui cheguei no- trem de Timbó , e depois da chegada do de Bahia , fiquei surpreendido pela notícia que tive do infausto passamento do meu Primo , seu digno irmão e amigo , o Senhor Coronel João Dantas Martinz dos Reis , pelo que passo a dar-lhe meus sentidos pêsames : Deus queira dar a sua alma a eterna glória , e a Vossa Excelência e a família do finado , o conforto de que necessitão . Por mim fará sentir a família do finado , a mesma dor de que se acha transpassada Muito estimo que com a Excelentíssima Baronesa e caros filhos frua sempre vigorosa saúde e todos os bens . Abençõe sua afilhada , e disponha sempre do pouco préstimo deste que é sempre com subida estima e consideração\n\n De Vossa Excelência Primo compadre e amigo pelo Coração Benicio Penalva",outros
727,360-BPF-23-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-10-23,"Meu Prezado Primo compadre e amigo\n\n Timbó 23 de outubro 19 de 1890\n\n É meu prazer que ao lado da Excelentíssima Baronesa e caros filhos frua sempre vigorosa saúde e todos os bens . Está na administração deste estado o seu distinto amigo o- Doutor José Gonçalvez , pelo que , em vista de minha necessidade , peço-lhe de com ele obter um lugar para mim na alfândega ou tesouraria geral , que não dependa de acesso ou concurso . Seria para mim uma felicidade- se pudesse obter o lugar de administrador das Capatorias da Alfândega , e se não for possível\n\n aceitarei outro , em quanto se arranja cousa melhor . O lugar de inspetor da linha telegráfica- no estado de Sergipe , da seção- vaga , que está adida ao Antônio Ribeiro , também me serve : finalmente , Vossa Excelência fará o que melhor entender a meu benefício ; com- tanto que seja empregado numa repartição da fazenda nacional , que me dê quanto chegue para minha subsistência e de minha família . Pode responder-me para Alagoinhas ou Timbó . Aguardo sua resposta e com a maior franqueza disponha sempre do pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo amigo obrigadíssimo pelo Coração\n\n Benicio Penalva",emprego
728,361-BPF-08-11-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-08-11,"Meu Prezado Primo compadre e amigo Sr. Barão\n\n Alagoinhas 8 de novembro 20 de 1890\n\n Hoje aqui cheguei no trem de Timbó , já tendo sabido no Sítio do Meio de sua passagem para essa Cidade . Muito estimo que ao lado da Excelentíssima Família frua sempre perfeita saúde e todos os bens . Já escrevi a Vossa Excelência comunicando estar no governo- deste estado o seu distinto Amigo o Doutor José Gonçalvez : Ocasião esta , de Vossa Excelência arranjar com ele minha nomeação para o lugar que mais lhe convier .\n\n Estou levando uma vida a- mais terrível possível , que [a]lém de não auferir lucro , vejo-me obrigado a estar separado de minha família em deligência de ganhar alguma cousa para subsistência dela , e a única esperança que tenho de melhorar de sorte é a proteção de Vossa Excelência . Peço-lhe de desculpar minhas imprudências , que são filhas do mau estado em que me vejo . Recebi as sementes de canas e já mandei plantá-las . Sempre a seu dispor encontrará o pouco préstimo deste que é com a maior estima , consideração e respeito\n\n De Vossa Excelência Primo compadre e amigo e obrigadíssimo pelo Coração\n\n Benicio Penalva",emprego
729,362-BPF-30-11-1890-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-11-30,"Meu Prezado Primo compadre e amigo Excelentíssimo Sr. Barão\n\n Alagoinhas 30 de novembro 21 de 1890\n\n É meu prazer que ao lado da Excelentíssima Baronesa e seus caros filhos frua perfeita saúde e todos os bens . Desculpe minha imprudência : Sei que Vossa Excelência não se esquece de mim , mas , como não me é estranho a vida laboriosa que leva , vou lembrar-lhe de aproveitar a estada , como 22 governador , do seu íntimo amigo o Doutor José Gonçalvez , o qual não recusa sacrifícios para servir-lhe , e Vossa Excelência sabe que muito e muito preciso ser empregado , por tanto peço-lhe 23 de\n\n me arrumar quanto antes , por que de um momento para outro podem as cousas mudarem-se , e presentemente a época não lhe pode ser mais favorável do que é . Meus filhos prestarão exame de português , Francês 24 e latim , e forão aprovados plenamente Tem chovido bastante , graças a Deus . Como lhe disse no Timbó , nada tenho feito em compras de fumo , apesar de empregar toda deligência ; é uma luta terrível . Subscrevo-me com toda estima , consideração e respeito\n\n De Vossa Excelência Primo compadre e amigo pelo Coração Benicio Penalva de Faria\n\n 2","emprego, educação"
730,363-BPF-20-12-1890-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-12-20,"Meu Caro Primo compadre e amigo Sr. Barão .\n\n Timbó 20 de dezembro 25 de 1890\n\n Hoje aqui cheguei da Bahia tendo ido apresentar-me ao Doutor José Gonçalvez com o seu cartão , o qual entreguei em mão própria . Falei-lhe sobre minha pretenção , e ele desenganou-me que não podia servir-me ; mas , peço-lhe liçença para dizer-lhe , que ele só não me dá a colocação que Vossa Excelência pede , por que não quer , visto não depender da vontade de outro e sim da dele , assim como também o que pedi , não é caso virgem , pois já se / deu no governo do Marechal Hermes , que aposentou um dos lousado\n\nres e nomeou o Ponphilo de Santa Cruz : Existem ainda dois lousadores , que é o Coronel Araponga e o Santa Rita ; ambos tem direito a aposentadoria , os que fiz-lhe ver , e ele respondeu-me que para essa pretenção minha tinha um candidato , logo que houvesse vaga ; mas , dou de barato , que ele tinha um candidado [*] 26 para arrumar 27 , mas se ambos os lousadores podem ser aposentados , por que razão não me coloca num desses lugares 28 , se só depende da vontade dele governador , e caso idêntico já se deu no governo do\n\n Marechal ? Já vê pois Vossa Excelência que é por não ter vontade de lhe- servir , ou será pela minha malfadada sorte , que sou caipóra- em tudo quanto pretendo . Vossa Excelência sabe que não peço por luxo , e sim pela necessidade que me arrasta de dar uma educação a meus inocentes filhos ! É tristíssima 29 a posição do 30 homem que tem necessidade de andar mendigando como eu ! mas o que farei ! é sofrer com resignação as intemperies da- desgraçada sorte ! ... Em suas- mãos está o futuro de meus filhos ! Basta . Desejo-lhe de\n\n coração e a toda Excelentíssima Família a mais robusta saúde e todos os bens . Abençõe sua afilhada e como sempre encontrará 31 a sua disposição o nada que val[e] o diminuto ser deste que é com toda estima , consideração e respeito\n\n De Vossa Excelência\n\n Primo compadre e amigo pelo Coração\n\n Benicio Penalva de Faria\n\n 3",emprego
732,365-BPF-01-12-1894-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1894-01-12,"Prezado Primo compadre e amigo Excelentíssimo Senhor Barão\n\n Bahia 1º de dezembro 33 de 1894\n\n Estimo a continuação de sua vigorosa saúde e bem assim de minha comadre e seus caros filhos . ontem foi chamado ao Rio o- general Santos Dias , e eu já tendo ido em casa dele falar-lhe sobre a casa , segundo sua ordem , e não tendo aviso nenhum dele , hoje- fui novamente e ele respondeu-me que já tinha casa , por isso dispensava o obséquio . ontem o correio de notícias espalhou boletim insuflando o povo contra a Intendência , especulando com a carestia dos gêneros alimentícios por causa da apuração da eleição que está marcada para o dia 4 deste , como\n\n deve saber . ontem mesmo foi uma comissão do centro operário pedir providências ao Conselho municipal sobre a carestia dos gêneros de primeira necessidade , e aglomerou-se mais de 100 pessoas na câmara e sairão satisfeitos ; O conselheiro Couto , já providenciou de maneiras tal , que ouvi ele dizer que a carne < verde > amanhã será vendida a 700 reis o quilo ; para mil reis , como estava , e ameaçada a população de com<prar> nestes 8 dias a 1$500 reis , já foi por conseguinte uma vantagem extraordinária . Quanto a farinha- creio que ele deu também providências . Os nossos adversários promovem todos os meios ignóbeis para tirarem 34 vantagem na apuração da eleição , por\n\n estarem convictos da derrota estrondosa que levarão , e querem a força vencer com os seus tenebrosos planos . Creio que com a retirada dos Santos Dias , estamos liquidados , por- que eles promovem tudo quanto for de misérias a fim de nos aniquilar . Se não reagir-se com todas as forças , seremos vítimas destes malvados . O Vianna chegou ontem . O Santos Dias já passou o comando ao Coronel Saturnino e segue para o Rio , creio que no dia 12 deste . No dia 7 pretendo ir ao Timbó tratar da eleição da 1ª Seção . Passamos regularmente graças a Deus Sempre ao dispor tem este que é De Vossa Excelência compadre Primo amigo pelo Coração\n\n Benicio Penalva 35\n\n P. S.\n\n Recebi hoje 36 uma carta de Barretto datada de 25 do mês findo , onde diz-me que alguns 37 < desses > Generais tem pedido demissão dos Cargos que estavão ocupando , motivo pelo qual corre com muita insistência no Rio , que querem proclamar o Marechal Floriano Ditador ; mas acrescenta ele que não crê . Diz ele ter gostado muito do Presidente , mas que é provável que , quanto ao negócios daqui da Bahia ele ouça ao Victorino , é suposição dele . Seu Primo compadre e amigo Benicio Penalva\n\n 3 \n\n 3",política


In [31]:
total = []
for i in recuperados.tema:
    total.append('política' in i)
    
print('Documento recuperados que tratam de política:', sum(total))

r = sum(total)/33
print('Revocação:', r)

p = sum(total)/len(recuperados.tema)
print('Precisão:', p)

Documento recuperados que tratam de política: 28
Revocação: 0.8484848484848485
Precisão: 0.7777777777777778


In [32]:
s.close() # fechamos a busca

Vinte e oito dos documentos encontrados tratam de política. Assim, o uso dos termos equivalentes aumentou consideravelmente a **revocação** do método de busca, que para 84,8%. Em contrapartida, a **precisão** foi reduzida para 77,8%.

### Correção ortográfica (Questão 3 da Lista 1):

Até agora, assumimos que os termos usados nas buscas estavam corretos sob o ponto de vista ortográfico. Na prática, isso, muitas vezes, não ocorre. Para lidar com essa situação, podemos recorrer a um corretor ortográfico, que identificaria na lista de termos os que não estivessem corretos, sugerindo correções.

Vamos implementar essa funcionalidade antes que a cadeia de caracteres seja passada para o método *parse* do Whoosh. Na realidade, após a correção, deveríamos identificar termos equivalentes e só então passá-los para o *parse*. Os resultados obtidos na análise a seguir devem ser comparados apenas com os de processos de busca similares, ou seja, que não utilizem listas de termos equivalentes.

A biblioteca de correção ortográfica utilizada foi a [pyspellchecker](https://pyspellchecker.readthedocs.io/en/latest/). Uma das línguas implementadas na biblioteca é o português. 

In [33]:
spell = SpellChecker(language='pt')

termos = ['poltica', 'plitica', 'politca', 'paritdos', 'prtido', 'plítca', 'pratidos']
corretos = [spell.correction(termo) for termo in termos]

print(corretos)

['política', 'politica', 'politica', 'partidos', 'partido', 'política', 'partidos']


A biblioteca retorna o termo correto para uma boa parte dos erros cometidos na lista acima. 

In [34]:
busca = 'de:"Benicio Penalva" AND texto:(política OR partido'

for i in corretos:
    busca += ' OR ' + i
busca += ')'

print(busca)

de:"Benicio Penalva" AND texto:(política OR partido OR política OR politica OR politica OR partidos OR partido OR política OR partidos)


Como os termos corrigidos foram praticamente iguais aos da busca original, os documentos recuperados foram os mesmos.

In [35]:
qp = QueryParser("texto", schema=ix.schema)
q = qp.parse(busca)

s = ix.searcher()

resultados = s.search(q, limit=None, terms=True)

print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')

if resultados.has_matched_terms():
    matched = [(campo, termo.decode('utf-8')) for campo, termo in resultados.matched_terms()]
    print('Termos com match:\n', matched)

hits=[]

for hit in resultados:
    hits.append(hit)

Foram gerados scores para  14 documento(s)
Termos com match:
 [('de', 'Penalva'), ('de', 'Benicio'), ('texto', 'polit'), ('texto', 'part'), ('de', ''), ('texto', 'polít')]


Os 14 documentos obtidos foram os seguintes:

In [36]:
recuperados = jeremoabo.loc[jeremoabo.id.isin([hit['id'] for hit in hits]), :]
recuperados

Unnamed: 0,id,de,para,data,texto,tema
717,355-BPF-13-08-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-08-13,"Meu Prezado Primo compadre e amigo Sr. Barão\n\n Bahia 13 de Agosto de 1890\n\n Anteontem estive com Joãozinho , por tê-lo encontrado no comércio , e- perguntando-lhe por Vossa Excelência , disse-me estar incomodado de sua saúde , o- que muito sinto : desejando que ao receber esta , se ache vigoroso ao lado da Excelentíssima Baronesa , com quem receberá nossas felicitações . O que há de mais importante aqui é a grande questão de esgotos 10 que não lhe é mais estranho . O marechal Hermes está mal de saúde , ouvi dizer que os- médicos o privarão de falar e que de vez em quando apresenta-lhe uma- hemorragia de sangue . O < redator > 11 do pequeno jornal tem brilhado\n\n nessa grande questão de esgotos , ultimamente disse que se o governador não sabia governar , que descesse dessa cadeira e intregasse-a a outro , esta frase é relativa aos indigentes da seca . Temos eleição no dia 15 de setembro 12 como sabe , e aqui estou sempre a- suas ordens , deliberando Vossa Excelência como melhor entender . No dia 17 , está anunciado uma grande reunião para formar-se o partido nacional , o que me diz a respeito ? Aqui ou em qualquer parte que esteja contará sempre com o meu fraco serviço . Tem chovido bastante aqui . Abençõe sua afilhada e dê- suas ordens a este que com toda\n\n estima , consideração e respeito é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva",política
735,368-BPF-31-01-1895-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1895-01-31,"Prezado Primo compadre e amigo Sr. Barão\n\n Bahia 31 de Janeiro de 1895 .\n\n Recebi sua carta de 23 deste , e muito estimo que com a Excelentíssima minha Comadre e seus caros filhos continue a gozar perfeita saúde e todos os bens da vida , recebendo com todos nossas sinceras visitas e saudades . ontem o Governador baixou o ato suspendendo a lei da organização da guarda municipal ; mas creio , que o Conselho e o Intendente , não se submeteu a semelhante arbitrariedade ; tanto assim , que consta-me ter feito hoje as- nomeações da dita guarda ou parte dela . O Senhor Governador , está- parecendo um governador de bob[ão] Consta que no Rio tem havi[do] 50 grande movimento dos E[studan]tes 51 da Escola militar e os Jacobi[nos] 52 com a Polícia e que alguns oficiais ou Generais tem apresentado-se em favor dos estudantes ; e por telegrama que vi no Jornal de Notícias , creio que de ontem ou anteontem , diz , estar a Armada de prontidão , pelo que , parece-me 53 que as cousas lá não vão boas . Parece-me que aqui haverá barulho antes do fim de Março , se o governador entender de fazer valer sua arbitrariedade . ontem recebi um telegrama de Barretto , dizendo-me que fizesse o filho , o estudante da Escola , seguir no primeiro vapor , e como ele [ai]nda 54 não chegou aqui , por isso [peço]-lhe 55 o favor de remeter-lhe a inclusa carta com toda brevidade , a fim dele não demorar-se mais- em casa dos Avós , visto a exigência do Pai . Sem dúvida alí no Rio é necessário a presença dele com brevidade . Já tirei minha patente e mandei ontem para a Comarca , acompanhada de uma procuração a fim de prestar o juramento e tomar posse . Recebi esta semana uma carta de meu filho , o que está no Rio , dizendo-me que consta estar o colera em Minas e já a um mês ou mais [...] 56 , e que aí no Rio também dizião ter aparecido alguns casos , mas que ele não acreditava , visto já estar com tanto tempo e a comunicação que tem aquele Estado-\n\n com o do Rio , todos os dias pelo trem de ferro , e não estar tudo devastado ; pela moléstia , e que o estado sanitário do Rio era presentemente o melhor possível ; o que faz-me também crer , que não é o cólera morbus que alí , como em Minas está graçando ; por que esta moléstia desenvolve-se com uma rapidez extraordinária , salvo porém , se agora ela vem mais moderada do que em 1856 . Os nossos amigos daqui , estão muito animados , mesmo com relação ao Comandante do Destrito , e creio que ele não será contra nós , visto o que tenho observado dos governistas : Noto neles uma frieza com o- Comandante , de sorte que , nem ao me- ao menos falão nele , e quando por acaso falão , conhece-se o constrangimento com que estão . O calor aqui é extraordinário . Se o Conselheiro Couto não tem recebido suas cartas , está provado que tem sido destraviadas [*] 57 . Passamos regularmente , graças a Deus . Eu porém , estou sofrendo inchação- nas pernas , de poucos dias para cá . Abençõe sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n Benicio Penalva de Faria 58 P. S.\n\n Até hoje nada de candidato nosso , e a opinião , quase geral , é que deve ser o Marechal Floriano .\n\n O mesmo\n\n 57 Por “ extraviadas ” .\n\n 58 Grafismo .","política, saúde"
743,370-BPF-22-02-1895-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1895-02-22,"Prezado Primo compadre e amigo Senhor Barão\n\n Bahia 22 de Fevereiro de 1895 .\n\n No dia 18 as 6 horas da tarde me- foi entregue sua prezada carta de 13 deste , e no mesmo envolucro vierão diversas , que entreguei a seus donos , sendo algumas entregues no mesmo dia 18 , e outras no dia 19 . Os nossos amigos requererão habeas corpus preventivo , em favor dos oficiais e- guardas municipais , e o tribunal de apelação , negou : o que não é de estranhar-se , pois já se sabe o propósito em que estão os Senhores governistas , de- alarmarem ou anarquisarem a esta capital : requererão para o supremo tri[bu]nal 61 Federal , digo , os nossos- amigos requererão para o supremo tribunal federal , e não soube mais em que ficou . Quanto a eleição do dia 3 de Março , vejo que é 62 trabalhar-se - de balde , por que , ainda vencendo-se , será o nosso candidato depurado , como já se viu o ano passado , e além disto , vejo pouco interesse nessa eleição , da parte dos nossos amigos , ao menos , aqui na Capital , pouco ou nada se fala nela . O Doutor Lago- disse-me que seguia para o Conde no dia 25 , e na Abbadia , o Argemiro pediu ao\n\n Conselheiro Couto para mandar um dos nossos amigos para guiá-los alí , e até o- fazer esta , não soube qual será o que vai , nem mesmo- sei se irá algum . Quanto ao Timbó , creio que seremos alí derrotados , visto a mesa ser a mesma- que presídio a eleição do Doutor Manoel Victorino , e ainda mais , estarem alguns amigos nossos desgostosos , com o procedimento que tiverão no Conde , por ocasião do Júri , que pôs em liberdade o assassino Martinho Pinto de Souza , que publicamente matou ao pobre Victor Nunes do Nascimento , em sua própria casa , e os nossos amigos do Conde , protegem- escandalosamente o assassino , tanto que , o livrarão por unanimidade de votos : V. sabe que todos nós temos nosso amor próprio , e aos parentes do morto , cabe resentir-se do procedimento que tiverão e continuão , os nossos amigos , protegendo o assassino . Não me nego de forma alguma ao seu serviço , mas sinto aparecer estes desgostos entre amigos , e mormente em um lugar como o Timbó , que precisamos trabalhar muito para combater os adversários , que alí dispõem de todos os elementos . Hoje escrevo ao Doutor Pedro Mendes sobre a eleição , segundo sua ordem , assim como escreverei a outros amigos prevenindo-os . Estimo que com minha Excelentíssima Comadre e seus caros filhos continue a gozar perfeita saúde e todos os bens , recebendo com todos nossas visitas e saudades . O Calor aqui continua extraordinário , e nada de chover . Abençõe sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n Benicio Penalva de Faria 63\n\n 63 Grafismo .",política
744,371-BPF-25-12-1896-mod.txt,Benicio Penalva de Faria.,Benicio Penalva de Faria.,1896-12-25,"Prezado compadre e amigo Senhor Barão\n\n Bahia 25 de Dezembro de 1896 .\n\n Que com minha Excelentíssima Comadre e Thotonio tenha tido boas festas e que o novo ano lhes seja venturoso , - muito estimamos , aceitando com todos nossas visitas . Sua carta de 16 deste , em resposta as minhas de 18 e 25 do passado e de 5 e- 11 deste , me foi entregue no dia 22 - V. não se persuadia que o povo do Conselheiro recuava perante a força Federal , embora fosse ele em número- muito inferior ? Já desenganou-se ? O Conselheiro e os 64 fanáticos dele , estão- muito audazes , mas creio , que se derem um novo combate , como espera-se , ficarão aniquilados para sempre , por que a força 65 que para alí seguiu , [de]ve 66 constar de 500 praças , entre [li] nha 67 e polícia , e foi muito bem ar[ma]da 68 e municiada ; Creio que levarão 6 ou 8 metralhadoras e 2 canhões Brupe , e quando puserem estas armas de guerra a funcionar em [li] nha 69 de combate , é um arra [so] 70 por que os conselheiristas não [conhe]cendo 71 o perigo , virão morrer braço a braço , e aí a fuzilaria fará a maior carnificina . Sinto muito a morte sas crianças , mas do outro povo não , por que nenhum deles está [ali] 72 sem um fim de pervesidade . Quanto ao Senhor Salles Souza , não procuro interpelá-lo , por estar [....] 73 constantemente inconveniente e não\n\n desejo entrar com ele em certas averiguações . Por sua carta , vejo que o seu prejuízo nas Fazendas , é enorme , e nem podia deixar de ser , visto sua ausência , delas , a 14 anos , e ainda mais , com a- dificuldades de encontrar vaqueiros que tenhão interesse . Então não toma parte na eleição de 30 deste mês ? Acho-lhe razão , e melhor seria que abandonasse de vez a política , por que , a não ser uma oposição séria em todo o Estado e bem- arregimentada , não vale apenas : mas com que garantias ficão os seus amigos que tanto se sacrificarão , acarretando as maiores odeosidades , por contarem com o seu apoio e do Doutor José Gonsalves ? Ficão entregues a mercê das iras dos dominantes da época , não é assim ? O Doutor José Gonsalves , cada vez mais se afunda no abismo da inocência , e depois virá apresentar razões frívolas para defender-se . Quem foi o culpado de toda esta guerra inglória que temos sofrido , e continuaremos , talvez para sempre ? Forão os soldados do partido , ou os seus Diretores ? A debandada é extraordinária , principalmente aqui na capital . É bem escusado dizer-lhe , que sempre me encontrará firme a seu lado , sejão quais forem as circunstâncias , muito embora o meu apoio seja insignificante . Passamos regularmente graças a Deus Abençõe - sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração B. Penalva 74\n\n 74 Grafismo .",política
745,372-BPF-12-02-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-12-02,"Prezado Primo compadre e amigo Sr. Barão .\n\n Bahia 12 de Fevereiro de 1897 .\n\n No dia 7 a 1 hora da tarde me foi entregue sua carta de 5 deste mês , e- como não houvesse mais tempo a aproveitar o correio , mesmo levando na estrada de ferro , por isso só hoje respondo . Estimo a continuação de sua vigorosa saúde , de minha Excelentíssima Comadre e Thotonio , com quem receberá minhas visitas . A Senhora de Joãozinho e o recém nascido , estão sem alteração na sua saúde , segundo disse-me ele anteontem . Amanhã deve chegar no Timbó o seu tambor , segundo disse- me o dono da fundição . No domingo seguiu o Moreira Cezar para Queimadas , indo assistir o seu embarque “ o governador ” que tem se rebaixado ao último furo , com m[e]do 75 do Moreira Cezar ; ontem segui[u] 76 o resto do 9º batalhão , e aqui chegou o 16 , que dizem seguirá brevem [ente] para os Canudos uma ala , fican [do] 77 a outra dando a guarnição ao esta [do] 78 . O Correio de Notícias veio com- muito arrojo contra o major Fe [bro]nio 79 , mas depois recuou-m[e] 80 - seravelmente , dizendo até , que esta [va] 81 pronto a dar as satisfações que quizessem . O Moreira Cezar quan [do] 82 soltou foi entender-se com o governador e constava que el [es] 83 almoçarão juntos . É tanta mentira que não se pode afirmar co[u]sa 84 alguma . Já 85 foi publica [do] 86\n\n no Diário da Bahia uma carta do Doutor José Gonsalves dirigida ao Doutor Filgueiras apoiando a nova organização do partido e afirmando aqui estar no dia 7 de Março para dar o seu voto , com o que muito animou aos amigos e desgostou aos adversários , que estão se queimando de raiva . É preciso não esmorecer-se e continuar-se desassombradamente , e com toda precisão , do contrário estamos perdidos , por que , se continuar este nefasto governo sem oposição , em breves dias ficaremos reduzidos ao nada . Não é preciso dizer-lhes , que como soldado , contará < sempre > com o meu diminuto auxílio , por que me conhece de longa data , e sabe que sempre estarei a seu lado , sejam quais for as circunstâncias . O Major Febronio tem escrito alguns artigos contra o Vianna , que são dignos de ler-se , e o correio nada tem respondido . Passo regularmente graças a Deus . Aceite um abraço do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 87\n\n 87 Grafismo .",política
747,374-BPF-28-06-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-06-28,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 28 de Junho de 1897 .\n\n Sendo hoje dia do seu aniversário , o felicito , e bem assim a toda Excelentíssima Família , por ter o creador lhe- concedido mais um ano de sua preciosa existência , para completa satisfação de todos os entes de sua Excelentíssima Família e bem assim , de todos os seus amigos ; permittindo o mesmo Deus , que esta sua existência se prolongue por muitos anos , aureolada de todas as felicidades ; é o que de coração lhe pode desejar o seu Primo compadre e amigo pelo Coração ( continua ) Benicio Penalva ( vire ) . Em continuação .\n\n No dia 26 , sábado , chegou o- nosso amigo Doutor Filgueiras e muito animado ; fui com outros amigos recebê-lo a bordo e o acompanhamos até a redação do “ O Republicano ” , e dali , até sua residência . O reconhecimento do nosso amigo , a meu ver , equivale a subida do nosso partido , e em vista da crise política que se desenrola na Capital Federal , devemos unirmo-nos como um só , para sustentarmos a Constituição de 24 de Fevereiro , violada pelo Presidente da República e seus amigos ; a ocasião é a mais oportuna possível para darmos combate a esses maragatos , defraudadores das 89 rendas públicas , e que vivem calcando- aos pés os nossos mais sagrados direitos de cidadãos livres ! Sinto , que melhores condições intelectuais e pecuniárias , estejam aquém do 90 meu desideratum , o que por esse motivo poderosíssimo , não posso provar o quanto em mim se passa ! Já 91 vou indo melhor do meu incômodo , a mais família passa regularmente , graças a Deus Abençõe sua afilhada e aceite um abraço do seu\n\n Primo compadre e Amigo pelo Coração\n\n B. Penalva 92\n\n 8 \n\n 9 \n\n 9 \n\n 92 Graifsmo .",política
759,381-BPF-20-11-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-11-20,"Prezado Primo compadre e amigo Excelentissimo Senhor Barão .\n\n Timbó 20 de novembro 20 de 1897 .\n\n ontem depois de já ter deitado na caixa uma carta para V. , ao meio dia recebi um chamado do Doutor Ribeiro- dos Santos , e como estav[a] 21 o almoço na mesa , fui primeiro almoçar e logo depois , quando já estava pronto para sair veio o criado novamente chamar-me ; segui imediatamente , e alí chegando encontrei com [com] o Doutor Ribeiro e Bahia ; perguntarão-me eles qual o meio mais fácil de lhe dar um aviso urgente , respondi que telegrafando para o Timbó , responderão-me que não era possível ser-lhe transmitido este aviso pelo telégrafo que dependia do maior sigilo ;\n\n em vista dessa respos[ta] 22 perguntei- lhes o que havia , responderão-me - havia ordem para ser V. preso , em vista da gravidade do caso ofereci-me para vir até aqui e por mim próprio lhe avisar para tomar suas cautelas . Depois o Bahia disse-me que a notícia vinha do Doutor Paulo Fontes , procurei entender-me com ele imediatamente o encontrando no grande Júri , disse-me 23 ele que soube por um empregado da polícia que o Vianna tramava sua prisão , e a força que para aí seguiu e que já aí está já era para esse fim , esta última parte é ilação que tiramos em vista de uma carta que saiu publicada no Republicano , que lhe remeto com outras gazetas pelo nosso amigo José Lopes de Almeida em quem deposito inteira confiança ; e lhe peço de- por ele responder-me imediatamente que pretendo voltar sem falta no dia 22 . Se o malvado Vianna trama contra V. estas misérias é de acordo com o Severino , que aliás ainda o julgo mais perverso do que o Vianna , basta ser mais inteligente . A prisão não é somente para V. e sim também para o- Doutor José Gonsalves e José Ignacio , para onde já seguiu- força : eles pretendem não somente lhes desfeitearem se não também , talvez mesmo eliminarem-nos . Tudo tem deve ter um paradeiro , até mesmo a perseguição . Hoje no encontro do trem vi Thotonio que decia para a Bahia , mas com a presteza do encontro nem ao menos 24 me foi possível falar-lhe . Não facilite as cousas , por que o negócio é- muito sério e gravíssimo . Estimo que com toda Excelentíssima Família goze saúde perfeita e todos os bens dando um beijo ao pequeno Cicero . Sempre a seu dispor tem o pouco préstimo do seu\n\n Primo compadre e Amigo pelo Coração\n\n B. Penalva 25\n\n 2 \n\n 25 Grafismo .",política
760,382-BPF-29-11-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-11-29,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 29 de novembro 26 de 1897 .\n\n So meio dia , chegando em casa , de vinda da Estrada de ferro , onde com outros amigos fui receber o Doutor José Ignacio , que fôra intimado para comparecer a polícia , recebi sua carta de 26 e incluso uma para o Bahia , que farei todo o possível entregá-la hoje em mão própria . O Doutor José Ignacio veio com a Senhora e logo que saltou aqui na Estação , foi intimado ao preso ; por 27 um oficial para seguir á Polícia , respondeu-lhe que sim , mas , que primeiramente ia almoçar , o [0] 28 oficial foi delicado , respondendo- lhe que não o privava de ir almoçar , e tomamos um bonde expresso que para esse fim , já os nossos amigos tinham providenciado e seguimos para o nosso destino ; no Comércio tive precisão de saltar do bon[de] 29 para tratar de um negócio , e os 30 outros amigos , seguirão todos com o Doutor José Inacio e o tal oficial , de sorte que , até escrever-lhe esta , não soube mais o que houve , o que mais tarde irei tomar indagação , para poder lhe adiantar mais alguma cousa . Isto de criação de um novo partido , é especulação dos nossos adversários , para mais nos enfraquecer : Entendo que a oca[si]ão 31 é a mais oportuna possível , para estarmos todos unidos como um só , do contrário seremos engolidos , por esses bandidos . Toda essa perseguição é por causa da eleição de 1º de Março , para a qual devemos trabalhar com todas\n\n as forças , que seremos os vencedores , salvo se os nossos amigos fraquejarem , por temidos . A perseguição é extraordinária , mais em todo o caso , não devemos esmorecer . O Doutor João Dantas Coelho , chegou , e foi logo a Polícia e também derão-lhe logo liberdade , tanto que segue amanhã e deve ser o portador desta carta . Segundo o que ouvir dizer , saiu-se bem no interrogatório que fizerão . O glycério está em São Paulo , e a “ Nação , razão de nosso partido alí , tem brilhado , assim como o nosso Republicano . Então diz V. que fiz o José Lopes fazer uma viagem doida , e forçando-lhe a escrever a vapor ? Creio que cumpri com o meu dever , em vista dos ocorridos , por que não lhe apanharão de surpresa , como desejavam . O Terencinho está em casa do Pai na Estação do Sítio do Meio , posso lhe garantir , por que no dia 20 quando fui ao Timbó embarquei-me com o Pai dele e este disse-me estar ele em casa , e na minha volta no dia 22 , o vi na janela e disse-lhe adeus , mesmo do trem . Os nossos adversários hão de fazer tanta cousa , que depois não poderão sair- se do cipoal que estão 32 tecendo . Estimo a continuação de sua vigorosa saúde e todos os bens , e bem assim de toda Excelentíssima Família , com quem receberá nossas sinceras visitas . Escrevi-lhe pela mala de sábado , noticiando-lhe o estado do Doutor Domingos Mello , que a meu ver , está liquidado ; ainda hoje fui visitá-lo , e achei o no mesmo ou talvez pior , tanto que notei um enfraquecimento cerebral nele , devido talvez ao abatimento em que está . Passamos regularmente graças a Deus . Meu beijo a Cicero , e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva P. S. Depois que lhe escrevi esta fui procurar saber notícias do Doutor José Ignacio e do Doutor João Dantas Coelho , este encontrei na cidade Baixa , com Arlindo Leoni e disse-me não seguir hoje , por ter recebido nova intimação , para ir a Polícia , amanhã , e o Doutor José Ignacio encontrei o em casa do Doutor Filgueiras a noite [*] 33 , e disse-me já o terem despachado , é o que sei até o presente . Bahia 29 de Novembro 34 de 1897 . Benicio Penalva de Faria\n\n 33 Por "" noite ""\n\n 34 No original está grafado "" 9 bro "" .",política
763,385-BPF-17-01-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-01-17,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 17 de Janeiro de 1898\n\n Por Joãozinho , que segue amanhã , recebi suas cartas de 21 do mês findo e 10 deste . Estimo a continuação de sua vigorosa saúde e bem assim de toda Excelentíssima Família com quem receberá minhas sinceras visitas e saudades . Já foi publicado no “ Republicano ” o manifesto do general Glycério convocando todos os amigos à concorrer ao pleito de 1º de Março , e em meu fraco entender não devemos deixar correr a revelia , e sim trabalharmos todos unificados a um só , por que não sabemos o que será o dia da manhã . As Candidaturas dos Doutores Lauro Sodré e Fernando Lôbo , não nos deve ser indiferente por forma alguma , muito = embora tenhamos a certeza de não ser eles os reconhecidos . Estão publican[do] o interrogatório do antentado [*] 41 do dia 5 de novembro 42 , e querem por força encravar o Doutor Manuel Victorino e General Glycerio como cúmplices no atentado , somente com o fim , daquele não presidir as secções da Câmara da verificação de poderes , e este não tomar parte nas mesmas secções ; Estão publicando o inquerito . Parece-me que o Estado de sítio não será prorrogado , ( isto é não , ) por que , a banda[lhei]ra 43 que eles tem feito , é de tal ordem , que estão envergonhados , e não sei mesmo que saída darão a semelhante força ; Est[ão] empregando a intriga entre os nossos amigos como sucedeu com o Martins\n\n Junior , mas este já veio a imprensa desmascará los , o mesmo estão fazendo por todos os- Estados , com o fim de esmorecer a oposição . São uns Saltimbancos ! O Néro está- danado com o Arlindo Leone , por não ter- este se prestado as infâmias que ele queria , neste ponto , considero o Arlindo um homem de bem . O nosso “ Republicano ” vai mal nas finanças , por não haver capital para o custeio , e ficaremos perdidos sem a [...] 44 se perdermos o nosso orgão , único elemento que mostra ainda respirarmos , se por circunstâncias pecuniárias , for obrigado a fechar , estamos perdidos para sempre ; e está em condições tais de quebradeira , que suponho não chegar a 1º de Março .\n\n Como havemos de ficar , se nos faltar o 1º elemento que constitui a vida de um partido , mormente numa emergência desta , em vespera de uma eleição tão renhida como esta ? V. não falou em circunferência e nem em diâmetro , e sim , em sua nota , e na carta á Severiano , dizia o seguinte : que os parafusos tinham 14 centímetros , e que dobrada as pontas , achar-se-ia o centro , por isso ficamos sem saber deliberar , até mesmo os encarregados da fundição , disto como , metade de 14 são 7 , e nessas condições era impossível mandar-se preparar os parafusos por ser uma grossura extraordinária , além disto , não- mandou o comprimento da parte su- superior da chaveta , á ponta do parafuso , e nem tão pouco disse se queria com as porcas ou sem elas ; por que , tendo lá as porcas dos que estão servindo , não convém perdê-las , e nem também se podia preparar outras iguais , sem 45 saber se a grossura- exata ; por estas razões , as quais julgo judiciosas deixamos de fazer a encomenda , esperando novas ordens sua . João foi agora a fundição , e não- me avisou , e disse-me ter encomendado a caldeira . Fico certo das S. 46 de- feijões e sobre isso já falei á Severiano para ir recebê-las e dar o destino competente : Se V. não teve de sua lavra , para que toma esse cuidado conosco , tendo mais essa despesa ? Agradeço-lhe a lembrança que sempre- tem de mim . O nosso amigo Doutor Mello está aí com a família , dê-lhe lembranças . Passo regularmente graças a Deus Minha família deve estar hoje , ou aliás , desde sábado 15 deste , em casa de minha sogra . Sempre a seu dispor tem o pouco préstimo do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 47\n\n 47 Grafismo .",política
764,386-BPF-07-03-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-07-03,"Prezado compadre e amigo Senhor Barão .\n\n Bahia 7 de Março de 1898 .\n\n Recebi ontem sua carta de 2 vinda pelo Doutor José Dantas e estimo que com toda Excelentíssima Família continue a- gozar perfeita saúde e todos os bens , recebendo nossas sinceras visitas . Aqui na capital foi uma abstenção quase completa de ambos os lados , tendo apesar disso o- Campos <Salles> mais de mil votos de maioria ; o Lauro perdeu em todas as freguesias , exceto na da Li , aqui obteve uma maioria , creio que de mais de cem votos ; finalmente foi uma vergonha inaudita . O seu manifesto foi uma bom[ba] que explodiu contra nós , e uma grande arma para os adversários . No- Paraná houve ferimentos e mortes , vencendo o Lauro e em Santa Catharina , creio que também foi vencedor . Permita dizer-lhe , que pode o seu manifesto ter sido muito acertado , mas em meu modo de pensar , foi um desastre político para o nosso partido , na emergência em que estamos . Aqui na Lapa , freguesia de São Pedro , há uma casa que lhe serve e está exposta a venda , mas depende ainda da proprietária achar uma outra menor para comprar : A casa é onde os bondes de Nasarett fazem curva para o São Bento , entenda bem , os bondes que vem de Nasareth para São Bento , quase defronte do convento da Lapa , ou para melhor dizer , é a que faz quina na curva da Lapa . O Doutor Ruy Barbosa requereu habeas- corpus em favor dos presos desterrados , e o supremo Tribunal Federal , concedeu por unanimidade de votos , marcando o dia 48 26 deste mês para se apresentarem . Fico certo de entregar as chaves de uma casa ao Capitão Mariano , mas Thotonio 49 só me entregou a chave da porta da rua , não me dizendo onde tinha deixado as outras . O Republicano de anteontem transcreveo o protesto do\n\n Doutor Manoel Victorino e deu princípio a transcrição do manifesto do mesmo , cujas peças estão dignas de lê-se , não perca . O Doutor Mello seguiu no dia 1º para Ilhéus . Passamos regularmente graças a Deus , visitas a todos e um beijo no pequeno Cicero . Abençõe sua afilhada e dê suas ordens ao seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 50\n\n 50 Grafismo .",política


In [37]:
total = []
for i in recuperados.tema:
    total.append('política' in i)
    
print('Documento recuperados que tratam de política:', sum(total))

r = sum(total)/33
print('Revocação:', r)

p = sum(total)/len(recuperados.tema)
print('Precisão:', p)

Documento recuperados que tratam de política: 14
Revocação: 0.42424242424242425
Precisão: 1.0


In [38]:
s.close() # fechamos a busca

Os 14 documentos encontrados foram os mesmos obtidos com a busca realizada com o *LanguageAnalyzer* sem o uso de termos equivalentes. A **revocação** (42,4%) e a **precisão** (100%) do método de busca foram as mesmas.

### Consulta por frases (Questão 4 da Lista 1):

Quase 10% das buscas realizadas no Google têm por base uma frase, em vez de palavras "soltas". A consulta por frases é implementada no Whoosh no seu *parser* padrão (https://whoosh.readthedocs.io/en/latest/parsing.html#allowing-complex-phrase-queries). Uma frase é identificada pelo *parser* quando a busca consiste em uma sequência de termos entre aspas. O *parser* tokeniza e filtra os termos da frase e gera uma consulta por proximidade. É possível também especificar o número máximo de termos permitido entre os termos da frase processada pelo *parser*.

Para ilustrar sua aplicação, vamos utilizar as 11 cartas de Benício Penalva em que ele solicita a ajuda do Barão de Jeremoabo para conseguir um emprego para si mesmo ou para pessoas próximas. 

In [39]:
lista = []

for i in jeremoabo.tema.str.find('emprego'):
    if i == -1:
        lista.append(False)
    else:
        lista.append(True)
        
emprego_jeremoabo = jeremoabo.loc[lista, :]
emprego_jeremoabo

Unnamed: 0,id,de,para,data,texto,tema
716,354-BPF-27-03-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-03-27,"Meu caro Primo compadre e amigo Sr. Barão .\n\n Bahia 27 de Março de 1890\n\n Aqui cheguei com minha família no dia 15 deste e só no dia 25 - pude ir a casa do Doutor Salustio , e não o encontrando , tornei hoje , e com ele estive conversando : apresentei-lhe a carta de Vossa Excelência como me ordenou . Disse-me o Doutor Salustio , que soube estarem esperando hoje pelo Visconde 5 do- Guahy , e que não sabia se era exata essa notícia : preveni ao- Doutor Salustio para falar ao Guahy , sobre um emprego no novo hospital da misericórdia , segundo Vossa Excelência me ter dito que queria ver se podia obter com o Guahy um bom emprego para mim-\n\n no dito hospital . Vossa Excelência sabe que muito e muito preciso , e que só me arrisquei a vir com a família para esta capital , com único fim de dar a meus filhos uma educação mais ou menos regular , - pois é o meu maior desideratum . Já matriculei dois meninos- no Lyceo , e minha filha hoje , foi 6 também matriculada no externato normal de Senhoras . Se eu puder conseguir os meus- desejos , é um meio de vida que dou a ela , visto não termos outro de que possa ela viver . Sua afilhada , e o do Doutor Severino , ainda não pôde levá-los a escola , por faltar- me um\n\n atestado médico , de como não sofrem moléstia alguma contagiosa , do 7 que só poderei dar andamento depois da semana Santa . Tenho andado tanto aqui , que já 8 me doem as pernas , de maneiras que , para caminhar , é em marcha muito lenta . Tenho feito muita despesa com as arrumações dos meninos , bem entendido , de conformidade a minhas forças , por que cada um vive como pode , e- como sabe , não tenho recursos . Provisoriamente estou morando- na rua do Alvo , nº 201 – 2º andar , em quanto procuro uma roça para ir tendo alguma cousa com que possa ir dando a sub-\n\n a subsistência a meus filhos : Deus é grande e não desampara- a ninguém , principalmente a quem faz diligência com fé nele . Logo que ache a roça e arrende , preciso comprar uns burros 9 , e- desde já lhe previno , por serem os de Vossa Excelência reforçados . Meu filho Francisco , desde que aqui- chegou , entrou em tratamento com o Doutor Ribeiro dos Santos , por se achar sofrendo bastante dos olhos . Aqui tem chovido alguma cousa , e consta-me que por lá também ; Deus permita que continue . Sua Comadre está muito satisfeita aqui , - por ter o mesmo desejo que eu\n\n tenho de ver os filhos educados . Não temos tido alteração em nossa saúde graças a Deus . Muito estimo que ao lado da Excelentíssima Baronesa frua perfeita saúde e todos os- bens . Abençõe sua afilhada , e disponha sempre com a maior- franqueza , do pouco préstimo deste que com muita estima e- melhor consideração é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva . P. S. Recebeu uma carta com a- escritura para o Sr. Boaventura ? Remetia pelo correio do Timbó- que devia seguir no dia 17 deste .\n\n O mesmo","emprego, educação, saúde"
718,356-BPF-19-09-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-09-19,"Meu Prezado Primo compadre e amigo Sr. Barão .\n\n Bahia 19 de Setembro 13 de 1890\n\n Desejo que com a Excelentíssima Baronesa frua perfeita saúde e todos o bens . Hoje encontrei-me no Comércio- com Joãozinho , e perguntando por Totonho , disse-me estar bom . Até hoje está o seu nome incluído na lista- dos candidatos mais votados , e terei grande prazer se for eleito . Como sei que Vossa Excelência é amigo do Conselheiro Virgilio Damasio , e está ele na administração do estado , peço-lhe , de sendo-lhe possível , obter com ele o lugar de inspetor da linha telegráfica do governo , no Estado de gergipe [*] 14 , numa seção que está vaga\n\n e adida ao inspetor Antonio Ribeiro , ou outro lugar aqui na Capital , que Vossa Excelência julgar conveniente . O Doutor Loizio , continua- na administração de engenheiro- geral dos telégrafos , pelo que ju julgo que não lhe será muito difícil conseguir para mim o lugar de inspetor , como peço . Vossa Excelência não ignora que muito preciso , por ser este uma meio fácil de conseguir a educação de meus filhos . Fiquei admirado não ter Vossa Excelência um só voto no Palácio [...] 15 ( termo do Conde ) ao passo que o Doutor Severino teve no Barração 180 - Como se explica isto ? ! Abençõe- sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
719,357-BPF-01-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-01-10,"Meu Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 1º de outubro 16 de 1890\n\n Desejo a continuação de sua preciosa saúde ao lado da Excelentíssima Baronesa com quem receberá nossas visitas . Sua carta de 24 , foi-me entregue a 29 do próximo passado a qual respondo . Deixo de procurar o Doutor Severino , por me ligar ele pouca ou nenhuma importância , tanto assim , que estou aqui nesta capital desde o dia 15 de Março , e morando ele perto de mim , não achou ainda um instante para vir a meu pobre rancho , mas , sem levar isto em consideração , votei nele , para assim cumprir um dever de gratidão , já como parente e já mesmo como amigo Fiquei admiradíssimo o modo por- que foi Vossa Excelência tratado no 8º distrito , bem entendido , nos colégios onde o Severino tem mais força , ao passo que no seu distrito teve ele explendida votação em todos os colégios . Antes da eleição procurei o Doutor Salustio para o mesmo emprego que lhe mandei falar , e ele depois de ter dado algumas providências para cientificar-se donde vinha a nomeação , respondeu-me que não podia , por depender da capital federal , onde não tinha força , em vista disto , deixo de procurá-lo para não me tornar imprudente . No dia 3 deste , não mandando Deus o contrário , sigo para Alagoinhas e dali vou ao engenho , voltando outra vez para Alagoinhas , onde estarei todos os sábados , pois a necessidade obriga-me - a expor-me a tudo ( com dignidade ) e viver separado da família , buscando os meios de nossa subsistência . Vivo sempre resignado com os infortúnios da sorte , Deus um dia se compadecerá de mim ! Já tinha sabido da traição que a última hora fez- lhe o Doutor João Dantas , não me causando porém admiração . Abençõe sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que com- muita estima e consideração é De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
727,360-BPF-23-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-10-23,"Meu Prezado Primo compadre e amigo\n\n Timbó 23 de outubro 19 de 1890\n\n É meu prazer que ao lado da Excelentíssima Baronesa e caros filhos frua sempre vigorosa saúde e todos os bens . Está na administração deste estado o seu distinto amigo o- Doutor José Gonçalvez , pelo que , em vista de minha necessidade , peço-lhe de com ele obter um lugar para mim na alfândega ou tesouraria geral , que não dependa de acesso ou concurso . Seria para mim uma felicidade- se pudesse obter o lugar de administrador das Capatorias da Alfândega , e se não for possível\n\n aceitarei outro , em quanto se arranja cousa melhor . O lugar de inspetor da linha telegráfica- no estado de Sergipe , da seção- vaga , que está adida ao Antônio Ribeiro , também me serve : finalmente , Vossa Excelência fará o que melhor entender a meu benefício ; com- tanto que seja empregado numa repartição da fazenda nacional , que me dê quanto chegue para minha subsistência e de minha família . Pode responder-me para Alagoinhas ou Timbó . Aguardo sua resposta e com a maior franqueza disponha sempre do pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo amigo obrigadíssimo pelo Coração\n\n Benicio Penalva",emprego
728,361-BPF-08-11-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-08-11,"Meu Prezado Primo compadre e amigo Sr. Barão\n\n Alagoinhas 8 de novembro 20 de 1890\n\n Hoje aqui cheguei no trem de Timbó , já tendo sabido no Sítio do Meio de sua passagem para essa Cidade . Muito estimo que ao lado da Excelentíssima Família frua sempre perfeita saúde e todos os bens . Já escrevi a Vossa Excelência comunicando estar no governo- deste estado o seu distinto Amigo o Doutor José Gonçalvez : Ocasião esta , de Vossa Excelência arranjar com ele minha nomeação para o lugar que mais lhe convier .\n\n Estou levando uma vida a- mais terrível possível , que [a]lém de não auferir lucro , vejo-me obrigado a estar separado de minha família em deligência de ganhar alguma cousa para subsistência dela , e a única esperança que tenho de melhorar de sorte é a proteção de Vossa Excelência . Peço-lhe de desculpar minhas imprudências , que são filhas do mau estado em que me vejo . Recebi as sementes de canas e já mandei plantá-las . Sempre a seu dispor encontrará o pouco préstimo deste que é com a maior estima , consideração e respeito\n\n De Vossa Excelência Primo compadre e amigo e obrigadíssimo pelo Coração\n\n Benicio Penalva",emprego
729,362-BPF-30-11-1890-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-11-30,"Meu Prezado Primo compadre e amigo Excelentíssimo Sr. Barão\n\n Alagoinhas 30 de novembro 21 de 1890\n\n É meu prazer que ao lado da Excelentíssima Baronesa e seus caros filhos frua perfeita saúde e todos os bens . Desculpe minha imprudência : Sei que Vossa Excelência não se esquece de mim , mas , como não me é estranho a vida laboriosa que leva , vou lembrar-lhe de aproveitar a estada , como 22 governador , do seu íntimo amigo o Doutor José Gonçalvez , o qual não recusa sacrifícios para servir-lhe , e Vossa Excelência sabe que muito e muito preciso ser empregado , por tanto peço-lhe 23 de\n\n me arrumar quanto antes , por que de um momento para outro podem as cousas mudarem-se , e presentemente a época não lhe pode ser mais favorável do que é . Meus filhos prestarão exame de português , Francês 24 e latim , e forão aprovados plenamente Tem chovido bastante , graças a Deus . Como lhe disse no Timbó , nada tenho feito em compras de fumo , apesar de empregar toda deligência ; é uma luta terrível . Subscrevo-me com toda estima , consideração e respeito\n\n De Vossa Excelência Primo compadre e amigo pelo Coração Benicio Penalva de Faria\n\n 2","emprego, educação"
730,363-BPF-20-12-1890-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-12-20,"Meu Caro Primo compadre e amigo Sr. Barão .\n\n Timbó 20 de dezembro 25 de 1890\n\n Hoje aqui cheguei da Bahia tendo ido apresentar-me ao Doutor José Gonçalvez com o seu cartão , o qual entreguei em mão própria . Falei-lhe sobre minha pretenção , e ele desenganou-me que não podia servir-me ; mas , peço-lhe liçença para dizer-lhe , que ele só não me dá a colocação que Vossa Excelência pede , por que não quer , visto não depender da vontade de outro e sim da dele , assim como também o que pedi , não é caso virgem , pois já se / deu no governo do Marechal Hermes , que aposentou um dos lousado\n\nres e nomeou o Ponphilo de Santa Cruz : Existem ainda dois lousadores , que é o Coronel Araponga e o Santa Rita ; ambos tem direito a aposentadoria , os que fiz-lhe ver , e ele respondeu-me que para essa pretenção minha tinha um candidato , logo que houvesse vaga ; mas , dou de barato , que ele tinha um candidado [*] 26 para arrumar 27 , mas se ambos os lousadores podem ser aposentados , por que razão não me coloca num desses lugares 28 , se só depende da vontade dele governador , e caso idêntico já se deu no governo do\n\n Marechal ? Já vê pois Vossa Excelência que é por não ter vontade de lhe- servir , ou será pela minha malfadada sorte , que sou caipóra- em tudo quanto pretendo . Vossa Excelência sabe que não peço por luxo , e sim pela necessidade que me arrasta de dar uma educação a meus inocentes filhos ! É tristíssima 29 a posição do 30 homem que tem necessidade de andar mendigando como eu ! mas o que farei ! é sofrer com resignação as intemperies da- desgraçada sorte ! ... Em suas- mãos está o futuro de meus filhos ! Basta . Desejo-lhe de\n\n coração e a toda Excelentíssima Família a mais robusta saúde e todos os bens . Abençõe sua afilhada e como sempre encontrará 31 a sua disposição o nada que val[e] o diminuto ser deste que é com toda estima , consideração e respeito\n\n De Vossa Excelência\n\n Primo compadre e amigo pelo Coração\n\n Benicio Penalva de Faria\n\n 3",emprego
731,364-BPF-11-03-1891-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1891-11-02,"Meu Prezado Primo compadre e amigo Senhor Barão .\n\n Baraúnas 11 de Fevereiro de 1891 -\n\n Escrevi-lhe de Alagoinhas ligeiramente , creio que no dia 6 do corrente , e hoje escrevo-lhe daqui , desejando-lhe que com a Excelentíssima Baronesa e seus caros filhos , frua a mais vigorosa saúde e todos os bens . Tenho implorado a Vossa Excelência sua proteção e de sua Excelentíssima família , afim de que tenha eu alí na Bahia uma colocação da qual possa passar com a numerosa família que tenho ; meio este , único que vejo de dar a meus filhos a educação , e até o fazer desta coisa alguma tenho conseguido ! É doloroso não ter-se recursos , ser se pequeno e infeliz ! ... É voz geral , que Vossa Excelência só não consegue [...] 32 do Doutor José Gonçalvez o que não quiser ; pelo que , de novo peço-lhe , não como um favor feito a mim , e sim como esmola que faz a meus filhos de conseguir do Doutor José Gonçalvez o lugar de lousador para mim ; por ser este vitalício . Nada mais tenho a dizer . Abençõe sua afilhada e dê suas ordens a este que com toda estima , concideração e respeito é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração . Benicio Penalva de Faria\n\n 32 Palavra apagada .",emprego
774,390-BPF-28-09-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-09-28,"Prezado compadre e amigo Senhor Barão .\n\n Bahia 28 de setembro 54 de 1898 .\n\n Sua carta de 23 deste , me foi entregue a 26 e muito estimo que com minha Excelentíssima Comadre Thotonio continue a gozar perfeita saúde e todos os bens , recebendo nossas visitas . Retiro o pedido que lhe fiz para ser empregado o meu filho Francisco como Professor de matemáticas 55 no colégio do Doutor Sabino , por que , depois , que lhe tinha escrito , soube ser Professor dessa matéria , o nosso amigo Tantú , e em vista disso , não admito , por forma alguma , que V. se interesse em benefício de\n\n meu filho , com o prejuízo do nosso amigo . É verdade que o meu filho não é conhecido no magistério daqui , mas lhe posso afirmar o- seu preparo , visto estar ele presentemente , dando explicações dessa ciência a um ex-professor dele , - já vê V. , que se não estivesse habilitado , esse ex-professor não se sujeitaria a suas explicações . Sinto mesmo , que não se apresente alguma vaga em concurso , por que ele não deixava de se inscrever , muito embora , o governo o não nomeasse , mas , ficaria todo o público conhecendo de suas habilitações . Tenho estado bastante atacado de catarro , com febre , agora mesmo estou com ela . Joãozinho está morando na Bôa Viagem , por andar a Senhora incomodada , e além de me ver- doente , não sei o número da casa dele , para ir fazer-lhe uma visita , mas , - procurarei saber , afim de cumprir o meu dever , logo que tenha uma melhora . A muito que julgo o caso de minha filha perdido , coitada ! Muito sentirei essa separação perpétua , mas infelizmente , espero com resignação esse terrível golpe . O nosso Pedro Mendes , consta-me ir sentindo alguma melhora , posto que , acha-se também gravemente doente . Continua aqui o sol , quanto mais aí , se Deus não tiver compaixão de nós , acaba-se tudo . Creio que nesta semana sairá a publicação das nomeações e remoções da magistratura , e estou ancioso por ver para onde jogarão o Melo e Arestides . Abençõe sua afilhada e aceite o abraço do seu\n\n Primo compadre e amigo pelo coração\n\n B. Penalva 56\n\n 56 Grafismo .","emprego, saúde"
779,395-BPF-20-04-1902-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1902-04-20,"Meu Prezado Primo compadre e amigo Excelentíssimo Senhor Barão .\n\n Bahia 20 de Abril de 1902\n\n Muito estimo que com minha Excelentíssima Comadre e Thotonio se ache no gozo da melhor saúde , e bem assim , seus netinhos , Joãozinho e a Excelentíssima Senhora , com quem receberá nossas sinceras visitas . Cumpre-me o imperioso dever comunicar-lhe que ontem recebeu o grão de Engenheiro Civil , o meo filho Francisco , estando por conseguinte terminado minha tarefa , quanto a educação dos filhos ; tendo ainda mais , somente á V. , agradecer esse triunfo , pela colocação que me deu nesta capital , donde obtive os meios pecuniários para o terminar dessa preciosidade , de que hoje se achão possuidores , os meus filhos . Muito lhe sou e serei eternamente agradecido , pelo beneficio que recebi , tendo este se estendido á minha prole . Aproveitando a oportunidade , peço-lhe de obter uma colocação para o meu filho Francisco , recentemente diplomado . Consta-me que vai ser demitido o Diretor da Secretaria de Agricultura deste Estado , e a ser- exato peço-lhe ser ele nomeado para esse lugar , caso lhe seja possível : Assim como , se o Coronel Anisio Pinto Cardôso obtiver o arrendamento efetivo da Estrada de ferro Inglesa , daqui para o Timbó , ser o meu filho colocado nessa Estrada como Engenheiro Chefe do tráfego e locomoção dessa linha férrea 73 . É mais um favor que presta ao seu\n\n Primo compadre e amigo pelo Coração B. Penalva 74\n\n 7 \n\n 74 Grafismo .","educação, emprego"


Inicialmente, realizaremos a busca pela frase exata "obter um lugar", que aparece em apenas um dos documentos acima listados.

In [40]:
busca = 'de:"Benicio Penalva" AND texto:"obter um lugar"~1'

qp = QueryParser("texto", schema=ix.schema)
q = qp.parse(busca)
print(q)

(de:"Benicio  Penalva " AND texto:"obter lug")


Pode-se verificar que o *parser* tokenizou e removeu as *stopwords* da frase a ser buscada. Como nas buscas anteriores, passamos a *query* resultante para o método *search* do objeto *searcher* que criamos.

In [41]:
s = ix.searcher()

resultados = s.search(q, limit=None, terms=True)

print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')

if resultados.has_matched_terms():
    matched = [(campo, termo.decode('utf-8')) for campo, termo in resultados.matched_terms()]
    print('Termos com match:\n', matched)

hits=[]

for hit in resultados:
    hits.append(hit)

Foram gerados scores para  2 documento(s)
Termos com match:
 [('de', 'Penalva'), ('de', 'Benicio'), ('texto', 'lug'), ('texto', 'obter'), ('de', '')]


Apesar de apenas uma das 11 cartas que tratavam de solicitações de emprego conter a frase exata, dois documentos foram recuperados. Isso ocorreu porque os documentos também haviam sido processados com o *LanguageAnalyzer*, que remove as *stopwords*. Os documentos obtidos foram:

  * 356-BPF-19-09-1890-mod.txt: "obter com ele o lugar de inspetor"
  * 360-BPF-23-10-1890-mod.txt: "obter um lugar para mim", "obter o lugar de administrador"

In [42]:
recuperados = jeremoabo.loc[jeremoabo.id.isin([hit['id'] for hit in hits]), :]
recuperados

Unnamed: 0,id,de,para,data,texto,tema
718,356-BPF-19-09-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-09-19,"Meu Prezado Primo compadre e amigo Sr. Barão .\n\n Bahia 19 de Setembro 13 de 1890\n\n Desejo que com a Excelentíssima Baronesa frua perfeita saúde e todos o bens . Hoje encontrei-me no Comércio- com Joãozinho , e perguntando por Totonho , disse-me estar bom . Até hoje está o seu nome incluído na lista- dos candidatos mais votados , e terei grande prazer se for eleito . Como sei que Vossa Excelência é amigo do Conselheiro Virgilio Damasio , e está ele na administração do estado , peço-lhe , de sendo-lhe possível , obter com ele o lugar de inspetor da linha telegráfica do governo , no Estado de gergipe [*] 14 , numa seção que está vaga\n\n e adida ao inspetor Antonio Ribeiro , ou outro lugar aqui na Capital , que Vossa Excelência julgar conveniente . O Doutor Loizio , continua- na administração de engenheiro- geral dos telégrafos , pelo que ju julgo que não lhe será muito difícil conseguir para mim o lugar de inspetor , como peço . Vossa Excelência não ignora que muito preciso , por ser este uma meio fácil de conseguir a educação de meus filhos . Fiquei admirado não ter Vossa Excelência um só voto no Palácio [...] 15 ( termo do Conde ) ao passo que o Doutor Severino teve no Barração 180 - Como se explica isto ? ! Abençõe- sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
727,360-BPF-23-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-10-23,"Meu Prezado Primo compadre e amigo\n\n Timbó 23 de outubro 19 de 1890\n\n É meu prazer que ao lado da Excelentíssima Baronesa e caros filhos frua sempre vigorosa saúde e todos os bens . Está na administração deste estado o seu distinto amigo o- Doutor José Gonçalvez , pelo que , em vista de minha necessidade , peço-lhe de com ele obter um lugar para mim na alfândega ou tesouraria geral , que não dependa de acesso ou concurso . Seria para mim uma felicidade- se pudesse obter o lugar de administrador das Capatorias da Alfândega , e se não for possível\n\n aceitarei outro , em quanto se arranja cousa melhor . O lugar de inspetor da linha telegráfica- no estado de Sergipe , da seção- vaga , que está adida ao Antônio Ribeiro , também me serve : finalmente , Vossa Excelência fará o que melhor entender a meu benefício ; com- tanto que seja empregado numa repartição da fazenda nacional , que me dê quanto chegue para minha subsistência e de minha família . Pode responder-me para Alagoinhas ou Timbó . Aguardo sua resposta e com a maior franqueza disponha sempre do pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo amigo obrigadíssimo pelo Coração\n\n Benicio Penalva",emprego


In [43]:
total = []
for i in recuperados.tema:
    total.append('política' in i)
    
print('Documento recuperados que tratam de política:', sum(total))

r = sum(total)/33
print('Revocação:', r)

p = sum(total)/len(recuperados.tema)
print('Precisão:', p)

Documento recuperados que tratam de política: 1
Revocação: 0.030303030303030304
Precisão: 0.5


In [44]:
s.close() # fechamos a busca

Apenas uma das cartas de Benício Penalva contem a frase "obter com o Guahy um bom emprego". Nela, os termos "obter" e "emprego" aparecem separados por cinco termos. Destes, dois não são *stopwords*: "Guahy" e "bom".

In [45]:
stopper = StopFilter(lang='pt')
stemmer = StemFilter(lang='pt')

termos = stopper(RexTokenizer(u"obter com o Guahy um bom emprego"))

for termo in stemmer(termos):
    print(termo.text)

obter
guahy
bom
empreg


Como esperado, quando realizamos a busca pela frase exata, não obtemos resultados.

In [46]:
busca = 'de:"Benicio Penalva" AND texto:"obter um emprego"~1'

qp = QueryParser("texto", schema=ix.schema)
q = qp.parse(busca)
print(q)

(de:"Benicio  Penalva " AND texto:"obter empreg")


In [47]:
s = ix.searcher()

resultados = s.search(q, limit=None, terms=True)

print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')

Foram gerados scores para  0 documento(s)


Quando realizamos a mesma busca com um *slop* (número máximo de termos até o próximo termo da frase) de três termos, recuperamos o documento corretamente.

In [48]:
busca = 'de:"Benicio Penalva" AND texto:"obter um emprego"~3'

qp = QueryParser("texto", schema=ix.schema)
q = qp.parse(busca)
print(q)

(de:"Benicio  Penalva " AND texto:"obter empreg")


In [49]:
s = ix.searcher()

resultados = s.search(q, limit=None, terms=True)

print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')

if resultados.has_matched_terms():
    matched = [(campo, termo.decode('utf-8')) for campo, termo in resultados.matched_terms()]
    print('Termos com match:\n', matched)

hits=[]

for hit in resultados:
    hits.append(hit)

Foram gerados scores para  1 documento(s)
Termos com match:
 [('de', 'Penalva'), ('de', 'Benicio'), ('texto', 'empreg'), ('texto', 'obter'), ('de', '')]


In [50]:
recuperados = jeremoabo.loc[jeremoabo.id.isin([hit['id'] for hit in hits]), :]
recuperados

Unnamed: 0,id,de,para,data,texto,tema
716,354-BPF-27-03-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-03-27,"Meu caro Primo compadre e amigo Sr. Barão .\n\n Bahia 27 de Março de 1890\n\n Aqui cheguei com minha família no dia 15 deste e só no dia 25 - pude ir a casa do Doutor Salustio , e não o encontrando , tornei hoje , e com ele estive conversando : apresentei-lhe a carta de Vossa Excelência como me ordenou . Disse-me o Doutor Salustio , que soube estarem esperando hoje pelo Visconde 5 do- Guahy , e que não sabia se era exata essa notícia : preveni ao- Doutor Salustio para falar ao Guahy , sobre um emprego no novo hospital da misericórdia , segundo Vossa Excelência me ter dito que queria ver se podia obter com o Guahy um bom emprego para mim-\n\n no dito hospital . Vossa Excelência sabe que muito e muito preciso , e que só me arrisquei a vir com a família para esta capital , com único fim de dar a meus filhos uma educação mais ou menos regular , - pois é o meu maior desideratum . Já matriculei dois meninos- no Lyceo , e minha filha hoje , foi 6 também matriculada no externato normal de Senhoras . Se eu puder conseguir os meus- desejos , é um meio de vida que dou a ela , visto não termos outro de que possa ela viver . Sua afilhada , e o do Doutor Severino , ainda não pôde levá-los a escola , por faltar- me um\n\n atestado médico , de como não sofrem moléstia alguma contagiosa , do 7 que só poderei dar andamento depois da semana Santa . Tenho andado tanto aqui , que já 8 me doem as pernas , de maneiras que , para caminhar , é em marcha muito lenta . Tenho feito muita despesa com as arrumações dos meninos , bem entendido , de conformidade a minhas forças , por que cada um vive como pode , e- como sabe , não tenho recursos . Provisoriamente estou morando- na rua do Alvo , nº 201 – 2º andar , em quanto procuro uma roça para ir tendo alguma cousa com que possa ir dando a sub-\n\n a subsistência a meus filhos : Deus é grande e não desampara- a ninguém , principalmente a quem faz diligência com fé nele . Logo que ache a roça e arrende , preciso comprar uns burros 9 , e- desde já lhe previno , por serem os de Vossa Excelência reforçados . Meu filho Francisco , desde que aqui- chegou , entrou em tratamento com o Doutor Ribeiro dos Santos , por se achar sofrendo bastante dos olhos . Aqui tem chovido alguma cousa , e consta-me que por lá também ; Deus permita que continue . Sua Comadre está muito satisfeita aqui , - por ter o mesmo desejo que eu\n\n tenho de ver os filhos educados . Não temos tido alteração em nossa saúde graças a Deus . Muito estimo que ao lado da Excelentíssima Baronesa frua perfeita saúde e todos os- bens . Abençõe sua afilhada , e disponha sempre com a maior- franqueza , do pouco préstimo deste que com muita estima e- melhor consideração é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva . P. S. Recebeu uma carta com a- escritura para o Sr. Boaventura ? Remetia pelo correio do Timbó- que devia seguir no dia 17 deste .\n\n O mesmo","emprego, educação, saúde"


### Consulta híbrida (Questão 5 da Lista 1):

Em seguida, aperfeiçoamos a busca anterior de forma que, quando a consulta por uma frase exata não retornasse resultados, fosse feita uma busca booleana simples com os termos da frase. Como exemplo, usaremos a mesma busca pela frase "obter um emprego".

In [51]:
frase = '"obter um emprego"'
busca = 'de:"Benicio Penalva" AND texto:' + frase + '~1'

qp = QueryParser("texto", schema=ix.schema)
q = qp.parse(busca)
print(q)

(de:"Benicio  Penalva " AND texto:"obter empreg")


In [52]:
s = ix.searcher()

resultados = s.search(q, limit=None, terms=True)

if resultados.scored_length() > 0:
    print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')
else:
    frase = frase.replace(' ', ' OR ').replace('"', '')
    busca = 'de:"Benicio Penalva" AND texto:' + '(' + frase + ')'
    q = qp.parse(busca)
    resultados = s.search(q, limit=None, terms=True)
    print('Foram gerados scores para ', resultados.scored_length(), 'documento(s)')

if resultados.has_matched_terms():
    matched = [(campo, termo.decode('utf-8')) for campo, termo in resultados.matched_terms()]
    print('Termos com match:\n', matched)

hits=[]

for hit in resultados:
    hits.append(hit)

Foram gerados scores para  10 documento(s)
Termos com match:
 [('de', 'Benicio'), ('de', 'Penalva'), ('texto', 'empreg'), ('texto', 'obter'), ('de', '')]


In [53]:
recuperados = jeremoabo.loc[jeremoabo.id.isin([hit['id'] for hit in hits]), :]
recuperados

Unnamed: 0,id,de,para,data,texto,tema
716,354-BPF-27-03-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-03-27,"Meu caro Primo compadre e amigo Sr. Barão .\n\n Bahia 27 de Março de 1890\n\n Aqui cheguei com minha família no dia 15 deste e só no dia 25 - pude ir a casa do Doutor Salustio , e não o encontrando , tornei hoje , e com ele estive conversando : apresentei-lhe a carta de Vossa Excelência como me ordenou . Disse-me o Doutor Salustio , que soube estarem esperando hoje pelo Visconde 5 do- Guahy , e que não sabia se era exata essa notícia : preveni ao- Doutor Salustio para falar ao Guahy , sobre um emprego no novo hospital da misericórdia , segundo Vossa Excelência me ter dito que queria ver se podia obter com o Guahy um bom emprego para mim-\n\n no dito hospital . Vossa Excelência sabe que muito e muito preciso , e que só me arrisquei a vir com a família para esta capital , com único fim de dar a meus filhos uma educação mais ou menos regular , - pois é o meu maior desideratum . Já matriculei dois meninos- no Lyceo , e minha filha hoje , foi 6 também matriculada no externato normal de Senhoras . Se eu puder conseguir os meus- desejos , é um meio de vida que dou a ela , visto não termos outro de que possa ela viver . Sua afilhada , e o do Doutor Severino , ainda não pôde levá-los a escola , por faltar- me um\n\n atestado médico , de como não sofrem moléstia alguma contagiosa , do 7 que só poderei dar andamento depois da semana Santa . Tenho andado tanto aqui , que já 8 me doem as pernas , de maneiras que , para caminhar , é em marcha muito lenta . Tenho feito muita despesa com as arrumações dos meninos , bem entendido , de conformidade a minhas forças , por que cada um vive como pode , e- como sabe , não tenho recursos . Provisoriamente estou morando- na rua do Alvo , nº 201 – 2º andar , em quanto procuro uma roça para ir tendo alguma cousa com que possa ir dando a sub-\n\n a subsistência a meus filhos : Deus é grande e não desampara- a ninguém , principalmente a quem faz diligência com fé nele . Logo que ache a roça e arrende , preciso comprar uns burros 9 , e- desde já lhe previno , por serem os de Vossa Excelência reforçados . Meu filho Francisco , desde que aqui- chegou , entrou em tratamento com o Doutor Ribeiro dos Santos , por se achar sofrendo bastante dos olhos . Aqui tem chovido alguma cousa , e consta-me que por lá também ; Deus permita que continue . Sua Comadre está muito satisfeita aqui , - por ter o mesmo desejo que eu\n\n tenho de ver os filhos educados . Não temos tido alteração em nossa saúde graças a Deus . Muito estimo que ao lado da Excelentíssima Baronesa frua perfeita saúde e todos os- bens . Abençõe sua afilhada , e disponha sempre com a maior- franqueza , do pouco préstimo deste que com muita estima e- melhor consideração é\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva . P. S. Recebeu uma carta com a- escritura para o Sr. Boaventura ? Remetia pelo correio do Timbó- que devia seguir no dia 17 deste .\n\n O mesmo","emprego, educação, saúde"
718,356-BPF-19-09-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-09-19,"Meu Prezado Primo compadre e amigo Sr. Barão .\n\n Bahia 19 de Setembro 13 de 1890\n\n Desejo que com a Excelentíssima Baronesa frua perfeita saúde e todos o bens . Hoje encontrei-me no Comércio- com Joãozinho , e perguntando por Totonho , disse-me estar bom . Até hoje está o seu nome incluído na lista- dos candidatos mais votados , e terei grande prazer se for eleito . Como sei que Vossa Excelência é amigo do Conselheiro Virgilio Damasio , e está ele na administração do estado , peço-lhe , de sendo-lhe possível , obter com ele o lugar de inspetor da linha telegráfica do governo , no Estado de gergipe [*] 14 , numa seção que está vaga\n\n e adida ao inspetor Antonio Ribeiro , ou outro lugar aqui na Capital , que Vossa Excelência julgar conveniente . O Doutor Loizio , continua- na administração de engenheiro- geral dos telégrafos , pelo que ju julgo que não lhe será muito difícil conseguir para mim o lugar de inspetor , como peço . Vossa Excelência não ignora que muito preciso , por ser este uma meio fácil de conseguir a educação de meus filhos . Fiquei admirado não ter Vossa Excelência um só voto no Palácio [...] 15 ( termo do Conde ) ao passo que o Doutor Severino teve no Barração 180 - Como se explica isto ? ! Abençõe- sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
719,357-BPF-01-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-01-10,"Meu Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 1º de outubro 16 de 1890\n\n Desejo a continuação de sua preciosa saúde ao lado da Excelentíssima Baronesa com quem receberá nossas visitas . Sua carta de 24 , foi-me entregue a 29 do próximo passado a qual respondo . Deixo de procurar o Doutor Severino , por me ligar ele pouca ou nenhuma importância , tanto assim , que estou aqui nesta capital desde o dia 15 de Março , e morando ele perto de mim , não achou ainda um instante para vir a meu pobre rancho , mas , sem levar isto em consideração , votei nele , para assim cumprir um dever de gratidão , já como parente e já mesmo como amigo Fiquei admiradíssimo o modo por- que foi Vossa Excelência tratado no 8º distrito , bem entendido , nos colégios onde o Severino tem mais força , ao passo que no seu distrito teve ele explendida votação em todos os colégios . Antes da eleição procurei o Doutor Salustio para o mesmo emprego que lhe mandei falar , e ele depois de ter dado algumas providências para cientificar-se donde vinha a nomeação , respondeu-me que não podia , por depender da capital federal , onde não tinha força , em vista disto , deixo de procurá-lo para não me tornar imprudente . No dia 3 deste , não mandando Deus o contrário , sigo para Alagoinhas e dali vou ao engenho , voltando outra vez para Alagoinhas , onde estarei todos os sábados , pois a necessidade obriga-me - a expor-me a tudo ( com dignidade ) e viver separado da família , buscando os meios de nossa subsistência . Vivo sempre resignado com os infortúnios da sorte , Deus um dia se compadecerá de mim ! Já tinha sabido da traição que a última hora fez- lhe o Doutor João Dantas , não me causando porém admiração . Abençõe sua afilhada , e sempre a seu dispor encontrará o pouco préstimo deste que com- muita estima e consideração é De Vossa Excelência Primo compadre e amigo pelo Coração\n\n Benicio Penalva","emprego, política"
727,360-BPF-23-10-1890-mod.txt,Benicio Penalva de Faria (Benicio Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-10-23,"Meu Prezado Primo compadre e amigo\n\n Timbó 23 de outubro 19 de 1890\n\n É meu prazer que ao lado da Excelentíssima Baronesa e caros filhos frua sempre vigorosa saúde e todos os bens . Está na administração deste estado o seu distinto amigo o- Doutor José Gonçalvez , pelo que , em vista de minha necessidade , peço-lhe de com ele obter um lugar para mim na alfândega ou tesouraria geral , que não dependa de acesso ou concurso . Seria para mim uma felicidade- se pudesse obter o lugar de administrador das Capatorias da Alfândega , e se não for possível\n\n aceitarei outro , em quanto se arranja cousa melhor . O lugar de inspetor da linha telegráfica- no estado de Sergipe , da seção- vaga , que está adida ao Antônio Ribeiro , também me serve : finalmente , Vossa Excelência fará o que melhor entender a meu benefício ; com- tanto que seja empregado numa repartição da fazenda nacional , que me dê quanto chegue para minha subsistência e de minha família . Pode responder-me para Alagoinhas ou Timbó . Aguardo sua resposta e com a maior franqueza disponha sempre do pouco préstimo deste que é com toda estima e consideração\n\n De Vossa Excelência Primo amigo obrigadíssimo pelo Coração\n\n Benicio Penalva",emprego
729,362-BPF-30-11-1890-mod.txt,Benicio Penalva de Faria.,"Cícero Dantas Martins, Barão de Jeremoabo.",1890-11-30,"Meu Prezado Primo compadre e amigo Excelentíssimo Sr. Barão\n\n Alagoinhas 30 de novembro 21 de 1890\n\n É meu prazer que ao lado da Excelentíssima Baronesa e seus caros filhos frua perfeita saúde e todos os bens . Desculpe minha imprudência : Sei que Vossa Excelência não se esquece de mim , mas , como não me é estranho a vida laboriosa que leva , vou lembrar-lhe de aproveitar a estada , como 22 governador , do seu íntimo amigo o Doutor José Gonçalvez , o qual não recusa sacrifícios para servir-lhe , e Vossa Excelência sabe que muito e muito preciso ser empregado , por tanto peço-lhe 23 de\n\n me arrumar quanto antes , por que de um momento para outro podem as cousas mudarem-se , e presentemente a época não lhe pode ser mais favorável do que é . Meus filhos prestarão exame de português , Francês 24 e latim , e forão aprovados plenamente Tem chovido bastante , graças a Deus . Como lhe disse no Timbó , nada tenho feito em compras de fumo , apesar de empregar toda deligência ; é uma luta terrível . Subscrevo-me com toda estima , consideração e respeito\n\n De Vossa Excelência Primo compadre e amigo pelo Coração Benicio Penalva de Faria\n\n 2","emprego, educação"
759,381-BPF-20-11-1897-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1897-11-20,"Prezado Primo compadre e amigo Excelentissimo Senhor Barão .\n\n Timbó 20 de novembro 20 de 1897 .\n\n ontem depois de já ter deitado na caixa uma carta para V. , ao meio dia recebi um chamado do Doutor Ribeiro- dos Santos , e como estav[a] 21 o almoço na mesa , fui primeiro almoçar e logo depois , quando já estava pronto para sair veio o criado novamente chamar-me ; segui imediatamente , e alí chegando encontrei com [com] o Doutor Ribeiro e Bahia ; perguntarão-me eles qual o meio mais fácil de lhe dar um aviso urgente , respondi que telegrafando para o Timbó , responderão-me que não era possível ser-lhe transmitido este aviso pelo telégrafo que dependia do maior sigilo ;\n\n em vista dessa respos[ta] 22 perguntei- lhes o que havia , responderão-me - havia ordem para ser V. preso , em vista da gravidade do caso ofereci-me para vir até aqui e por mim próprio lhe avisar para tomar suas cautelas . Depois o Bahia disse-me que a notícia vinha do Doutor Paulo Fontes , procurei entender-me com ele imediatamente o encontrando no grande Júri , disse-me 23 ele que soube por um empregado da polícia que o Vianna tramava sua prisão , e a força que para aí seguiu e que já aí está já era para esse fim , esta última parte é ilação que tiramos em vista de uma carta que saiu publicada no Republicano , que lhe remeto com outras gazetas pelo nosso amigo José Lopes de Almeida em quem deposito inteira confiança ; e lhe peço de- por ele responder-me imediatamente que pretendo voltar sem falta no dia 22 . Se o malvado Vianna trama contra V. estas misérias é de acordo com o Severino , que aliás ainda o julgo mais perverso do que o Vianna , basta ser mais inteligente . A prisão não é somente para V. e sim também para o- Doutor José Gonsalves e José Ignacio , para onde já seguiu- força : eles pretendem não somente lhes desfeitearem se não também , talvez mesmo eliminarem-nos . Tudo tem deve ter um paradeiro , até mesmo a perseguição . Hoje no encontro do trem vi Thotonio que decia para a Bahia , mas com a presteza do encontro nem ao menos 24 me foi possível falar-lhe . Não facilite as cousas , por que o negócio é- muito sério e gravíssimo . Estimo que com toda Excelentíssima Família goze saúde perfeita e todos os bens dando um beijo ao pequeno Cicero . Sempre a seu dispor tem o pouco préstimo do seu\n\n Primo compadre e Amigo pelo Coração\n\n B. Penalva 25\n\n 2 \n\n 25 Grafismo .",política
763,385-BPF-17-01-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-01-17,"Prezado Primo compadre e amigo Senhor Barão .\n\n Bahia 17 de Janeiro de 1898\n\n Por Joãozinho , que segue amanhã , recebi suas cartas de 21 do mês findo e 10 deste . Estimo a continuação de sua vigorosa saúde e bem assim de toda Excelentíssima Família com quem receberá minhas sinceras visitas e saudades . Já foi publicado no “ Republicano ” o manifesto do general Glycério convocando todos os amigos à concorrer ao pleito de 1º de Março , e em meu fraco entender não devemos deixar correr a revelia , e sim trabalharmos todos unificados a um só , por que não sabemos o que será o dia da manhã . As Candidaturas dos Doutores Lauro Sodré e Fernando Lôbo , não nos deve ser indiferente por forma alguma , muito = embora tenhamos a certeza de não ser eles os reconhecidos . Estão publican[do] o interrogatório do antentado [*] 41 do dia 5 de novembro 42 , e querem por força encravar o Doutor Manuel Victorino e General Glycerio como cúmplices no atentado , somente com o fim , daquele não presidir as secções da Câmara da verificação de poderes , e este não tomar parte nas mesmas secções ; Estão publicando o inquerito . Parece-me que o Estado de sítio não será prorrogado , ( isto é não , ) por que , a banda[lhei]ra 43 que eles tem feito , é de tal ordem , que estão envergonhados , e não sei mesmo que saída darão a semelhante força ; Est[ão] empregando a intriga entre os nossos amigos como sucedeu com o Martins\n\n Junior , mas este já veio a imprensa desmascará los , o mesmo estão fazendo por todos os- Estados , com o fim de esmorecer a oposição . São uns Saltimbancos ! O Néro está- danado com o Arlindo Leone , por não ter- este se prestado as infâmias que ele queria , neste ponto , considero o Arlindo um homem de bem . O nosso “ Republicano ” vai mal nas finanças , por não haver capital para o custeio , e ficaremos perdidos sem a [...] 44 se perdermos o nosso orgão , único elemento que mostra ainda respirarmos , se por circunstâncias pecuniárias , for obrigado a fechar , estamos perdidos para sempre ; e está em condições tais de quebradeira , que suponho não chegar a 1º de Março .\n\n Como havemos de ficar , se nos faltar o 1º elemento que constitui a vida de um partido , mormente numa emergência desta , em vespera de uma eleição tão renhida como esta ? V. não falou em circunferência e nem em diâmetro , e sim , em sua nota , e na carta á Severiano , dizia o seguinte : que os parafusos tinham 14 centímetros , e que dobrada as pontas , achar-se-ia o centro , por isso ficamos sem saber deliberar , até mesmo os encarregados da fundição , disto como , metade de 14 são 7 , e nessas condições era impossível mandar-se preparar os parafusos por ser uma grossura extraordinária , além disto , não- mandou o comprimento da parte su- superior da chaveta , á ponta do parafuso , e nem tão pouco disse se queria com as porcas ou sem elas ; por que , tendo lá as porcas dos que estão servindo , não convém perdê-las , e nem também se podia preparar outras iguais , sem 45 saber se a grossura- exata ; por estas razões , as quais julgo judiciosas deixamos de fazer a encomenda , esperando novas ordens sua . João foi agora a fundição , e não- me avisou , e disse-me ter encomendado a caldeira . Fico certo das S. 46 de- feijões e sobre isso já falei á Severiano para ir recebê-las e dar o destino competente : Se V. não teve de sua lavra , para que toma esse cuidado conosco , tendo mais essa despesa ? Agradeço-lhe a lembrança que sempre- tem de mim . O nosso amigo Doutor Mello está aí com a família , dê-lhe lembranças . Passo regularmente graças a Deus Minha família deve estar hoje , ou aliás , desde sábado 15 deste , em casa de minha sogra . Sempre a seu dispor tem o pouco préstimo do seu\n\n Primo compadre e amigo pelo Coração\n\n B. Penalva 47\n\n 47 Grafismo .",política
774,390-BPF-28-09-1898-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1898-09-28,"Prezado compadre e amigo Senhor Barão .\n\n Bahia 28 de setembro 54 de 1898 .\n\n Sua carta de 23 deste , me foi entregue a 26 e muito estimo que com minha Excelentíssima Comadre Thotonio continue a gozar perfeita saúde e todos os bens , recebendo nossas visitas . Retiro o pedido que lhe fiz para ser empregado o meu filho Francisco como Professor de matemáticas 55 no colégio do Doutor Sabino , por que , depois , que lhe tinha escrito , soube ser Professor dessa matéria , o nosso amigo Tantú , e em vista disso , não admito , por forma alguma , que V. se interesse em benefício de\n\n meu filho , com o prejuízo do nosso amigo . É verdade que o meu filho não é conhecido no magistério daqui , mas lhe posso afirmar o- seu preparo , visto estar ele presentemente , dando explicações dessa ciência a um ex-professor dele , - já vê V. , que se não estivesse habilitado , esse ex-professor não se sujeitaria a suas explicações . Sinto mesmo , que não se apresente alguma vaga em concurso , por que ele não deixava de se inscrever , muito embora , o governo o não nomeasse , mas , ficaria todo o público conhecendo de suas habilitações . Tenho estado bastante atacado de catarro , com febre , agora mesmo estou com ela . Joãozinho está morando na Bôa Viagem , por andar a Senhora incomodada , e além de me ver- doente , não sei o número da casa dele , para ir fazer-lhe uma visita , mas , - procurarei saber , afim de cumprir o meu dever , logo que tenha uma melhora . A muito que julgo o caso de minha filha perdido , coitada ! Muito sentirei essa separação perpétua , mas infelizmente , espero com resignação esse terrível golpe . O nosso Pedro Mendes , consta-me ir sentindo alguma melhora , posto que , acha-se também gravemente doente . Continua aqui o sol , quanto mais aí , se Deus não tiver compaixão de nós , acaba-se tudo . Creio que nesta semana sairá a publicação das nomeações e remoções da magistratura , e estou ancioso por ver para onde jogarão o Melo e Arestides . Abençõe sua afilhada e aceite o abraço do seu\n\n Primo compadre e amigo pelo coração\n\n B. Penalva 56\n\n 56 Grafismo .","emprego, saúde"
779,395-BPF-20-04-1902-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1902-04-20,"Meu Prezado Primo compadre e amigo Excelentíssimo Senhor Barão .\n\n Bahia 20 de Abril de 1902\n\n Muito estimo que com minha Excelentíssima Comadre e Thotonio se ache no gozo da melhor saúde , e bem assim , seus netinhos , Joãozinho e a Excelentíssima Senhora , com quem receberá nossas sinceras visitas . Cumpre-me o imperioso dever comunicar-lhe que ontem recebeu o grão de Engenheiro Civil , o meo filho Francisco , estando por conseguinte terminado minha tarefa , quanto a educação dos filhos ; tendo ainda mais , somente á V. , agradecer esse triunfo , pela colocação que me deu nesta capital , donde obtive os meios pecuniários para o terminar dessa preciosidade , de que hoje se achão possuidores , os meus filhos . Muito lhe sou e serei eternamente agradecido , pelo beneficio que recebi , tendo este se estendido á minha prole . Aproveitando a oportunidade , peço-lhe de obter uma colocação para o meu filho Francisco , recentemente diplomado . Consta-me que vai ser demitido o Diretor da Secretaria de Agricultura deste Estado , e a ser- exato peço-lhe ser ele nomeado para esse lugar , caso lhe seja possível : Assim como , se o Coronel Anisio Pinto Cardôso obtiver o arrendamento efetivo da Estrada de ferro Inglesa , daqui para o Timbó , ser o meu filho colocado nessa Estrada como Engenheiro Chefe do tráfego e locomoção dessa linha férrea 73 . É mais um favor que presta ao seu\n\n Primo compadre e amigo pelo Coração B. Penalva 74\n\n 7 \n\n 74 Grafismo .","educação, emprego"
780,396-BPF-21-09-1902-mod.txt,Benicio Penalva de Faria (B. Penalva).,"Cícero Dantas Martins, Barão de Jeremoabo.",1902-09-21,"Prezado Primo compadre e amigo Senhor Barão\n\n Bahia 21 de setembro 75 de 1902 .\n\n Muito estimo que com minha Excelentíssima Comadre e todos os mais entes que lhe são caros , se ache fruindo vigorosa saúde , aureolada de todas as felicidades , dando um beijo de inocência a seus idolatrados netinhos , e aceitando nossas sinceras e saudosas visitas . Aqui cheguei de Theophilo Ottoni , (Minas) , no dia 15 do Corrente , tendo ido levar minha nora . Aqui chegando , soube , que é- bem possível – O Coronel Anizio Pinto Cardôso e outros , obterem o arrendamento efetivo da estrada de ferro ex-ingleza e ramal do-\n\n Timbó , pelo que , novamente lhe peço , no caso afirmativo , de não esquecer-se do pedido que lhe fiz , para [ser] 76 o meu filho Francisco coloca[do] 77 nessa estrada , como engenheiro [che]fe 78 do tráfego e locomoção , pois V. , sabe que somos pobres e precisamos 79 muito ganhar dinheiro , afim de p[o]dermos 80 viver com decência na [...] 81 cidade ; e não tendo para quem apelar se não para V. , queira desculpar minha exigência , por que , - os candidatos , ao logar , sem dúvid[a] 82 serão em grande número , e por- conseguinte , é preciso que de antemão V. previna-se com o- Coronel Anisio e outros sócios pretendentes do dito arrendamento Consta-me que o Doutor Filgueiras seguiu ontem para o Rio a mandado do Doutor Severino para tratar desse negócio , e é bem possível conseguir . Amanhã , está marcada uma reunião do partido republicano para tratar da chapa dos candidatos a eleição federal , e segundo consta-me , é Thotonio um <dos> escolhidos , o que muito me satisfará . Passamos regularmente e aceite o abraço sincero do seu\n\n Primo e amigo pelo Coração P. S. B. Penalva 83\n\n Amanhã sigo com sua Comadre e Laura para o Timbó . 84 O mesmo\n\n 83 Grafismo .\n\n 84 Traço .","emprego, política"


Todos os documentos recuperados incluem variações dos termos "obter" ou "emprego" após a passagem pelo filtro de *stemming*. Por exemplo, no documento 396-BPF-21-09-1902-mod.txt, há uma ocorrência do termo "obterem".