A história desses scripts e como fazer o caminho completo do arquivo disponibilizado pela Câmara até o TXT desse repositório estão no texto do link abaixo:
Exemplos de uso...
Convertendo o arquivo TXT em JSON:
$ ./ver2json.py <vereadores.txt >vereadores.json
Lendo o registro da 205ª linha do TXT em JSON:
$ sed -n '205p' vereadores.txt | ./ver2json.py | ./prettify.py
[
{
"Registro": 40208,
"Nome": "Waldir da Silva Prado",
"Lideranca": [],
"NomeParlamentar": [
"Waldir da Silva Prado"
],
"Vereancas": [
{
"Partido": "PTN",
"NomeVereadorSaiu": "Venicio Camillo Giachini",
"VereancaDataIn": "11/10/1961",
"situacao": "suplente",
"VereancaDataFin": "09/11/0961"
}
],
"ComissoesPermanentes": [],
"Legislaturas": [
{
"QuantVotos": 2786,
"PeriodoHistorico": 3,
"Situacao": "Suplente",
"NumeroLegislatura": 4
}
],
"MesaDiretora": []
}
]
Checando com a linha original:
$ sed -n '205p' vereadores.txt
40208#Waldir da Silva Prado#####^p3^n4^sSuplente^q2786%#^i11/10/1961^f09/11/0961^ssuplente^pPTN^bVenicio Camillo Giachini%#
Combinando com grep
para selecionar por nome...
$ grep '#Netinho de Paula' vereadores.txt | ./ver2json.py | ./prettify.py | head -20
[
{
"Registro": 40531,
"Nome": "Jose de Paula Neto",
"Lideranca": [
{
"DataFin": "08/04/2015",
"Cargo": "Lider de Bancada",
"DataIn": "01/04/2014",
"LiderPartido": "PC do B"
},
{
"DataFin": "07/12/2015",
"Cargo": "Lider de Bancada",
"DataIn": "09/04/2015",
"LiderPartido": "PDT"
}
],
"NomeParlamentar": [
"Netinho de Paula"