Script para converter a fatura do NuBank (em PDF) para um CSV lindão
Python
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.

README.md

nubank-to-csv

Script que converte o PDF da fatura do NuBank para CSV, já somando o IOF de cada item (na fatura o IOF vem em itens separados).

O script converte o PDF para HTML (através do softwar e pdftohtml, contido no pacote poppler-utils) e depois faz parsing do HTML, pegando somente os dados desejados, e depois junta os itens de IOF com o item principal.

Nota: como no PDF não existe a informação do ano, o script entende que o ano da fatura é o ano corrente.

Instalação

Dependências

Dependências do sistema:

apt-get install poppler-utils

Dependências Python:

pip install lxml rows

Caso prefira instalar tudo pelo sistema:

apt-get install poppler-utils python-lxml python-rows

Script

Baixe o arquivo nubank.py contido nesse repositório.

Uso

Primeiro converta o PDF para HTML e depois rode o script em cima do HTML.

Converter de PDF para HTML:

pdftohtml XXX.pdf

onde XXX.pdf é o caminho para o arquivo de sua fatura. Isso irá gerar um arquivo XXXs.html (dentre outros) no mesmo diretório.

Converter de HTML para CSV:

python nubank.py XXXs.html minha-linda-fatura.csv

Agora é só brincar com o arquivo minha-linda-fatura.csv! ;-)

Contribua!

O software é livre e você pode contribuir. :) Sugestões de contribuição:

  • Criar função para já rodar o pdftohtml automaticamente, de forma que precisemos rodar apenas um comando (o próprio nubank-to-csv).
  • Criar um aplicativo Web simples em que seja possível fazer o upload do PDF e o download do CSV convertido.