Script para manipulação de arquivos PDF em Shell
Este script nasceu da necessidade diária de editar e manipular arquivos PDF, porém, dependendo da ação realizada, era necessário utilizar softwares ou comandos diferentes, como convert, pdftk ou mesmo um script em Ruby para conversão de um PDF comum (digitalizado como imagem) em um PDF no formato OCR. Procurei, portanto, reunir as principais ações que uso rotineiramente em um só script, facilitando meu trabalho e poupando tempo.
- pdftk
- dialog
- tesseract-ocr
- tesseract-ocr-por
- tesseract-ocr-eng
- imagemagick
- Scripts djpdf e pdfocr devem estar no mesmo diretório
- Scripts djpdf e pdfocr devem ser executáveis
- Permissão de escrita no diretório dos scripts
- Dividir um arquivo PDF em várias páginas
- Unir 2 ou mais arquivos PDF em um só arquivo
- Transformar arquivo PDF comum em um arquivo PDF OCR
- Converter imagens em PDF
- Girar o arquivo PDF em 90º (sentido horário)
- Girar o arquivo PDF em 90º (sentido anti-horário)
- Girar o arquivo PDF em 180º
- Separar páginas pares e ímpares de um arquivo PDF
- Copiar arquivos e renomear de forma sequencial crescente
1) Instalando via apt-get de uma só vez todos os softwares necessários para o funcionamento do script:
sudo apt-get install -y pdftk dialog tesseract-ocr tesseract-ocr-por tesseract-ocr-eng imagemagick
2) Transformando os arquivos de script em executáveis (executar na pasta dos scripts):
sudo chmod a+x djpdf pdfocr
3) Automatizando a chamada do script (basta digitar djpdf sem a necessidade de apontar para o caminho arquivo)
sudo ln -s [caminho_completo_do_arquivo_djpdf] /usr/sbin/djpdf