Este projeto automatiza o controle de envio de documentos digitalizados, gerando relatórios consolidados em Excel a partir de metadados de arquivos. Desenvolvido com o auxílio estratégico de Inteligência Artificial, este projeto demonstra como utilizei ferramentas tecnológicas avançadas para superar desafios técnicos e criar uma solução robusta que otimizou significativamente minha rotina operacional, economizando tempo e garantindo precisão nos dados.
No papel de Assistente Comercial, identifiquei um gargalo crítico no fluxo de trabalho: o sistema legado da empresa, utilizado para o escaneamento de listas escolares, não oferece funcionalidades de relatório ou acompanhamento de progresso.
Isso resultava em um processo manual exaustivo de conferência "item a item" para identificar quais escolas haviam entregue os documentos, quais estavam pendentes e o status de cada divulgador. Essa falta de visibilidade gerava insegurança nos dados, risco de erros humanos e uma perda de tempo considerável que poderia ser aplicada em tarefas mais analíticas.
Para resolver este desafio de forma inovadora e eficiente, utilizei IA para projetar e desenvolver um robô em Python capaz de processar automaticamente grandes volumes de arquivos escaneados.
A solução lê os diretórios, extrai metadados diretamente dos nomes dos arquivos (como códigos de entidades e identificação de origem) e utiliza os registros do sistema de arquivos para determinar cronologias de entrega. O resultado é a consolidação automática de todas as informações em um relatório profissional em Excel. Essa automação eliminou totalmente a necessidade de contagem manual, permitindo entregar aos supervisores uma visão clara, precisa e em tempo real da situação atual das entregas.
- Varredura Automática: Escaneia diretórios em busca de arquivos de imagem e texto.
- Extração de Metadados: Identifica códigos de entidades (ex: escolas) diretamente do nome do arquivo.
- Análise Temporal: Detecta a data da primeira ocorrência de cada entidade com base nos timestamps do sistema de arquivos.
- Relatório Profissional: Gera uma planilha Excel formatada e ordenada para tomada de decisão.
- Python 3
- Pandas: Para manipulação e estruturação de dados.
- OS/Datetime: Para operações nativas de sistema de arquivos e datas.
- Openpyxl: Para suporte à exportação de planilhas Excel.
/ScanFlow-Bot
├── data/ # Gestão de arquivos
│ ├── input/ # Arquivos crus (.JPG, .TXT)
│ └── output/ # Resultados gerados (.XLSX)
├── src/ # O Coração (Código-fonte)
│ ├── __init__.py
│ ├── main.py # Ponto de entrada (Orquestrador)
│ ├── core.py # Lógica principal (Regex, cálculos, extração)
│ └── utils.py # Ferramentas de apoio (Logs, caminhos, datas)
├── logs/ # Histórico de execução para auditoria
├── scripts/ # Facilitadores (.BAT, scripts de apoio)
│ ├── gerador_testes.py # Ferramenta para povoar ambiente de testes
│ └── executar.bat # Script de execução rápida
├── tests/ # Testes para garantir que o código não quebre
├── .gitignore # Proteção (Não sobe lixo ou dados sensíveis para o Git)
├── README.md # O seu "cartão de visitas" (Documentação)
└── requirements.txt # Lista de dependências (Bibliotecas)
-
Instale as dependências:
pip install -r requirements.txt
-
Caso queira testar em um ambiente vazio, rode o gerador de testes:
python scripts/gerador_testes.py
-
Execute o processador principal:
python -m src.main
ou use o
scripts/executar.bat(Windows).
Este projeto foi adaptado para portfólio para proteger dados sensíveis, utilizando ferramentas de geração de dados fictícios (Mock Data).