UchwałoMat.pdf to narzędzie desktopowe dla Windows, które automatycznie generuje czytelne tytuły uchwał, zarządzeń i raportów z plików PDF urzędowych. Umożliwia szybkie przetwarzanie dokumentów, zarówno tekstowych, jak i skanowanych, z wykorzystaniem technologii OCR.
Pobierz najnowszą wersję przez GitHub Releases i korzystaj bez instalacji!
- Automatyczne rozpoznawanie typu dokumentu (uchwała, zarządzenie, raport)
- Ekstrakcja tytułów z plików PDF, nawet jeśli są to skany (dzięki OCR)
- Poprawne formatowanie tytułów – np. dla zarządzeń fragment do „z dnia” jest zawsze WIELKIMI LITERAMI, tytuł zaczyna się od nowej linii
- Obsługa wielu plików jednocześnie – wystarczy wskazać folder z dokumentami
- Przyjazny interfejs graficzny (GUI) oparty o Tkinter
- Statystyki przetwarzania (ile plików, ile użyto OCR, ile PyPDF2)
- Wybierz folder z plikami PDF (uchwały, zarządzenia, raporty)
- Program rozpoznaje typ każdego dokumentu oraz wyciąga i formatuje tytuł
- Wynik zapisuje się do pliku
wyniki.txtw wybranym katalogu - Jeśli plik PDF jest skanem (obrazem), program używa OCR (Tesseract) do rozpoznania tekstu (brak 100% pewności co do poprawnego odczytania tytułu)
Zalecane pobieranie przez GitHub Releases – znajdziesz tam najnowszą wersję programu, gotową do uruchomienia na Windows (plik .exe).
OCR (Optical Character Recognition) umożliwia rozpoznawanie tekstu ze skanów i plików PDF, które nie zawierają warstwy tekstowej (np. zeskanowane uchwały). Dzięki temu UchwałoMat.pdf potrafi przetwarzać zarówno dokumenty tekstowe, jak i obrazy.
- Wersja z OCR (dostępna w najnowszych release) działa „out of the box” – nie wymaga instalacji Tesseract osobno, bo jest dołączony w folderze projektu.
- Wersja bez OCR (w katalogu
dist) działa tylko z PDF-ami tekstowymi, nie obsługuje skanów.
Uchwalomat.PDF/ ├── main.py # Główny plik programu ├── Tesseract-OCR/ # Folder z dołączonym Tesseract (dla OCR) - skompresowany i dolączony w pliku .exe ├── dist/ # Stara wersja bez OCR ├── requirements.txt # Minimalne zależności └── ...
- Windows 10/11
- Python 3.8+ (tylko dla wersji źródłowej)
- Dla wersji .exe – nie są wymagane żadne instalacje ani uprawnienia administratora
- Pobierz najnowszą wersję z zakładki Releases
- Rozpakuj archiwum ZIP
- Uruchom
UchwaloMat.exe - Wskaż folder z plikami PDF i kliknij „Generuj raport”
Czy muszę instalować Tesseract?
Nie – program zawiera własną kopię Tesseract w folderze Tesseract-OCR.
Czy obsługiwane są skany PDF?
Tak, wersja z OCR automatycznie rozpoznaje tekst ze skanów.
Co znajduje się w katalogu dist?
Stara wersja programu, która nie obsługuje OCR – działa tylko z PDF-ami tekstowymi.
Projekt: Jakub Budzich
Repozytorium: github.com/budziun/Uchwalomat.PDF