Skip to content
/ wbc Public

Publications from Wielkopolska Biblioteka Cyfrowa converted from DJVU to text format

License

Notifications You must be signed in to change notification settings

macbre/wbc

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

91 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

wbc Build Status

Skrypt importujący publikacje na licencji Fair Use w formacie DJVU z zasobów Wielkopolskiej Biblioteki Cyfrowej

Wymagania

  • Python 3.6+
  • curl + ungzip
  • djvutxt z pakietu djvulibre-bin
sudo apt-get install djvulibre-bin python3-lxml

virtualenv --system-site-packages env3 -p python3
source env3/bin/activate

pip install -U -e .

Pobieranie

fetch [--no-fetch] <ID publikacji>

Struktura katalogów

 - publications/
   - <ID publikacji>/
     - index.json
     - issues/
       - <rocznik>
         - <ID numeru>.txt

xmlpipe2

Aby wygenerować plik dla źródła SphinxSE xmlpipe2:

generate_xml 106644 | gzip -c > 106644.xml.gz
generate_xml 106644,142333 | gzip -c > kronika_gazeta_wielkiego_ksiestwa.xml.gz

Publikacje

About

Publications from Wielkopolska Biblioteka Cyfrowa converted from DJVU to text format

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published