Skip to content

Seznam použité literatury

cbvk edited this page Jan 4, 2019 · 2 revisions

Seznam použité literatury

Cílem je skenování a zpřístupnění seznamu literatury u titulů ve formě obrázku titulní stránky, PDF všech skenovaných stránek včetně OCR vrstvy, jak je tomu i u TOC.

Workflow:

  • Skenování pomocí aplikace skenovacího klienta verze minimálně 0.38, který jako první podporuje skenování seznamu literatury. Skenování probíhá obdobným způsobem jako skenování obsahů TOC.
  • Získání dat KIS pomocí metadatového kontejneru obvyklým způsobem, který je obohacen o URL seznamu literatury. Příklad dotazu:
 https://cache.obalkyknih.cz/api/books/?multi=[{"nbn":"cnb000034193"}]

Seznam literatury k nahlížení na stránkách obálek knih:

 https://www.obalkyknih.cz/view?nbn=cnb000034193

Nové položky odpovědi API dostupné po skenovaní:

[
 {
  ...
  "bib_thumbnail_url": "https://cache.obalkyknih.cz/file/bib/2/thumbnail",
  "bib_pdf_url": "https://cache.obalkyknih.cz/file/bib/2/pdf",
  ...
 }
]
  • Postprocessing ve formě obohacení o fulltext už existujícího PDF (vytvoření textové vrstvy v PDF) a doplnění fulltextu do odpovědi API. Postprocessing proběhne z pravidla do 24h, ale zpracování může trvat i déle.
Výsledná podoba metadatového kontejneru:
[
 {
  ...
  "bib_thumbnail_url": "https://cache.obalkyknih.cz/file/bib/2/thumbnail",
  "bib_full_text": "SEZNAM POUŽITÉ A DOPO\r\n1.\tBayer, Benda, Čučka\r\n 2.\tBellman, R. atd...",
  "bib_pdf_url": "https://cache.obalkyknih.cz/file/bib/2/pdf",
  ...
 }
]
Clone this wiki locally