Navigation Menu

Skip to content

rpliva/HlidacStatu-InsolvencniRejstrik

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Datové sady Hlídače Státu - Insolvenční rejstřík

Program pro stažení záznamů z Insolvenčního rejstříku, jejich zpracování a uložení do Hlídače Státu. Podporuje dva způsoby stažení a uložení dat:

  • stažení pomocí vyhledávače ISIR a uložení do datové sady
  • zpracovávání změnových událostí a uložení do databáze

Stažení pomocí vyhledávače ISIR a uložení do datové sady

Podrobné informace o datovém zdroji v Hlídači Státu jsou zde včetně aktuálního datového schématu a možnosti prohlížení a vyhledávání v uložených datech.

Seznam řízení v Insolvenčním rejstříku je získáván z vyhledávače ISIR odkud se postupně za vybrané období načítají vrácená řízení, pro které se následně volá webová služba ISIR_CUZK_WS2 pro získání aktuálního stavu řízení a url adresy na detail řízení, který obsahuje podrobnější informace o řízení včetně všech dokumentů.

Pokud řízení bylo z rejstříku vyškrtnuto dle § 425 insolvenčního zákona, aktuální stav má hodnotu ZNEPRISTUPNENO a url adresa na detail řízení není vyplněna.

Jak spustit

Program je potřeba spustit s přepínačem -s nebo --search, který definuje stahování záznamů z vyhledávače ISIR a ukládání do datové sady Hlídače Státu. Pro ukládání dat do datové sady je nutný API token, který lze získat po přihlášení na stránkách Hlídače Státu - API pro vývojáře a který se zadává pomocí přepínače --apitoken=<API TOKEN>.

Volitelně je možné zadat také datum, od kterého se začnou záznamy načítat. V případě jeho nezadání se defaultně vyplní 1.1.2008, což je datum, kdy byl insolvenční rejstřík uveden do provozu a od kdy jsou v něm vedeny záznamy.

spuštění s defaultním datem začátku

    InsolvencniRejstrik.exe -s -apitoken=docela1dlouhy2token3pro4tohle5api

spuštění s načítáním od 1.1.2018

    InsolvencniRejstrik.exe -s -apitoken=docela1dlouhy2token3pro4tohle5api --date=1.1.2018

Zpracovávání změnových událostí a uložení do databáze

Z Insolvenčního rejstříku lze pomocí služby ISIR_WS číst všechny změnové události ke všem řízení. Tyto události obsahují mimojiné informace o zahájení řízení, změny osob účastnících se řízení, změny stavu řízení a také informace o přidání dokumentu k řízení včetně linku pro jeho stažení.

Program v tomto režimu čte události od posledního v databázi uloženého ID a spravuje řízení, jejich osoby a navázané dokumenty a změny ukládá do databáze.

Jak spustit

Program je potřeba spustit s přepínačem -e nebo --events, který definuje zpracování změnových událostí a jejich ukládání do databáze. Program se ukončí při přečtení všech zpráv v insolvenčním rejstříku. Pokud chcete, aby program běžel i po přečtení všech zpráv a kontroloval pravidelně nové události, použijte přepínač --watch.

V případě, že nechcete číst a ukládat eventy do lokalní cache, použijte přepínač --no-cache a všechny dotazy budou pouze proti webovým službám Insolvenčního rejstříku. Pokud přepínač není zadán, nejprve se zkouší prohled lokální cache a až poté se provádí dotazy na webové služby Insolvenčního rejstříku. Každá událost vrácená z webové služby je zároven uložena do lokální cache (velikost lokální cache pro kompletní data může mít i několik desítek GB).

Pro urychlení zpracování doporučuji inicializovat cache pro načítání odkazů na detaily jednotlivých řízení. Inicializace cache se provede pomocí přepínače --init-link-cache (velikost lokální cache odkazů je několik desítek MB).

inicializace cache odkazů

    InsolvencniRejstrik.exe ---init-link-cache

spuštění

    InsolvencniRejstrik.exe -e

spuštění bez cache

    InsolvencniRejstrik.exe -e --nocache

About

Program pro stažení záznamu z Insolvenčního rejstříku, jejich zpracování a uložení do datové sady Hlídače státu

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages