Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Nesprávna reprezentácia množiny datasetov LKODu MFSR #44

Open
miroslavliska opened this issue Feb 27, 2024 · 0 comments
Open

Nesprávna reprezentácia množiny datasetov LKODu MFSR #44

miroslavliska opened this issue Feb 27, 2024 · 0 comments

Comments

@miroslavliska
Copy link
Member

miroslavliska commented Feb 27, 2024

Niektore datasety su registrovane nespravne aj v zdrojovom opendatovom portali MFSR dostupnom na https://opendata.mfsr.sk/
Problemom je, ze to co sa poklada za dataset s distribuciami je v skutocnosti Datova seria s datasetmi. Zjednodusene povedane, kazdy subor, ktory plati pre iny cas (alebo lokalitu) je novy dataset, nie distribucia! Vsetky distribucie datasetu musia byt obsahovo rovnake, lisia sa len vo formate. Tu je to mozne vidiet na standarde DCAT-AP-SK2.0:
https://datova-kancelaria.github.io/dcat-ap-sk-2.0/

Aby som bol konrétny, napr. dataset
DLH A DLHOVÁ SLUŽBA MIEST A OBCÍ SR K ULTIMU ROKA
https://opendata.mfsr.sk/opendata/show/dlh-a-dlhova-sluzba-miest-a-obci-sr-k-ultimu-roka
uvádza že obsahuje 6 nasledovných distribúcií
image

Keďže ale je zjavné, že sa jedná o tie isté dáta v inom čase, uvedené distribúcie sú v skutočnosti datasety, zoskupené v tzv. dátovej sérii. Je to z dôvodu presnejšieho popisu cez metadáta. Takto môže každý dataset mať presne nastavené dátum platnosti od, dátum platnosti do, a tak ďalej.

Ako riešenie, ktoré nie je extra náročné odporúčam, aby ste v portáli opendata.mfsr.sk nastavili špeciálny príznak pre dataset, že je to dátová séria. Potom softvér, ktorý generuje LKOD pre takýto dataset vygeneruje:

  1. najskôr dataset predstavujúci dátovú sériu, ktorý nebude mať žiadne distribúcie. Jeho názov bude DLH A DLHOVÁ SLUŽBA MIEST A OBCÍ SR K ULTIMU ROKA
  2. s každej distribúcie takéhoto datasetu vygenerujete opať dataset, napr. Dlh-a-dlhova-sluzba-obce-2018 bude prvý dataset, Dlh-a-dlhova-sluzba-obce-2019 druhý dataset a podobne, pričom správne nastavíte časové pokrytie datasetu, tj. od 1.1.2018 do 31.12.2018, a podobne.
  3. Navyse este pridate udaj, ze tento dataset patri do datovej serie - (do datasetu) - ktorý bol vygenerovaný v prvkom kroku, pričom použiteje vlastnosť z DCAT-AP-SK2.0.1 a to dct:isPartOf
    https://datova-kancelaria.github.io/dcat-ap-sk-2.0/#dataset-je-s%C3%BA%C4%8Das%C5%A5ou
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant