C2V4.pdf

Type: Document | Status: ready

110

9.8.2 Metadata záznamu distribuce datové sady

● Podmínky užití (povinný atribut). o Vyplněné podmínky užití dle Stanovení podmínek užití otevřených dat. ● Odkaz na stažení datového zdroje (povinný atribut). o Odkaz na datový soubor ke stažení. o V případě, že distribuce datové sady je zpřístupněna datovou službou, odkaz na přístupový bod. ● Formát souboru ke stažení (povinný atribut). o Uvedený formát souboru ke stažení dle evropského číselníku typů souborů. ● Media type souboru ke stažení (povinný atribut). o Uvedený media typ popisující formát datového zdroje. ● Odkaz na strojově čitelné datové schéma datového zdroje (doporučený atribut). o Odkaz na strojově čitelné datové schéma popisující strukturu datového zdroje. ● Název distribuce (doporučený atribut). o Název datového souboru ke stažení nebo název API. ● Poskytovatel – název organizace, která datovou sadu publikuje. 9.8.3 Metadata záznamu datové série Častou chybou při návrhu katalogizačního záznamu datové sady je chybné dělení distribucí. Jednotlivé distribuce jedné datové sady se od sebe totiž mohou lišit pouze formátem, například JSON-LD a CSV, případně distribuce mohou popisovat různé datové služby, přes které je datová sada přístupná. Nelze však jako distribuce jedné datové sady mít soubory za různá časová období, jako třeba rozpočty obcí, nebo za různé obce, například turistické cíle v okresu. To jsou totiž různé datové sady.
Ty však mohou být sdružené do datových sérií. ● Datové série umožňují věcně související datové sady vidět na jednom místě.

111

● Pro datové série se použije část záznamu pro datovou sadu, ale datová série samotná nemá žádné distribuce. ● Skládá se pouze z dalších datových sad. ● V detailu datové sady lze potom vidět, že je součástí datové série. ● Pro využití funkcionality datových sérií je třeba používat Lokální katalog otevřených dat (LKOD)

9.9 Lokální katalog otevřených dat (LKOD) Pokud Poskytovatel provozuje lokální katalog otevřených dat s rozhraním dle Otevřené formální normy pro datové katalogy, může si katalog zaregistrovat v NKOD a tím zajistit publikaci záznamů z lokálního katalogu v NKOD. Pro registraci je nutný přístup k datové schránce Poskytovatele dat nebo možnost datovou schránkou poslat registrační soubor jako přílohu datové zprávy s předmětem „NKOD“. Správa záznamu lokálního katalogu v NKOD je prováděna zasíláním registračních dokumentů ve formě přílohy datové zprávy s předmětem „NKOD“ do datové schránky s identifikátorem m3hp53v „Národní katalog otevřených dat (NKOD)“ spravované Digit ální a informační agenturou. Tyto dokumenty lze získat pomocí formulářů dostupných v NKOD přes odkaz „Registrovat nový lokální katalog“ v patičce NKOD, či pomocí symbolu mazání na detailu datové sady v případě mazání lokálního katalogu. Vždy je nutné zasíl at pouze jednu přílohu jednou datovou zprávou, jinak bude zpráva ignorována. Dokumenty jsou ve formátu JSON -LD (s příponou .jsonld.txt kvůli omezení na typy příloh datových zpráv). 9.9.1 Implementace Lokálního katalogu otevřených dat Pro implementaci Lokálního k atalogu otevřených dat nejsou stanoveny žádné doporučené nebo přímo vyžadované sw řešení. Prakticky to znamená, že z pohledu garanta otevřených dat veřejné správy ČR jsou přípustná jakákoliv řešení poskytovatelů, za předpokladu, že budou mít implementované referenční rozhraní pro komunikaci s NKOD dle předepsané Otevřené formální normy „Rozhraní katalogů otevřených dat“.
Příklad implementace jednoduchého katalogu otevřených dat (LKOD), který plně vyhovuje požadavkům NKOD, lze nalézt prostřednictvím odkazu Referenční implementace Lokálního katalogu otevřených dat (LKOD).

112

9.9.2 Registrace lokálního katalogu Registrace lokálního katalogu je provedena zasláním registračního dokumentu, který lze získat vyplněním formuláře po kliknutí na odkaz „Registrovat nový lokální katalog“ v patičce NKOD. Postup registrace lokálního katalogu v NKOD je následující: ● Otevření registračního formuláře. ● Zadání všech požadovaných údajů ve formuláři. o Název lokálního katalogu otevřených dat (povinný atribut).. ▪ Tento název rozlišuje mezi jednotlivými katalogy otevřených dat dané instituce. Pokud má jeden, může to být třeba 'Katalog otevřených dat XXX'. o Jméno a email správce katalogu (povinné atributy). ▪ Jméno a email správce lokálního katalogu otevřených dat, se kterým lze komunikovat o případných problémech s katalogem (např. problém s rozhraním API, jeho přístupností, apod). o Typ API lokálního katalogu (povinný atribut). ▪ Označuje typ API (rozhraní) registrovaného katalogu. Podrobnosti viz Otevřená formální norma Rozhraní katalogů otevřených dat. o URL API lokálního katalogu (povinný atribut). ▪ URL API katalogu dle Otevřené formální normy Rozhraní katalogů otevřených dat. o Domácí stránka katalogu (volitelný atribut). ▪ URL domácí stránky lokálního katalogu, pokud existuje. Lokální katalog může obsahovat větší množství informací a souvislostí, než se přenese do Národního katalogu otevřených dat. Z tohoto důvodu by bylo vhodné, aby se uživatelé po nalezení datové sady poskytovatele v NKOD mohli podívat i do jeho katalogu. ● Posledním krokem po vyplnění všech údajů ve formuláři je stažení výsledného vyplněného dokumentu. ● Zbývá jeho odeslání prostřednictvím datové schránky na adresu datové schránky Národního katalogu otevřených dat (NKOD) s ID m3hp53v. Dokument je možné odeslat například přes spisovou službu poskytovatele jako přílohu datové zprávy s uvedeným předmětem zprávy „NKOD“. 9.9.3 Zrušení registrace lokálního katalogu Registraci lokálního katalogu otevřených dat je možno zrušit zasláním dokumentu, který lze získat pomocí formuláře pro smazání lokálního katalogu. Postup zrušení je následující: ● V Seznamu lokálních katalogů v NKOD je nutné nalézt rušený lokální katalog a v jeho detailu kliknout na symbol smazání. ● Následně je nutné stáhnout dokument s vygenerovaným zrušením katalogu a ten poslat datovou schránkou (například přes spisovou službu poskytovatele) jako přílohu datové zprávy s předmětem „NKOD“ a adresovat ji na datovou schránku Národní katalog otevřených dat (NKOD) s ID m3hp53v. 9.9.4 Otevřená formální norma "Rozhraní katalogů otevřených dat: DCAT-AP-CZ" Specifikace rozhraní lokálních katalogů otevřených dat (LKOD) pro jejich harvestování Národním katalogem otevřených dat (NKOD). Stejná specifikace platí i pro datový model NKOD a data poskytovaná z NKOD v podobě souborů ke stažení či SPARQL endpointu.

113

9.10 Stručný popis VDF 9.10.1 Základní charakteristiky VDF Veřejný datový fond (VDF) je definován v Informační koncepci ČR (IKČR) jako dílčí cíl 5.10 , je součástí eGovernmentu VS ČR a jeho poslání a role je definována následujícím způsobem: “Veřejný datový fond tvořený publikovanými veřejnými údaji veřejné správy je základní metodou pro sdílení veřejných informací mezi veřejnoprávními subjekty navzájem i pro sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou v ČR. Veřejný datový fond se od pouhé publikace automatizovaně čitelných otevřených dat posune též k publikaci právně závazných, platných a pravidelně aktualizovan ých datových sad s jasně definovanou zodpovědností OVS za takové sady.” Obecným výchozím principem VDF je princip P13 eGovernmentu “Otevřená data jako standard” (Open Data by Default): “Veřejné údaje evidované orgány veřejné správy ve spravovaných ISVS musí být zveřejňovány jako otevřená data. Pro neveřejné údaje musí být jako otevřená data zveřejňována jejich anonymizovaná podoba, souhrn nebo statistika. V případě, že orgány veřejné správy sdílejí veřejné údaje (včetně anonymizované podoby neveřejných údajů, souhrnů nebo statistik) musí je sdílet jako otevřená data.“ Příprava distribucí datových sad k publikaci do VDF probíhá stejným způsobem jako v případě přípravy distribucí publikovaných mimo VDF (běžná publikace otevřených dat). Zásadním rozdílem je způsob publikace, místa ukládaní publikovaných distribucí a důraz na následnou rutinní automatizaci publikace, což vyžaduje doplnění agendových informačních systémů (AIS) o nové funkční oblasti a moduly. Veřejný datový fond (VDF) je tvořen: ● všemi veřejnými údaji veřejné správy,
● nezbytnou softwarovou podporou zajišťující jejich sdílení a garantovanou dostupnost,
● stanovenými pravidly a definovanými standardy pro zajištění interoperability sdílených údajů, ● poskytovatelem dat definovanými a implementovanými procesy pro zajištění jejich právní závaznosti, platnosti, aktuálnosti a jasně definovanými zodpovědnostmi za sdílené údaje. 9.10.2 Základní logické komponenty VDF AIS a jejich význam

Systém pro zpřístupnění údajů ● Aktivně v pravidelných intervalech definovaných správcem ISVS exportuje obsah veřejných údajů do podoby datových sad a dávkově je předává do úložiště datových sad. ● Jedná se o logickou součást každého AIS, prakticky se může jednat o samostatný systém nebo to může být modul v rámci existujícího systému. Úložiště datových sad

114

● Obsahuje publikovaný obsah registrovaných veřejných údajů vedených v daném publikujícím AIS (ISVS) v podobě distribucí datových sad. ● Provádí technickou kontrolu datových sad předaných “Systémem pro zpřístupnění údajů” a transformuje vytvořené datové sady do všech dalších formátů (distribucí) definovaných příslušnou datovou specifikací. LKOD (Lokální katalog otevřených dat) ● Lokální katalog otevřených dat obsahuje a spravuje katalogizační záznamy datových sad publikovaných veřejných údajů. ● Zpřístupňuje katalogizační záznamy k jejich katalogizaci do NKOD. ● Nabízí se dva možné způsoby jejich realizace: o LKOD pro každý konkrétní AIS (komponenta AIS) určený pro své publikované údaje, o LKOD konkrétní organizace VS, který katalogizuje všechny údaje publikované organizací. V případě publikace distribucí číselníků se jedná o podobné publikační mechanismy a rovněž AIS Působnostní (RPP) je k tomuto účely již aktuálně doplněn o potřebné moduly.
9.10.3 Společné logické komponenty VDF související s AIS Působnostním (RPP)

Úložiště číselníků a evidence RPP – nová komponenta RPP ● Obsahuje a zpřístupňuje datové sady publikovaných veřejných číselníků ve formátu CSV, JSON-LD a pomocí SPARQL endpointu. ● Obsahuje a zpřístupňuje obsah (údaje) RPP jako datové sady ve formátech JSON-LD a prostřednictvím SPARQL endpointu. Lokální katalog RPP – nová komponenta RPP ● Lokální katalog otevřených dat RPP obsahuje katalogizační záznamy pro: o datové sady zastřešující verze číselníků, o datové sady s verzemi číselníků, o datové sady s údaji, které jsou evidovány a spravovány v RPP (obsah RPP). ● Zpřístupňuje katalogizační záznamy k jejich katalogizaci v NKOD. Katalog uživatelů dat – nová komponenta RPP ● Eviduje využívané veřejné údaje v jednotlivých agendách (zajišťuje ohlašovatel agendy). Notifikační hub – rozšíření RPP

115

● Nástroj zajišťující s pomocí katalogu u živatelů dat notifikační službu, která informuje subjekty registrované v katalogu uživatelů dat VDF o změnách publikovaných veřejných údajů. Systém pro zpřístupnění údajů RPP ● Připravuje obsah RPP a veřejné číselníky do podoby datových sad a dávkově je předává do úložiště datových sad k publikaci. Nejsou uvedeny logické komponenty zabezpečující čtení publikovaných údajů pro výkon agendy. Kompletní problematika je detailně popsána a vysvětlena v „Metodice poskytování dat ve veřejném datovém fondu“. 9.10.4 Význam metodiky pro publikaci do VDF Podstatou publikace do VDF je vytvoření podmínek a nastavení všech modulů AIS pro zajištění automatického provádění všech nutných operací.
Obsah činností nutných k nastavení AIS a jejich nových komponent je v podstatě identický s činnostmi prováděnými v průběhu publikace jakýkoliv otevřených dat, neboť i pro datové sady publikované do VDF (registrované veřejné údaje) platí, že jsou to současně běžná otevřená data přístupná veřejnosti. Je tedy nutné posoudit jejich zpřístupnění z pohledu potenciálních přínosů a rizik, ošetřit podmínkami užití, vybrat vhodné datové modely, způsoby publikace a připravit katalogizační záznamy odpovídající požadovaným standardům.
Oblasti činností popisovaných v metodice a jejich využití při publikaci do VDF: ● Identifikace dat o Návrh témat otevřených dat – omezené využití návrhů v metodice, neboť publikace dat do VDF je především dána legislativními dokumenty a informační strategií veřejné správy ČR. Ty ukládají povinnost publikace registrovaných veřejných údajů v podobě otevřených dat. o Ošetření navržených datových sad – nutné plně respektovat doporučení uvedené v metodice (publikovaná data do VDF jsou současně i otevřená data publikované pro veřejné použití. o Správa katalogu témat otevřených dat – doporučeno, ale rozhodnutí závisí na každém poskytovateli, soulad s metodikou. o Analýza agendy a odvození údajů – povinné a vždy jako první krok přípravy datových sad k publikaci dle „Metodiky tvorby a údržby konceptuálních datových modelů agend“. ● Příprava datové sady o Příprava konceptuálního modelu datové sady – soulad s metodikou. o Výběr způsobů publikace – povinný způsob „publikace se sémantikou dat“, soulad s metodikou a „Metodikou poskytování dat ve veřejném datovém fondu“. o Návrh datových modelů a datových schémat – soulad s metodikou. o Příprava katalogizačního záznamu – soulad s metodikou.
o Publikace a katalogizace datové sady – tato oblast je nejvíce specifická, neboť velkou roli v ní sehrávají nové komponenty AIS, příprava prvotní publikace bývá náročnější, a to i z toho důvodu, že je nutné nastavit vzájemnou komunikaci více komponent VDF. Publikace je složitější i z toho důvodu, že číselníky se publikují do úložiště číselníků v RPP a publikace datových sad s údaji kódovanými číselníky (její nastavení pro automatizaci publikace) se tak stává pracnější. Po ukončení publikace a katalogizace publikované datové sady v NKDO je nutné ještě doplnit u každého registrovaného publikovaného údaje v evidenci v RPP odkaz na datovou sadu v NKOD, ve které každý jednotlivý údaj se nachází. Tato oblast č inností je upravena „ Metodikou poskytování dat ve veřejném datovém fondu“. Shrnutí základních specifik publikace do VDF: ● nutnost úprav stávajících AIS a doplnění potřených nových komponent (nezbytná podmínka),

116

● všechny publikované údaje musí být evidovány v RPP, ● evidence musí být provedena dle metodiky a mělo by jí předcházet: o vytvoření sémantického slovníku pojmů agendy,
o odvození údajů subjektů a objektů práva, o následně jejich evidence v RPP, ● konceptuální modely by měly být vytvořeny: o na základě pojmů slovníku veřejné správy (zajištění sémantiky a sémantické interoperability),
o nebo z něho přímo extrahovány, ● měla by převládat preference grafových modelů a publikace dat v úplném kontextu (nejlépe propojená data), ● zdrojem dat je vždy datový kmen příslušné agendy, ● datové sady (distribuce) jsou vždy uloženy v úložišti příslušného AIS, v případě číselníků v „úložišti číselníků a evidence RPP“. 9.10.5 Publikace distribucí datové sady do datového úložiště agendy ● Systém pro zpřístupnění údajů připraví obsah datové sady v podobě datového souboru. Připravený datový soubor musí dodržovat připravenou Datovou specifikaci nebo příslušnou OFN. ● Systém pro zpřístupnění údajů zašle připravený obsah datové sady do úložiště datových sad. ● Úložiště datových sad provede technickou kontrolu zaslaného obsahu: o Kontrola správného formátování (např. JSON, CSV nebo XML formátování). o Kontrola validity datové struktury vůči datovým schématům definovaných Datovou specifikací nebo OFN. o V případě špatné syntaxe zašle zpět systému pro zpřístupnění údajů chybové hlášení a skončí. ● Úložiště datových sad zpřístupní všechny vytvořené distribuce jako datové soubory dostupné ke stažení prostřednictvím ISGOD a z veřejného internetu prostřednictvím URL pro stažení datového souboru (URL pro stažení datového souboru je stejné pro přístup prostřednictvím ISGOD i veřejného internetu). 9.10.6 Katalogizace v LKOD agendy Katalogizace v LKOD je principiálně shodná s katalogizací mimo VDF (katalogizace běžných otevřených dat), specifika jsou dána pouze konkrétním řešením v AIS, nebo LKOD publikující organizace. V rutinním režimu publikace systém pro zpřístupnění údajů konkrétního AIS vytváří kompletní katalogizační záznam o datové sadě, včetně doplnění metadat o distribucích vytvořených úložištěm datových sad a vše katalogizuje v lokálním katalogu automaticky. 9.10.7 Informování notifikačního hubu o změně publikovaného veřejného údaje
Informování notifikačního hubu probíhá automaticky, systém pro zpřístupnění údajů mu informaci o změně publikovaného veřejného údaje (obsahu datové sady).
Notifikační hub je nástroj zajišťující s pomocí katalogu uživatelů dat notifikační službu, která informuje subjekty registrované v katalogu uživatelů dat z VDF o změnách veřejných údajů, vedoucích následně i ke změnám v souvisejících publikovaných datových sadách. Notifikace probíhá automaticky při ohlášení změny veřejného údaje v publikovaných datových sadách ze strany poskytujícího ISVS.