● Obsahuje a zpřístupňuje datové sady publikovaných veřejných číselníků ve formátu CSV, JSON-
LD a pomocí SPARQL endpointu.
● Obsahuje a zpřístupňuje obsah (údaje) RPP jako datové sady ve formátech JSON-LD a
prostřednictvím SPARQL endpointu.
Lokální katalog RPP – nová komponenta RPP
● Lokální katalog otevřených dat RPP obsahuje katalogizační záznamy pro:
○
datové sady zastřešující verze číselníků,
○
datové sady s verzemi číselníků,
○
datové sady s údaji, které jsou evidovány a spravovány v RPP (obsah RPP).
● Zpřístupňuje katalogizační záznamy k jejich katalogizaci v NKOD.
Katalog uživatelů dat – nová komponenta RPP
● Eviduje využívané veřejné údaje v jednotlivých agendách (zajišťuje ohlašovatel agendy).
Notifikační hub – rozšíření RPP
● Nástroj zajišťující s pomocí katalogu uživatelů dat notifikační službu, která informuje subjekty
registrované v katalogu uživatelů dat VDF o změnách publikovaných veřejných údajů.
Systém pro zpřístupnění údajů RPP
● Připravuje obsah RPP a veřejné číselníky do podoby datových sad a dávkově je předává do
úložiště datových sad k publikaci.
NKOD (Národní katalog otevřených dat)
● Spravuje a zpřístupňuje katalogizační záznamy všech datových sad dostupných ve VDF.
● Pravidelně přebírá katalogizační záznamy ze všech lokálních katalogů VDF.
ISGOD – komponenta referenčního rozhraní
● Rozhraní VDF pro přístup k publikovaným údajům, které jsou uloženy distribuovaným
způsobem v úložištích jednotlivých agendových systémů, fyzické přístupy jsou zajišťovány
samotnými úložišti AIS a NKOD.
● ISGOD je pouze logickým pojmenováním a zastřešením celého distribuovaného rozhraní VDF.
3.3 Stručná charakteristika komponent VDF jednotlivých agend
(OVM)
Systém pro zpřístupnění údajů
● Aktivně v pravidelných intervalech definovaných správcem ISVS exportuje obsah veřejných
údajů do podoby datových sad a dávkově je předává do úložiště datových sad.
Systém pro čtení veřejných údajů z VDF
● Čte veřejné údaje z VDF jako otevřená data prostřednictvím ISGOD v podobě jednotlivých
distribucí datových sad ve formátech definovaných datovými specifikacemi.
Úložiště datových sad
● Úložiště datových sad slouží k ukládání publikovaného obsahu registrovaných veřejných údajů
vedených v daném publikujícím AIS (ISVS) v podobě distribucí datových sad.
● Provádí technickou kontrolu datových sad předaných “Systémem pro zpřístupnění údajů” a
transformuje vytvořené datové sady do všech dalších formátů (distribucí) definovaných
příslušnou datovou specifikací.
LKOD (Lokální katalog otevřených dat) ● Lokální katalog otevřených dat RPP obsahuje a spravuje katalogizační záznamy datových sad publikovaných veřejných údajů. ● Zpřístupňuje katalogizační záznamy k jejich katalogizaci v NKOD. ● Nabízí se dva možné způsoby jejich realizace: ○ LKOD pro každý konkrétní AIS (komponenta AIS) určený pro své publikované údaje, ○ LKOD konkrétní organizace VS, který katalogizuje všechny údaje publikované organizací.
- Komponenty VDF a jejich vzájemné vazby
Celkový kontext a vzájemné propojení všech komponent VDF je zachycen na následujícím obrázku.
Jedná se o statický pohled na strukturu komponent VD F a jejich vzájemné vazby. Dynamickému pohledu – popisu procesů VDF, je věnována následující kapitola 5. Vstupní body A, B, C reprezentují situace a interakce pracovníků VS spojené s přípravou publikace údajů do VDF a se čtením údajů z VDF.
4.1 Provázání k omponent VDF k zajištění evidence údajů v RPP a
NKOD
Propojení údajů evidovaných v RPP a v NKOD tvoří “organizační” základ fungování VDF.
RPP obsahuje informace o agendách VS a jejich údajích, NKOD obsahuje informace o datových sadách,
ve který ch jsou veřejné údaje publikovány. Výsledný komplex informací vytváří úplnou a celkovou
“Mapu údajů veřejné správy”.
Pro správnou činnost VDF, dosažení všech očekávaných výhod a přínosů z něho vyplývajících, a splnění
dílčího cíle 5.10 v Informační k oncepci ČR , je nutná řádná a úplná evidence všech předepsaných
metadat v RPP (metadata o existenci údajů a jejich veřejnosti) a NKOD (metadata popisující datové
sady, prostřednictvím kterých jsou veřejné údaje publikovány).
Problematiku správy a evidence informací v RPP řeší samostatná metodika “Metodika evidence údajů
v RPP”.
Následující vysvětlující text pod obrázkem slouží k osvětlení vzájemných vazeb mezi údaji v RPP a NKOD a ke zvýraznění jejich významu v kontextu VDF. K vysvětlení je v dalším textu využit popis několika typických situací.
(1) V RPP je u agendy 1 evidováno, že její údaje A i B jsou veřejné. To znamená, že jsou dostupné
jako otevřená data prostřednictvím VDF
○
Oba údaje jsou dostupné prostřednictvím stejné datové sady.
○
V RPP je v evidenci těchto údajů uvedeno IRI této datové sady v NKOD (datová sada se
jmenuje „Údaje A + B agendy 1“).
○
Datová sada „Údaje A + B agendy 1“ je publikovaná a dostupná ve dvou distribucích
(CSV, XML), katalogizační záznam obsahuje pro každou distribuci odkaz na její fyzické
umístění (její URL).
(2) V RPP je u agendy 1 evidováno, že údaj C je veřejný. Jedná se o stejnou situaci jako v příkladu
(1), pouze s tím rozdílem, že údaj C je publikován v jiné samostatné datové sadě “Údaj C
agendy 1”.
○
Datová sada „Údaj C agendy 1“ je publikovaná a dostupná ve dvou distribucích (CSV,
JSON), katalogizační záznam obsahuje pro každou distribuci odkaz na její fyzické
umístění (její URL).
(3) Agenda 1 vytváří a udržuje číselník, který je (musí být) registrován v RPP, je dostupný ve VDF
a je publikován jako otevřená data (datová sada “Číselník agendy 1”) podle otevřené formální
normy pro číselníky.
○
Příslušná datová sada s číselníkem je publikována ve dvou distribucích (CSV, JSON-LD)
a obsahuje pro každou distribuci odkaz na její fyzické umístění (její URL).
○
Distribuce číselníků jsou vždy uloženy v Úložišti veřejných číselníků (součást RPP).
(4) V RPP je u agendy 1 evidováno, že údaj D je veřejný a je publikován v samostatné datové sadě.
Jedná se o stejnou situaci jako v příkladu (1).
(5) U údaje D agendy 1 je také v RPP evidováno, že je kódován číselníkem (v příkladu je uvedena
situace s číselníkem, který agenda přímo vytváří, ale vše uvedené platí, pro jakýkoliv využívaný
číselník). Evidence údaje D v RPP proto také obsahuje IRI datové sady v NKOD, která obsahuje
publikovaný číselník.
(6) V RPP je u agendy 1 evidováno, že údaj E je neveřejný, a tudíž není možné jej zpřístupnit
prostřednictvím VDF. U údaje E je ale evidováno, že je kódován číselníkem (v tomto případě
se pro demonstraci jedná o číselník spravovaný mimo agendu 1). Evidence údaje v RPP
obsahuje IRI datové sady v NKOD, který obsahuje publikovaný číselník, stejně jako v příkladu
(5).
(7) Katalogizační záznamy publikovaných číselníků obsahují odkazy (identifikátory IRI) na datové
sady s číselníky uloženými v “Úložišti číselníků a evidence RPP”.
(8) Katalogizační záznam publikované datové sady “Údaje A + B agendy 1” obsahuje odkazy na
její distribuce uložené v úložišti AIS, který datovou sadu publikoval ve formátu otevřených dat.
(9) Katalogizační záznam publikované datové sady “Údaj D agendy 1” obsahuje odkaz na její
distribuce uložené v úložišti AIS, který datovou sadu publikoval ve formátu otevřených dat.
(10) Katalogizační záznam datové sady s publikovanou evidencí údajů RPP s odkazem na místo
uložení její distribuce v “Úložišti číselníků a evidence RPP”. Odkazovaná datová sada obsahuje
metadata o údajích vedených v agendách.
4.2 Provázání komponent VDF při čtení údajů z VDF
V této části jsou uvedeny nejdůležitější vazby mezi komponentami VDF, které jsou nezbytné při
ustavení a formování procesů pro čtení údajů z VDF. Uvedené vazby nerozlišují, zda se jedná o interakci
správce ISVS (manuální) s komponenta mi VDF, nebo zda se jedná o automatickou vazbu mezi
komponentami navzájem.
● Pro potřeby čtení údajů z VDF každý AIS obsahuje ústřední komponentu “Systém pro čtení
údajů z VDF”.
Schematické znázornění vazeb mezi komponentami při čtení datové sady
Význam jednotlivých vazeb mezi komponentami:
(A) Symbolické znázornění interakcí správce AIS při přípravě a nastavení systému pro čtení údajů
z VDF.
(11) Komunikace “Systému pro čtení údajů z VDF” s NKOD, například při vyhledávání datových sad
a získávání jejich metadat.
(12) Poskytované služby ISGOD (viz kapitola 6.3.2), zajišťující:
a. Čtení (stažení) datových sad s informacemi o vybrané agendě veřejné správy a jejich
údajích z “Úložiště číselníků a evidence RPP”.
b. Čtení (stažení) vybrané datové sady z „Úložiště AIS“.
c. Čtení (stažení) datové sady z “Úložiště číselníků a evidence RPP”.
(13) Poskytované služby propojeným datovým fondem PPDF (čtení dalších veřejných/neveřejných
údajů poskytovaných PPDF) - nesouvisí přímo s VDF, uvedeno pouze pro úplnost kontextu.
(14) Komunikace “Systému pro čtení údajů z VDF” s “Katalogem uživatelů dat” z důvodu registrace
agendy v “Katalogu uživatelů dat” k zasílání notifikací při změnách v používaných datových
sadách.
(15) Komunikace „Notifikačního hubu“ a “Systému pro čtení údajů z VDF” (zasílání notifikací o
změnách publikovaných veřejných údajů).
(16) Přístup k datovým sadám prostřednictvím veřejného internetu:
a. Čtení (stažení) datových sad z úložiště AIS.
b. Čtení (stažení) datových sad z “Úložiště číselníků a evidence RPP”.
4.3 Provázání komponent VDF při publikaci údajů do VDF
Uvedeny jsou nejdůležitější vazby mezi komponentami VDF, které jsou nezbytné při ustavení a
formování procesů pro publikaci veřejných údajů do VDF. Uvedené vazby nerozlišují, zda se jedná o
interakci správce ISVS (manuální) s komponentami VDF, nebo zda se jedná o automatickou vazbu mezi
komponentami navzájem.
Publikace údajů rozlišuje dva typy publikace:
● publikace veřejných údajů z datového k mene agendy (zde patří i publikace obsahu evidence
RPP),
● publikace veřejných číselníků.
Publikace veřejných údajů z datového kmene agendy.
● Poskytovatelem veřejných údajů do VDF je správce ISVS, ve kterém jsou vedeny registrované
veřejné údaje.
● Pro potřeby sdílení údajů ve VDF každý ISVS obsahuje “Systém pro zpřístupnění údajů
prostřednictvím VDF”.
● Pro ukládání publikovaného obsahu registrovaných veřejných údajů vedených v daném
publikujícím AIS (ISVS) je určeno “Úložiště”.
Publikace veřejných číselníků.
● Poskytovatelem veřejných číselníků do VDF jej buď ohlašovatel agendy nebo ČSÚ.
● Ohlašovatel agendy zavádí veřejný číselník jen v případě, že je agendový údaj kódován
číselníkem, který ještě není v RPP nikým zaveden.
● Pro potřeby sdílení veřejných číselníků ve VDF RPP (AIS působnostní) obsahuje “Systém pro
zpřístupnění údajů prostřednictvím VDF”, který zajišťuje publikaci obsahu veřejných číselníků
do VDF.
● Pro ukládání obsahu veřejných číselníků a také obsahu veřejných údajů vedených v RPP je
využito “Úložiště číselníků a evidence RPP”, ve kterém je také uložen obsah RPP publikovaný
jako otevřená data.
Schematické znázornění vazeb mezi komponentami při publikaci veřejných údajů.
Publikace veřejných údajů z datového kmene agend (B) Symbolické znázornění přípravy a nastavení systému pro zpřístupnění údajů správcem AIS k publikaci veřejných údajů z datového kmene agendy do VDF. (17) Dávkové předávání připravených datových sad “Systémem pro zpřístupnění údajů” v podobě datových souborů (distribucí) v jednom základním formátu do “Úložiště”. (18) Předávání metadat o všech vytvořených distribucích datových sad (včetně odpovídajících lokálních identifikátorů) “Systému pro zpřístupnění údajů”. (19) Předávání katalogizačních záznamů datových sad a jejich distribucí včetně referenčních identifikátorů do LKOD. (20) Předávání katalogizačních záznamů z LKOD do NKOD. (21) Komunikace “Systému pro zpřístupnění údajů” s “Notifikačním hubem” (v případě změny publikovaného veřejného údaje, nebo provedené aktualizace stávající datové sady). Publikace veřejných číselníků a obsahu veřejných údajů vedených v RPP (C) Symbolické znázornění přípravy a nastavení systému pro zpřístupnění údajů RPP a veřejných číselníků správcem AIS a poskytovatelem veřejných číselníků.
(22) Předávání veřejných číselníků a obsahu veřejných údajů vedených v RPP v podobě definované
otevřenou formální normou pro číselníky do “Úložiště číselníků a evidence RPP”.
(23) Předávání metadat “Systému pro zpřístupnění údajů RPP” všech vytvořených distribucí
datových sad:
○
s verzemi veřejných číselníků dle otevřené formální normy pro číselníky,
○
s obsahem veřejných údajů vedených v RPP.
(24) Předávání katalogizačních záznamů datových sad a všech vytvořených distribucí “Lokálnímu
katalogu RPP”.
(25) Předávání katalogizačních záznamů z “Lokálního katalogu RPP” do NKOD.
(26) Komunikace “Systému pro zpřístupnění údajů RPP” s “Notifikačním hubem” v případě změn:
○
publikovaného obsahu (údaje) RPP (proběhla aktualizace stávající datové sady),
○
publikovaného číselníku (proběhla aktualizace stávající verze číselníku).
- Popis hlavních procesů VDF
5.1. Publikace veřejných údajů
Systém pro zpřístupnění údajů transformuje a exportuje obsah veřejných údajů v podobě datových sad
do úložiště datových sad v takovém režimu, aby bylo zajištěno, že publikované veřejné údaje budou
pravidelně aktualizované, platné a právně závazné. Stanovení režimu publikace a jeho zajištění je plně
v zodpovědnosti publikujícího OVM (správce AIS), který musí při jeho stanovení vycházet z charakteru
a povahy publikovaných dat, četnosti jejich změn a aktualizací, a také způsobů jejich použití.
Z úložiště datových sad jsou veřejná data následně dostupná v podobě otevřených dat pro výkon
veřejné správy, pro vzájemné sdílení veřejných údajů mezi veřejnoprávními subjekty navz ájem a pro
sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou.
5.1.1 Pravidla pro evidenci veřejných údajů v RPP
Evidence údajů v RPP a s ní související způsoby práce s RPP plně řeší “Metodika evidence údajů v RPP”.
Dále v textu jsou uvedeny pouze vybrané informace, které jsou důležité pro dokreslení a pochopení kontextu zpřístupnění veřejných údajů prostřednictvím VDF.
K zajištění funkčnosti VDF je tedy nutné dodržet: ● Označení údajů vedených v agendách a registrech příznakem “veřejný údaj / neveřejný údaj”, s uvedením odkazu na konkrétní legislativu, ze které vyplývá jejich případná neveřejnost. ● Uvedení IRI datových sad v NKOD, jejichž prostřednictvím je veřejný údaj publikován. ● U agendových údajů, kt eré jsou kódované číselníky, jejich označení jako údaje “kódované konkrétní verzí veřejného číselníku”, včetně uvedení IRI datové sady v NKOD, která obsahuje publikovanou příslušnou verzi veřejného číselníku. ● Evidenci (ohlášení) využívání jednotlivých veře jných údajů prostřednictvím VDF konkrétními agendami. Ohlašovatel agendy v ohlášení agendy uvede výčet veřejných údajů, které budou využívány pro výkon agendy. 5.1.2 Pravidla pro údaje zpřístupněné veřejným datovým fondem ● Prostřednictvím VDF jsou zpřístupňovány veřejné údaje spravované jednotlivými OVM. ● Veřejné registrované údaje jsou zpřístupněny pro výkon veřejné správy v datových sadách prostřednictvím referenčního rozhraní (ISGOD) pro potřeby čtenářů údajů – OVM a SPUÚ. ● Veřejné registrované údaje jsou t aké zpřístupněny veřejnosti prostřednictvím otevřeného přístupu (tj. jako otevřená data dle § 3 odst. 11 InfoZ) v totožné podobě (tj. s totožnou strukturou a sémantikou). ● Interoperabilita zpřístupněných veřejných údajů je zajištěna standardizací jejich pub likace na základě Otevřených formálních norem (OFN) vydaných MV ČR a Datových specifikací vytvořených jednotlivými poskytovateli dat. ○ Datová specifikace popisuje strukturu a sémantiku konkrétní datové sady nebo datových sad. Obsahuje dokumentaci významu obsahu datové sady v podobě jejího konceptuálního modelu a jeho popisu a datová schémata určující datové struktury, ve kterých je obsah distribuován v různých formátech, např. JSON schéma a XSD schéma popisující JSON a XML distribuce obsahu datové sady.
○
Datovou specifikaci vydává poskytovatel konkrétních veřejných údajů a specifikuje
pomocí ní konkrétní podobu datové sady nebo datových sad, ve kterých veřejné údaje
zpřístupňuje.
○
OFN jsou vymezeny § 3 odst. 9 zákona č. 106/1999 Sb. o svobodném přístupu k
informacím a jsou dle § 4b odst. 1 závazné. OFN jsou Datové specifikace vydávané MV
ČR a jsou určeny pro použití všemi poskytovateli, kteří publikují data odpovídající dané
OFN. OFN jsou k dispozici v Repositáři OFN, který spravuje MV ČR. Navrhována jsou ve
spolupráci s více poskytovateli k zachycení úplného kontextu publikovaných dat.
○
Návrh Datové specifikace musí vycházet ze stávajících OFN dostupných v Repositáři
OFN.
● Pro daný typ publikovaných údajů musí existovat, nebo být připravena Datová specifikace,
případně OFN.
● Datové sady jsou popsané a katalogizované v podobě katalogizačních záznamů (metadat) v
NKOD.
● Fyzicky jsou datové sady dostupné v podobě distribucí, pro které platí:
○
různé distribuce stejné datové sady zpřístupňují její obsah v různých formátech (např.
CSV, XML nebo JSON) a prostřednictvím různých přístupových mechanismů,
○
každá distribuce je zaznamenána v katalogizačním záznamu datové sady v NKOD.
● Způsoby fyzického zpřístupnění obsahu datové sady:
○
datový soubor s kompletním obsahem datové sady určen ke stažení,
○
prostřednictvím API, které umožňuje přistupovat ke kompletním údajům o každé
jednotlivé entitě či konceptu, o němž jsou v datové sadě reprezentovány údaje,
prostřednictvím dereference identifikátoru entity či konceptu, který je stanoven
poskytovatelem údajů v podobě IRI (Internationalized Resource Identifier, viz
Otevřená formální norma pro propojená data)
○
prostřednictvím rozhraní API, které umožňuje dotazování nad obsahem datové sady s
pomocí dotazovacího jazyka SPARQL.
● Informace o veřejnosti registrovaného údaje je zachycena v jeho evidenci v RPP označením
údaje jako “veřejný údaj”.
● Zpřístupnění veřejného údaje prostřednictvím VDF je zachyceno v evidenci RPP:
○
uvedením IRI datové sady (nebo datových sad) v NKOD, v níž je obsah odpovídajícího
údaje zpřístupněn a publikován jako otevřená data,
○
v případě údaje kódovaného číselníkem obsahuje evidence veřejného údaje také IRI
datové sady v NKOD, v níž je číselník zpřístupněn a publikován jako otevřená data.
● Technická podoba dat určených pro sdílení prostřednictvím VDF je definována jejich datovou
specifikací nebo otevřenými formálními normami.
5.1.3 Popis procesu publikace veřejných údajů
Předpoklady:
● Řádně a úplně vedená evidence údajů v RPP ze strany ohlašovatelů agend a správců ISVS.
Postup:
● Poskytovatel údajů vybere údaje pro publikaci do VDF (viz. Příprava datových sad k publikaci).