C2V6.pdf

Type: Document | Status: ready

● Obsahuje a zpřístupňuje datové sady publikovaných veřejných číselníků ve formátu CSV, JSON- LD a pomocí SPARQL endpointu. ● Obsahuje a zpřístupňuje obsah (údaje) RPP jako datové sady ve formátech JSON-LD a prostřednictvím SPARQL endpointu. Lokální katalog RPP – nová komponenta RPP ● Lokální katalog otevřených dat RPP obsahuje katalogizační záznamy pro: ○ datové sady zastřešující verze číselníků, ○ datové sady s verzemi číselníků, ○ datové sady s údaji, které jsou evidovány a spravovány v RPP (obsah RPP). ● Zpřístupňuje katalogizační záznamy k jejich katalogizaci v NKOD. Katalog uživatelů dat – nová komponenta RPP ● Eviduje využívané veřejné údaje v jednotlivých agendách (zajišťuje ohlašovatel agendy). Notifikační hub – rozšíření RPP ● Nástroj zajišťující s pomocí katalogu uživatelů dat notifikační službu, která informuje subjekty registrované v katalogu uživatelů dat VDF o změnách publikovaných veřejných údajů. Systém pro zpřístupnění údajů RPP ● Připravuje obsah RPP a veřejné číselníky do podoby datových sad a dávkově je předává do úložiště datových sad k publikaci. NKOD (Národní katalog otevřených dat) ● Spravuje a zpřístupňuje katalogizační záznamy všech datových sad dostupných ve VDF. ● Pravidelně přebírá katalogizační záznamy ze všech lokálních katalogů VDF. ISGOD – komponenta referenčního rozhraní ● Rozhraní VDF pro přístup k publikovaným údajům, které jsou uloženy distribuovaným způsobem v úložištích jednotlivých agendových systémů, fyzické přístupy jsou zajišťovány samotnými úložišti AIS a NKOD.
● ISGOD je pouze logickým pojmenováním a zastřešením celého distribuovaného rozhraní VDF. 3.3 Stručná charakteristika komponent VDF jednotlivých agend (OVM) Systém pro zpřístupnění údajů ● Aktivně v pravidelných intervalech definovaných správcem ISVS exportuje obsah veřejných údajů do podoby datových sad a dávkově je předává do úložiště datových sad. Systém pro čtení veřejných údajů z VDF ● Čte veřejné údaje z VDF jako otevřená data prostřednictvím ISGOD v podobě jednotlivých distribucí datových sad ve formátech definovaných datovými specifikacemi. Úložiště datových sad ● Úložiště datových sad slouží k ukládání publikovaného obsahu registrovaných veřejných údajů vedených v daném publikujícím AIS (ISVS) v podobě distribucí datových sad. ● Provádí technickou kontrolu datových sad předaných “Systémem pro zpřístupnění údajů” a transformuje vytvořené datové sady do všech dalších formátů (distribucí) definovaných příslušnou datovou specifikací.

LKOD (Lokální katalog otevřených dat) ● Lokální katalog otevřených dat RPP obsahuje a spravuje katalogizační záznamy datových sad publikovaných veřejných údajů. ● Zpřístupňuje katalogizační záznamy k jejich katalogizaci v NKOD. ● Nabízí se dva možné způsoby jejich realizace: ○ LKOD pro každý konkrétní AIS (komponenta AIS) určený pro své publikované údaje, ○ LKOD konkrétní organizace VS, který katalogizuje všechny údaje publikované organizací.

  1. Komponenty VDF a jejich vzájemné vazby Celkový kontext a vzájemné propojení všech komponent VDF je zachycen na následujícím obrázku.
    Jedná se o statický pohled na strukturu komponent VD F a jejich vzájemné vazby. Dynamickému pohledu – popisu procesů VDF, je věnována následující kapitola 5. Vstupní body A, B, C reprezentují situace a interakce pracovníků VS spojené s přípravou publikace údajů do VDF a se čtením údajů z VDF.

4.1 Provázání k omponent VDF k zajištění evidence údajů v RPP a NKOD Propojení údajů evidovaných v RPP a v NKOD tvoří “organizační” základ fungování VDF.
RPP obsahuje informace o agendách VS a jejich údajích, NKOD obsahuje informace o datových sadách, ve který ch jsou veřejné údaje publikovány. Výsledný komplex informací vytváří úplnou a celkovou “Mapu údajů veřejné správy”. Pro správnou činnost VDF, dosažení všech očekávaných výhod a přínosů z něho vyplývajících, a splnění dílčího cíle 5.10 v Informační k oncepci ČR , je nutná řádná a úplná evidence všech předepsaných metadat v RPP (metadata o existenci údajů a jejich veřejnosti) a NKOD (metadata popisující datové sady, prostřednictvím kterých jsou veřejné údaje publikovány). Problematiku správy a evidence informací v RPP řeší samostatná metodika “Metodika evidence údajů v RPP”.

Následující vysvětlující text pod obrázkem slouží k osvětlení vzájemných vazeb mezi údaji v RPP a NKOD a ke zvýraznění jejich významu v kontextu VDF. K vysvětlení je v dalším textu využit popis několika typických situací.

(1) V RPP je u agendy 1 evidováno, že její údaje A i B jsou veřejné. To znamená, že jsou dostupné jako otevřená data prostřednictvím VDF ○ Oba údaje jsou dostupné prostřednictvím stejné datové sady. ○ V RPP je v evidenci těchto údajů uvedeno IRI této datové sady v NKOD (datová sada se jmenuje „Údaje A + B agendy 1“). ○ Datová sada „Údaje A + B agendy 1“ je publikovaná a dostupná ve dvou distribucích (CSV, XML), katalogizační záznam obsahuje pro každou distribuci odkaz na její fyzické umístění (její URL). (2) V RPP je u agendy 1 evidováno, že údaj C je veřejný. Jedná se o stejnou situaci jako v příkladu (1), pouze s tím rozdílem, že údaj C je publikován v jiné samostatné datové sadě “Údaj C agendy 1”. ○ Datová sada „Údaj C agendy 1“ je publikovaná a dostupná ve dvou distribucích (CSV, JSON), katalogizační záznam obsahuje pro každou distribuci odkaz na její fyzické umístění (její URL). (3) Agenda 1 vytváří a udržuje číselník, který je (musí být) registrován v RPP, je dostupný ve VDF a je publikován jako otevřená data (datová sada “Číselník agendy 1”) podle otevřené formální normy pro číselníky.
○ Příslušná datová sada s číselníkem je publikována ve dvou distribucích (CSV, JSON-LD) a obsahuje pro každou distribuci odkaz na její fyzické umístění (její URL). ○ Distribuce číselníků jsou vždy uloženy v Úložišti veřejných číselníků (součást RPP).
(4) V RPP je u agendy 1 evidováno, že údaj D je veřejný a je publikován v samostatné datové sadě. Jedná se o stejnou situaci jako v příkladu (1). (5) U údaje D agendy 1 je také v RPP evidováno, že je kódován číselníkem (v příkladu je uvedena situace s číselníkem, který agenda přímo vytváří, ale vše uvedené platí, pro jakýkoliv využívaný číselník). Evidence údaje D v RPP proto také obsahuje IRI datové sady v NKOD, která obsahuje publikovaný číselník.

(6) V RPP je u agendy 1 evidováno, že údaj E je neveřejný, a tudíž není možné jej zpřístupnit prostřednictvím VDF. U údaje E je ale evidováno, že je kódován číselníkem (v tomto případě se pro demonstraci jedná o číselník spravovaný mimo agendu 1). Evidence údaje v RPP obsahuje IRI datové sady v NKOD, který obsahuje publikovaný číselník, stejně jako v příkladu (5). (7) Katalogizační záznamy publikovaných číselníků obsahují odkazy (identifikátory IRI) na datové sady s číselníky uloženými v “Úložišti číselníků a evidence RPP”. (8) Katalogizační záznam publikované datové sady “Údaje A + B agendy 1” obsahuje odkazy na její distribuce uložené v úložišti AIS, který datovou sadu publikoval ve formátu otevřených dat.
(9) Katalogizační záznam publikované datové sady “Údaj D agendy 1” obsahuje odkaz na její distribuce uložené v úložišti AIS, který datovou sadu publikoval ve formátu otevřených dat.
(10) Katalogizační záznam datové sady s publikovanou evidencí údajů RPP s odkazem na místo uložení její distribuce v “Úložišti číselníků a evidence RPP”. Odkazovaná datová sada obsahuje metadata o údajích vedených v agendách. 4.2 Provázání komponent VDF při čtení údajů z VDF V této části jsou uvedeny nejdůležitější vazby mezi komponentami VDF, které jsou nezbytné při ustavení a formování procesů pro čtení údajů z VDF. Uvedené vazby nerozlišují, zda se jedná o interakci správce ISVS (manuální) s komponenta mi VDF, nebo zda se jedná o automatickou vazbu mezi komponentami navzájem. ● Pro potřeby čtení údajů z VDF každý AIS obsahuje ústřední komponentu “Systém pro čtení údajů z VDF”. Schematické znázornění vazeb mezi komponentami při čtení datové sady

Význam jednotlivých vazeb mezi komponentami: (A) Symbolické znázornění interakcí správce AIS při přípravě a nastavení systému pro čtení údajů z VDF. (11) Komunikace “Systému pro čtení údajů z VDF” s NKOD, například při vyhledávání datových sad a získávání jejich metadat. (12) Poskytované služby ISGOD (viz kapitola 6.3.2), zajišťující: a. Čtení (stažení) datových sad s informacemi o vybrané agendě veřejné správy a jejich údajích z “Úložiště číselníků a evidence RPP”. b. Čtení (stažení) vybrané datové sady z „Úložiště AIS“. c. Čtení (stažení) datové sady z “Úložiště číselníků a evidence RPP”.
(13) Poskytované služby propojeným datovým fondem PPDF (čtení dalších veřejných/neveřejných údajů poskytovaných PPDF) - nesouvisí přímo s VDF, uvedeno pouze pro úplnost kontextu. (14) Komunikace “Systému pro čtení údajů z VDF” s “Katalogem uživatelů dat” z důvodu registrace agendy v “Katalogu uživatelů dat” k zasílání notifikací při změnách v používaných datových sadách.
(15) Komunikace „Notifikačního hubu“ a “Systému pro čtení údajů z VDF” (zasílání notifikací o změnách publikovaných veřejných údajů). (16) Přístup k datovým sadám prostřednictvím veřejného internetu: a. Čtení (stažení) datových sad z úložiště AIS. b. Čtení (stažení) datových sad z “Úložiště číselníků a evidence RPP”. 4.3 Provázání komponent VDF při publikaci údajů do VDF Uvedeny jsou nejdůležitější vazby mezi komponentami VDF, které jsou nezbytné při ustavení a formování procesů pro publikaci veřejných údajů do VDF. Uvedené vazby nerozlišují, zda se jedná o interakci správce ISVS (manuální) s komponentami VDF, nebo zda se jedná o automatickou vazbu mezi komponentami navzájem. Publikace údajů rozlišuje dva typy publikace: ● publikace veřejných údajů z datového k mene agendy (zde patří i publikace obsahu evidence RPP), ● publikace veřejných číselníků. Publikace veřejných údajů z datového kmene agendy. ● Poskytovatelem veřejných údajů do VDF je správce ISVS, ve kterém jsou vedeny registrované veřejné údaje. ● Pro potřeby sdílení údajů ve VDF každý ISVS obsahuje “Systém pro zpřístupnění údajů prostřednictvím VDF”. ● Pro ukládání publikovaného obsahu registrovaných veřejných údajů vedených v daném publikujícím AIS (ISVS) je určeno “Úložiště”. Publikace veřejných číselníků. ● Poskytovatelem veřejných číselníků do VDF jej buď ohlašovatel agendy nebo ČSÚ. ● Ohlašovatel agendy zavádí veřejný číselník jen v případě, že je agendový údaj kódován číselníkem, který ještě není v RPP nikým zaveden.

● Pro potřeby sdílení veřejných číselníků ve VDF RPP (AIS působnostní) obsahuje “Systém pro zpřístupnění údajů prostřednictvím VDF”, který zajišťuje publikaci obsahu veřejných číselníků do VDF.
● Pro ukládání obsahu veřejných číselníků a také obsahu veřejných údajů vedených v RPP je využito “Úložiště číselníků a evidence RPP”, ve kterém je také uložen obsah RPP publikovaný jako otevřená data.
Schematické znázornění vazeb mezi komponentami při publikaci veřejných údajů.

Publikace veřejných údajů z datového kmene agend (B) Symbolické znázornění přípravy a nastavení systému pro zpřístupnění údajů správcem AIS k publikaci veřejných údajů z datového kmene agendy do VDF. (17) Dávkové předávání připravených datových sad “Systémem pro zpřístupnění údajů” v podobě datových souborů (distribucí) v jednom základním formátu do “Úložiště”. (18) Předávání metadat o všech vytvořených distribucích datových sad (včetně odpovídajících lokálních identifikátorů) “Systému pro zpřístupnění údajů”. (19) Předávání katalogizačních záznamů datových sad a jejich distribucí včetně referenčních identifikátorů do LKOD. (20) Předávání katalogizačních záznamů z LKOD do NKOD. (21) Komunikace “Systému pro zpřístupnění údajů” s “Notifikačním hubem” (v případě změny publikovaného veřejného údaje, nebo provedené aktualizace stávající datové sady). Publikace veřejných číselníků a obsahu veřejných údajů vedených v RPP (C) Symbolické znázornění přípravy a nastavení systému pro zpřístupnění údajů RPP a veřejných číselníků správcem AIS a poskytovatelem veřejných číselníků.

(22) Předávání veřejných číselníků a obsahu veřejných údajů vedených v RPP v podobě definované otevřenou formální normou pro číselníky do “Úložiště číselníků a evidence RPP”. (23) Předávání metadat “Systému pro zpřístupnění údajů RPP” všech vytvořených distribucí datových sad: ○ s verzemi veřejných číselníků dle otevřené formální normy pro číselníky, ○ s obsahem veřejných údajů vedených v RPP.
(24) Předávání katalogizačních záznamů datových sad a všech vytvořených distribucí “Lokálnímu katalogu RPP”. (25) Předávání katalogizačních záznamů z “Lokálního katalogu RPP” do NKOD. (26) Komunikace “Systému pro zpřístupnění údajů RPP” s “Notifikačním hubem” v případě změn: ○ publikovaného obsahu (údaje) RPP (proběhla aktualizace stávající datové sady), ○ publikovaného číselníku (proběhla aktualizace stávající verze číselníku).

  1. Popis hlavních procesů VDF 5.1. Publikace veřejných údajů Systém pro zpřístupnění údajů transformuje a exportuje obsah veřejných údajů v podobě datových sad do úložiště datových sad v takovém režimu, aby bylo zajištěno, že publikované veřejné údaje budou pravidelně aktualizované, platné a právně závazné. Stanovení režimu publikace a jeho zajištění je plně v zodpovědnosti publikujícího OVM (správce AIS), který musí při jeho stanovení vycházet z charakteru a povahy publikovaných dat, četnosti jejich změn a aktualizací, a také způsobů jejich použití. Z úložiště datových sad jsou veřejná data následně dostupná v podobě otevřených dat pro výkon veřejné správy, pro vzájemné sdílení veřejných údajů mezi veřejnoprávními subjekty navz ájem a pro sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou. 5.1.1 Pravidla pro evidenci veřejných údajů v RPP Evidence údajů v RPP a s ní související způsoby práce s RPP plně řeší “Metodika evidence údajů v RPP”.
    Dále v textu jsou uvedeny pouze vybrané informace, které jsou důležité pro dokreslení a pochopení kontextu zpřístupnění veřejných údajů prostřednictvím VDF.
    K zajištění funkčnosti VDF je tedy nutné dodržet: ● Označení údajů vedených v agendách a registrech příznakem “veřejný údaj / neveřejný údaj”, s uvedením odkazu na konkrétní legislativu, ze které vyplývá jejich případná neveřejnost. ● Uvedení IRI datových sad v NKOD, jejichž prostřednictvím je veřejný údaj publikován. ● U agendových údajů, kt eré jsou kódované číselníky, jejich označení jako údaje “kódované konkrétní verzí veřejného číselníku”, včetně uvedení IRI datové sady v NKOD, která obsahuje publikovanou příslušnou verzi veřejného číselníku. ● Evidenci (ohlášení) využívání jednotlivých veře jných údajů prostřednictvím VDF konkrétními agendami. Ohlašovatel agendy v ohlášení agendy uvede výčet veřejných údajů, které budou využívány pro výkon agendy. 5.1.2 Pravidla pro údaje zpřístupněné veřejným datovým fondem ● Prostřednictvím VDF jsou zpřístupňovány veřejné údaje spravované jednotlivými OVM. ● Veřejné registrované údaje jsou zpřístupněny pro výkon veřejné správy v datových sadách prostřednictvím referenčního rozhraní (ISGOD) pro potřeby čtenářů údajů – OVM a SPUÚ. ● Veřejné registrované údaje jsou t aké zpřístupněny veřejnosti prostřednictvím otevřeného přístupu (tj. jako otevřená data dle § 3 odst. 11 InfoZ) v totožné podobě (tj. s totožnou strukturou a sémantikou). ● Interoperabilita zpřístupněných veřejných údajů je zajištěna standardizací jejich pub likace na základě Otevřených formálních norem (OFN) vydaných MV ČR a Datových specifikací vytvořených jednotlivými poskytovateli dat. ○ Datová specifikace popisuje strukturu a sémantiku konkrétní datové sady nebo datových sad. Obsahuje dokumentaci významu obsahu datové sady v podobě jejího konceptuálního modelu a jeho popisu a datová schémata určující datové struktury, ve kterých je obsah distribuován v různých formátech, např. JSON schéma a XSD schéma popisující JSON a XML distribuce obsahu datové sady.

○ Datovou specifikaci vydává poskytovatel konkrétních veřejných údajů a specifikuje pomocí ní konkrétní podobu datové sady nebo datových sad, ve kterých veřejné údaje zpřístupňuje. ○ OFN jsou vymezeny § 3 odst. 9 zákona č. 106/1999 Sb. o svobodném přístupu k informacím a jsou dle § 4b odst. 1 závazné. OFN jsou Datové specifikace vydávané MV ČR a jsou určeny pro použití všemi poskytovateli, kteří publikují data odpovídající dané OFN. OFN jsou k dispozici v Repositáři OFN, který spravuje MV ČR. Navrhována jsou ve spolupráci s více poskytovateli k zachycení úplného kontextu publikovaných dat. ○ Návrh Datové specifikace musí vycházet ze stávajících OFN dostupných v Repositáři OFN.
● Pro daný typ publikovaných údajů musí existovat, nebo být připravena Datová specifikace, případně OFN. ● Datové sady jsou popsané a katalogizované v podobě katalogizačních záznamů (metadat) v NKOD. ● Fyzicky jsou datové sady dostupné v podobě distribucí, pro které platí: ○ různé distribuce stejné datové sady zpřístupňují její obsah v různých formátech (např. CSV, XML nebo JSON) a prostřednictvím různých přístupových mechanismů, ○ každá distribuce je zaznamenána v katalogizačním záznamu datové sady v NKOD. ● Způsoby fyzického zpřístupnění obsahu datové sady: ○ datový soubor s kompletním obsahem datové sady určen ke stažení, ○ prostřednictvím API, které umožňuje přistupovat ke kompletním údajům o každé jednotlivé entitě či konceptu, o němž jsou v datové sadě reprezentovány údaje, prostřednictvím dereference identifikátoru entity či konceptu, který je stanoven poskytovatelem údajů v podobě IRI (Internationalized Resource Identifier, viz Otevřená formální norma pro propojená data) ○ prostřednictvím rozhraní API, které umožňuje dotazování nad obsahem datové sady s pomocí dotazovacího jazyka SPARQL. ● Informace o veřejnosti registrovaného údaje je zachycena v jeho evidenci v RPP označením údaje jako “veřejný údaj”. ● Zpřístupnění veřejného údaje prostřednictvím VDF je zachyceno v evidenci RPP: ○ uvedením IRI datové sady (nebo datových sad) v NKOD, v níž je obsah odpovídajícího údaje zpřístupněn a publikován jako otevřená data, ○ v případě údaje kódovaného číselníkem obsahuje evidence veřejného údaje také IRI datové sady v NKOD, v níž je číselník zpřístupněn a publikován jako otevřená data. ● Technická podoba dat určených pro sdílení prostřednictvím VDF je definována jejich datovou specifikací nebo otevřenými formálními normami. 5.1.3 Popis procesu publikace veřejných údajů Předpoklady: ● Řádně a úplně vedená evidence údajů v RPP ze strany ohlašovatelů agend a správců ISVS. Postup: ● Poskytovatel údajů vybere údaje pro publikaci do VDF (viz. Příprava datových sad k publikaci).