C2V4.pdf

Type: Document | Status: ready

1

Metodika identifikace, publikace, katalogizace a využívání otevřených dat pro samosprávu a pro státní správu

Vytvořeno v rámci projektu

Rozvoj datových politik v oblasti zlepšování kvality a interoperability dat veřejné správy CZ.03.4.74/0.0/0.0/15_025/0013983

Klíčová aktivita: 02 Rozvoj Národního katalogu otevřených dat Verze výstupu: 01

2

1 5 1.1 5 1.2 6 1.3 6 1.4 7 1.5 9 ČÁST 1. METODIKA 11 2 11 2.1 11 2.1.1 Národní katalog otevřených dat (NKOD) 11 2.1.2 Veřejný datový fond 12 2.1.3 Registr práv a povinností (RPP) 12 2.1.4 Nástroje pro monitorování kvality publikace datových sad 12 2.1.5 Otevřené formální normy (OFN) 13 2.1.6 Vzdělávací materiály a e-learningová školení 13 2.2 14 2.2.1 Organizační zabezpečení publikace poskytovatelem 15 2.2.2 Lokální katalog otevřených dat (LKOD) 18 2.2.3 Zajištění údržby publikovaných otevřených dat 20 3 21 3.1 21 3.2 22 3.3 23 3.4 25 3.5 25 4 25 4.1 25 4.1.1 Sémantická a syntaktická interoperabilita publikovaných dat. 25 4.1.2 Kontext tvorby datového schématu 27 4.2 30 4.2.1 Vytvoření konceptuálního modelu datové sady. 29 4.2.2 Výběr způsobu publikace 32 4.2.3 Přiřazení rolí k činnostem přípravy konceptuálního modelu datové sady 34 4.3 36 4.3.1 Výběr způsobu reprezentace strukturovaných údajů – datových modelů 35 4.3.2 Obecné charakteristiky publikované datové sady 35 4.3.3 Tabulková data (relační datový model) 36 4.3.4 Hierarchicky strukturovaná data (hierarchický datový model) 36 4.3.5 Propojená data (grafový datový model) 43 4.4 45 4.4.1 Publikace obrázků 45 4.4.2 Publikace textových dokumentů 45 4.4.3 Publikace prostorových údajů 46 4.5 47 4.5.1 Doplnění vazeb do SSP (sémantika datové sady na úrovni metadat) 47 4.5.2 Příprava katalogizačního záznamu datové sady 47

3

5 49 5.1 50 5.1.1 Příprava distribucí se strukturovanými daty 48 5.1.2 Příprava distribucí s nestrukturovanými daty 50 5.1.3 Příprava distribucí k publikaci do VDF 50 5.2 52 5.3 55 5.3.1 Zveřejnění distribucí datové sady a souborů s definicemi datového schématu každé distribuce 53 5.3.2 Finalizace katalogizačních záznamů 54 5.3.3 Katalogizace v LKOD 55 5.4 57 5.5 57 6 58 6.1 59 6.1.1 Publikace registrovaných veřejných údajů do VDF 57 6.1.2 Publikace ostatních údajů ve formátu otevřených dat 58 6.1.3 Publikace High Value Datasets (HVDS) 58 6.2 62 6.2.1 Publikace otevřených dat zaměřených na zlepšení kvality života občanů 61 6.2.2 SMART koncepty 62 6.2.3 Publikace otevřených dat vyplývající z legislativy 64 ČÁST 2. KOMUNIKACE A PROPAGACE 65 7 67 7.1.1 Komunikační strategie 65 7.1.2 Propagace otevřených dat 65 7.1.3 Prezentace otevřených dat 67 8 69 8.1 70 8.2 70 8.3 71 8.4 71 8.5 72 8.6 72 8.7 73 ČÁST 3. ZNALOSTNÍ 72 9 74 9.1 74 9.1.1 Základní charakteristiky otevřených dat. 72 9.1.2 Zastřešující koncept / filozofie otevřených dat – otevřenost. 72 9.1.3 Interoperabilita otevřených dat. 73 9.1.4 Principy otevřených dat (Mezinárodní charta otevřených dat, 2015). 74 9.1.5 Kvalita otevřených dat a kvalita jejich publikace 75 9.1.6 FAIR principy 75

4

9.1.7 Způsoby vzniku hodnoty na základě otevřených dat (zhodnocování). 76 9.1.8 Význam a role otevřených dat 76 9.2 78 9.2.1 Rozdělení údajů z pohledu jejich sdílení 77 9.2.2 Přístupy k údajům veřejné správy 78 9.2.3 Registrované veřejné údaje 79 9.3 81 9.3.1 Určení přínosů datových sad 80 9.3.2 Určení rizik datových sad 81 9.3.3 Ošetření rizik 82 9.4 84 9.4.1 Výklad problematiky vymezení věcného obsahu datové sady 83 9.4.2 Stanovení stupně otevřenosti 85 9.5 88 9.5.1 OFN 87 9.6 98 9.6.1 Vytvoření RDF modelu 96 9.6.2 Serializace RDF modelu 97 9.6.3 Pravidla pro výběr slovníků pro vybrané typy dat 98 9.6.4 Zpřístupnění publikovaných propojených dat 99 9.7 102 9.7.1 Slovník pojmů (Glosář, Tezaurus). 100 9.7.2 Konceptuální model. 100 9.7.3 Sémantický slovník 101 9.7.4 Analýza agendy a odvození údajů 103 9.7.5 Doplnění entit, atributů a vazeb mezi entitami dle datové sady 103 9.7.6 Správa Sémantického slovníku veřejné správy. 103 9.7.7 Podpora nástroji 103 9.7.8 Doplňující zdroje 104 9.8 107 9.8.1 Metadata záznamu datové sady a pravidla pro jejich vyplňování. 105 9.8.2 Metadata záznamu distribuce datové sady 107 9.8.3 Metadata záznamu datové série 107 9.9 111 9.9.1 Implementace Lokálního katalogu otevřených dat 108 9.9.2 Registrace lokálního katalogu 109 9.9.3 Zrušení registrace lokálního katalogu 109 9.9.4 Otevřená formální norma "Rozhraní katalogů otevřených dat: DCAT-AP-CZ" 109 9.10 113 9.10.1 Základní charakteristiky VDF 110 9.10.2 Základní logické komponenty VDF AIS a jejich význam 110 9.10.3 Společné logické komponenty VDF související s AIS Působnostním (RPP) 111 9.10.4 Význam metodiky pro publikaci do VDF 112 9.10.5 Publikace distribucí datové sady do datového úložiště agendy 113 9.10.6 Katalogizace v LKOD agendy 113 9.10.7 Informování notifikačního hubu o změně publikovaného veřejného údaje 113 9.10.8 Doplnění evidence údajů v RPP 114

5

1 Úvod Otevřená data již nejsou pouze nástrojem určeným k zajištění transparentnosti veřejné správy, ale staly se neoddělitelnou součástí budování eGovernmentu, tvoří základní stavební kameny celosvětově přijímaného konceptu otevřeného vládnutí (Open Governance), konceptů budování chytrých měst (SMART City), jsou součástí architektury veřejné správy ČR a základem budovaného jednotného digitálního trhu EU. Dnešní svět a jeho prostředí je charakteristické svou komplexní provázaností, ve kterém často samotný jediný údaj postrádá větší vypovídající hodnotu a skutečná informace je skrytá až ve spojení s řadou dalších údajů.
Z pohledu OD je tedy „izolovaná“ publikovaná datová sada nedostačující, k zajištění skutečné transparentnosti a vytvoření správných informací s velkou hodnotou je nutné data uvádět v souvislostech, ve správných kontextech a významech. Do popředí se tak dostává požadavek na zajištění plné interoperability dat, což jednoduše znamená publikovat data takovým způsobem, aby bylo možné data navzájem sdílet a propojovat, a tak vytvářet správné kontexty zachycující realitu. Naplnění uvedeného požadavku je prioritním cílem této metodiky.
Metodika zastřešuje všechny oblasti spojené s publikací otevřených dat ve veřejné správě ČR připravenými standardy, definovanými postupy, nástroji, a dalšími souvisejícími metodikami a dokumenty. 1.1 Struktura metodiky Metodika je rozdělena do 3 částí: ● Část první – Metodika, představuje vlastní metodiku a obsahuje všechny postupy od prvotní identifikace témat k publikaci až po konečné zpřístupnění a správu publikovaných datových sad. o Řešené oblasti: ▪ Prostředí publikace otevřených dat veřejné správy ČR. ▪ Identifikace témat otevřených dat. ▪ Příprava datové sady. ▪ Publikace a katalogizace datové sady. ▪ Specifika oblastí veřejné správy. ● Část druhá – Komunikace, propagace a využití OD, nemá přímý metodický charakter, neboť se již nezaměřuje na publikaci otevřených dat, ale na komunikaci, prezentaci publikovaných otevřených dat a možné přístupy při jejich využití. Tuto oblast je obtížné nějak standardizovat, proto jsou v této části uvedeny spíše pouze doporučení, rady a možné inspirace. o Řešené oblasti: ▪ Prezentace a propagace dat. ▪ Využití otevřených dat. ● Část třetí – Znalostní, je zaměřena na doplnění znalostí o otevřených datech. Jsou zde k dispozici doplňující a rozšiřující informace k postupům a standardům uvedeným v části první (metodice). o Řešené oblasti: ▪ Rekapitulace informací o otevřených datech. ▪ Údaje veřejné správy ČR. ▪ Příklad ošetření navržených témat otevřených dat. ▪ Datové schéma. ▪ Datová specifikace. ▪ Propojená data.

6

▪ Popis sémantiky veřejné správy. ▪ Katalogizační záznam. ▪ Stručný popis veřejného datového fondu. 1.2 Uživatelé metodiky Metodika je primárně určena všem organizac ím a pracovníkům veřejné správy ČR, zejména ale těm, kteří jsou pověření vykonáváním rolí uvedených v kapitole „Prostředí poskytovatele OD“.
Postupy přípravy a publikace otevřených dat jsou pro všechny typy organizací veřejné správy shodné. Rozdíly se týkají pouze typů publikovaných témat a kategorie dat (agendové/neagendové), které vyplývají z různých pravomocí a odpovědností státní správy a samosprávy.
● Státní správa má za úkol zajišťovat plnění úkolů a povinností stanovených zákonem na celostátní úrovni, má zpravidla větší objem a rozmanitost dat, která jsou důležitá pro celostátní politiku a řízení, provozuje národní registry a databáze, a tak se vyžití otevřených dat zaměřuje na plnění legislativních povinnosti publikace veřejných údajů a zajištění tra nsparentnosti a efektivity procesů na celostátní úrovni. ● Samospráva se zaměřuje na zajištění kvality života občanů na místní úrovni, na plnění místních potřeb a priorit, může mít menší objem dat, ale tyto data mohou být důležitá pro konkrétní region, obec nebo město, a tak se vyžití otevřených dat soustředí na zlepšení kvality života občanů v konkrétním regionu a na poskytování lepších místních služeb. ● Jakýkoliv poskytovatel mimo veřejnou správu, metodika je samozřejmě využitelná i v těchto případech (ideál ní cílová představa je založena na sdílení stejných standardů a postupů), neboť zejména v konceptech SMART se veřejná správa a soukromý sektor potkávají a integrace potřebných, avšak různorodých dat bývá častým řešeným problémem. Otevřená data představují ideální integrační platformu. Zatím neřešenou otázkou je případná katalogizace datových sad publikovaných mimo veřejnou správu v NKOD. Některým specifikám publikace otevřených dat souvisejícími s typy organizací veřejné správy (státní správa / samospráva) se věnuje kapitola 6 „Specifika oblastí veřejné správy“. 1.3 Zaměření metodiky Zaměření metodiky souvisí se členěním údajů veřejné správy a jejich sdílením.

● Pro sdílení registrovaných údajů (veřejných i neveřejných) mezi OVM a zpřístupnění těchto ú dajů SPUÚ pro účely výkonu jejich agend, je určen propojený datový fond (PPDF). Ke sdílení i zpřístupnění údajů je nutná evidence oprávnění pro čtení nebo zápis v Registru práv a povinností (RPP) související s výkonem příslušných agend. ● Pro sdílení veřejných registrovaných údajů mezi OVM a zpřístupnění těchto údajů SPUÚ bez omezení přístupu je určen Veřejný datový fond ( VDF). V tomto případě se jedná pouze o čtení údajů v podobě otevřených dat a není nutná evidence oprávnění přístupu v RPP vyplývající z výkonu souvisejících agend. ● Pro sdílení veřejných registrovaných i neregistrovaných údajů veřejné správy s veřejností bez omezení je určen Otevřený přístup v podobě otevřených dat.

7

Detailnímu vysvětlení rozdělení údajů veřejné správy se věnuje kapitola „Údaje VS“.

Metodika pokrývá: ● přípravu a publikaci neagendových (neregistrovaných v RPP) veřejných údajů veřejné správy ve formátu otevřených dat, ● přípravu agendových (registrovaných) veřejných údajů veřejné správy ve formátu otevřených dat pro publikaci do VDF, o specifika publikace do VDF jsou upraveny dokumenty (dostupnými na POD): ▪ Metodika definice údajů vedených v agendě. ▪ Metodika poskytování dat ve veřejném datovém fondu. ▪ Metodika tvorby a údržby sémantického slovníku pojmů veřejné správy. 1.4 Oblasti otevřených dat a jejich podchycení metodikou Metodika rozlišuje a metodicky pokrývá následující oblasti otevřených dat. Prostředí publikace otevřených dat, které je určeno vytvoření podmínek pro publikaci otevřených v prostředí veřejné správy ČR a dělí se na: ● Sdílené prostředí publikace OD. o Zahrnuje metodiky, nezbytnou sdílenou infrastrukturu, připravené a publikované standardy a vzdělávací materiály.
o Sdílené prostředí je vytvářeno a spravováno centrálně agenturou DIA a je určeno pro všechny poskytovatele otevřených dat veřejné správy ČR.
o Detailnímu popisu je věnována kapitola 2.1 „Sdílené prostředí publikace OD“. ● Prostředí poskytovatele OD. o Věnováno organizačnímu zabezpečení publikace dat v činnostech poskytovatele a případnému doplnění jeho lokální infrastruktury pro publikaci OD. o Detailnímu popisu je věnována kapitola 2.2 „Prostředí poskytovatele OD“. Publikace otevřených dat je rozdělena do čtyř dílčích oblastí: ● Identifikace dat. o Zaměřuje se na
▪ identifikování a shromažďování témat vhodných k publikaci formou otevřených dat, ▪ rozlišení mezi agendovými a neagendovými údaji,
▪ posouzení rizik a přínosů vyplývajících z jejich publikace
▪ a správu vybraných témat k publikaci a informací o jejich publikování. o Detailnímu popisu je věnována kapitola 3 „Identifikace témat otevřených dat“.
● Příprava datové sady. o Ústředním tématem je zabezpečení sémantické a syntaktické interoperability datové sady. o Pozornost je věnována využití sémantiky a zejména dodržení postupu při návrhu struktur distribucí datové sady: „téma -> konceptuální model -> datový model -> datový formát“. o Uvedeny postupy pro přípravu datových sad se strukturovanými i nestrukturovanými údaji, využití otevřených formálních norem pro přípravu datových struktur distribucí a postupy přípravy katalogizačních záznamů včetně zajištění sémantiky na úrovni metadat. o Detailnímu popisu je věnována kapitola 4 „Příprava datové sady“.

Page 1 of 16