80
oprávnění pro čtení nebo pro zápis evidovaných v RPP.
● Přístup prostřednictvím veřejného datového fondu (VDF).
o
VDF je určen ke sdílení veřejných registrovaných údajů mezi jednotlivými OVM a ke zpřístupnění
těchto údajů jednotlivým SPUÚ. Ve všech případech se jedná o čtení údajů v podobě otevřených
dat bez omezení přístupu, a tudíž není nutné pro OVM a SPUÚ získat oprávnění pro jejich čtení.
o
VDF je ustanoven a definován v Informační koncepci ČR (IKČR) v dílčím cíli 5.10 jako součást
eGovernmentu VS ČR:
▪
“Veřejný datový fond tvořený publikovanými veřejnými údaji veřejné správy je základní
metodou pro sdílení veřejných informací mezi veřejnoprávními subjekty navzájem i pro
sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou v ČR. Veřejný
datový fond se od pouhé publikace automatizovaně čitelných otevřených dat posune též
k publikaci právně závazných, platných a pravidelně aktualizovaných datových sad s
jasně definovanou zodpovědností OVS za takové sady.”
o
Obecným výchozím principem, který je základem VDF, je princip P13 eGovernmentu “Otevřená
data jako standard” (Open Data by Default):
▪
“Veřejné údaje evidované orgány veřejné správy ve spravovaných ISVS musí být
zveřejňovány jako otevřená data. Pro neveřejné údaje musí být jako otevřená data
zveřejňována jejich anonymizovaná podoba, souhrn nebo statistika. V případě, že orgány
veřejné správy sdílejí veřejné údaje (včetně anonymizované podoby neveřejných údajů,
souhrnů nebo statistik) musí je sdílet jako otevřená data.“
o
Detailní popis VDF je k dispozici na stránkách https://archi.gov.cz a „Metodice poskytování dat
ve veřejném datovém fondu“.
● Otevřený přístup.
o
Otevřený přístup je určen k přístupu k veřejným údajům (registrovaným i neregistrovaným)
kýmkoliv formou čtení, a to bez omezení přístupu, v podobě otevřených dat dle § 3a odst. 5
zákona č. 106/1999 Sb. o svobodném přístupu k informacím.
9.2.3 Registrované veřejné údaje
Podle § 51 odst. 6, písm. k) zákona č.111/2009 Sb. o základních registrech. je pro každý údaj vedený nebo
vytvářený v rámci agendy v RPP vedena jeho přístupnost veřejnosti a v případě, že údaj není přístupný veřejnosti,
je povinností uvést číslo a název právního předpisu a označení jeho ustanovení, na jehož základě není údaj
přístupný veřejnosti (resp. seznam takových referencí na ustanovení právních předpisů).
Pokud tedy neexistují legislativní překážky ke zveřejnění údaje, jedná se o údaj přístupný veřejnosti (dále jen
veřejný údaj). Veřejný údaj je speciálním případem údaje.
Způsob poskytnutí údaje zveřejněním upravuje § 4b zákona č. 106/1999 Sb. o svobodném přístupu k informacím,
dle kterého se veřejný údaj poskytuje jako informace ve všech formátech a jazycích, ve kterých byla informace
Přístup k údajům VS prostřednictvím veřejného datového fondu (VDF) i prostřednictvím otevřeného
přístupu je založen na publikovaných údajích VS ve formátu otevřených dat.
81
vytvořena; při zveřejnění takové informace v elektronické podobě musí být jeden z těchto formátů otevřený a,
je-li to možné, též strojově čitelný. Je -li to možné a vhodné, zveřejní povinný subjekt spolu s informací též
metadata, která se k ní vztahují. Formát i metadata musí co nejvíce splňovat otevřené formální normy.
Z důvodu dosažení interoperability mezi informačními systémy veřejné správy a také z důvodu dosažení
přeshraniční interoperability je nutné při zveřejňování úd ajů postupovat podle otevřených formálních norem
vydávaných MV ČR a při zveřejňování metadat je nutné postupovat dle otevřené formální normy rozhraní
katalogů otevřených dat.
Dále je dle § 51 odst. 6, písm. k) zákona č.111/2009 Sb. pro údaj vedený nebo vytvářený v rámci agendy, jehož
možné hodnoty jsou vymezeny číselníkem nutné, aby tento číselník byl evidován v RPP.
Z § 54 odst. 1, písm. a) zákona č.111/2009 Sb. vyplývá, že primárně musí být volen číselník, který již je v RPP
veden. Pouze pokud žádný vhodný číselník v RPP veden není, uvádí ohlašovatel agendy svůj vlastní číselník, tj.
nový číselník ohlašovatele agendy.
Dle § 69 odst. 4 zákona č.111/2009 Sb. MV ČR zveřejnilo otevřeno u formální normu pro vytváření číselníků a
podle § 51 odst. 11 zákona č.111/2009 Sb. jsou číselníky veřejně přístupné způsobem umožňujícím dálkový
přístup.
Ze spojení s § 5a odst. 2 zákona č. 106/1999 Sb. pak vyplývá, že číselník musí být zveřejněn jako otevřená data
podle otevřené formální normy vyplývající z § 69 odst. 4 zákona č.111/2009 Sb..
Z pohledu zákona o základních registrech lze rozlišit dva možné typy veřejných číselníků.
● Dle § 50 odst. 2 zákona č.111/2009 Sb. číselníky ČSÚ.
● Dle § 54 odst. 1, písm. a) zákona č.111/2009 Sb. číselníky ohlašovatelů agend.
Možné hodnoty údaje lze tedy vymezit buď číselníkem ČSÚ nebo číselníkem ohlašovatele agendy.
9.3 Příklad ošetření navržených témat otevřených dat
9.3.1 Určení přínosů datových sad
Pro ostatní otevřená data (dobrovolně otevíraná data) je důležité, aby jejich existence přinášela nějaký užitek. U
každé navrhované datové sady je proto důležité analyzovat, jaké přínosy její otevření přinese.
(odkaz POD)
● Analýzu přínosů provádí Koordinátor otevírání dat ve spolupráci s Kurátory dat a je doporučen
následující postup:
● Pro datové sady uvedené ve vzorovém publikačním plánu jsou přínosy identifikovány a lze je snadno
převzít.
● Pokud jsou do seznamu přidány vlastní datové sady, ohodnocení je vhodné provést pásmově:
o 0 - žádný přínos,
o 1 - nízký přínos,
Jak již bylo uvedeno v kapitole „Ošetření navržených témat otevřených dat“, v případě „povinného otevírání
dat“ na základě povinností stanovených v legislativě a uplatňování principu P13 „Open data by Default“ platí,
že veřejné údaje se publikují bez ohledu na identifikované přínosy. Z toho pohledu je analýza přínosů
nerelevantní, neboť základní přínos vyplývá:
z veřejného přístupu k veřejným údajům veřejné správy a
podporou efektivity výkonu veřejné správy prostřednictvím nové
metody vzájemného sdílení údajů (VDF) organizacemi veřejné správy
ve formě otevřených dat.
Analýza rizik ale svůj význam v žádném případě neztrácí.
82
o
2 - střední přínos,
o
3 - významný přínos.
● Seznam kritérií pro posouzení přínosů:
o
Posílení transparentnosti,
▪
lepší dostupnost a přístup k informacím o fungování orgánů veřejné správy, například
přístup ke smlouvám a veřejným zakázkám.
o
Podpora ekonomického růstu,
▪
zveřejnění informací může vést k hospodářskému a ekonomickému růstu,
▪
zveřejnění informací veřejného sektoru může posloužit jako zdroj pro nové inovace,
služby, produkty a podnikatelské příležitosti.
o
Zlepšení služeb veřejné správy a zlepšení kvality života,
▪
veřejný sektor skrze otevřená data informuje veřejnost o plánovaných změnách a akcích
a tím vytváří větší důvěru mezi občanem a orgánem veřejné správy.
o
Podpora opětovného použití dat,
▪
strojová čitelnost, dostupnost metadat a právní otevřenost dat zajišťují větší znovu
využitelnost dat veřejného sektoru,
▪
jednodušší vývoj aplikací a služeb postavených na otevřených datech.
o
Zlepšení vnímání veřejné správy veřejností,
▪
instituce státní správy a samosprávy se stanou otevřenější a transparentnější.
o
Zlepšení procesů a dat veřejné správy, zlepšení komunikace a spolupráce veřejné správy,
▪
může se zlepšit komunikace mezi jednotlivými orgány veřejné správy,
▪
publikace otevřených dat může nahradit někdy zbytečně složité předávání dat mezi
jednotlivými institucemi.
o
Zamezení chyb vzniklých při práci s daty,
▪
dostupnost dat ve strojově čitelném formátu může minimalizovat potřebu manuálního
přepisování dat z dokumentů do jiných systémů a celkově se může snížit chybovost.
o
Snížení počtu dotazů dle zák. č. 106/1999 Sb.,
▪
může se výrazně snížit počet žádostí dle zák. č. 106/1999 Sb.
o
Pořádek ve vlastních datech,
▪
analýza dat, katalogizace a publikace umožní instituci uspořádat svá vlastní data a
optimalizovat tak i vlastní interní procesy.
o
Zvýšení hodnoty dat,
▪
strojová čitelnost a otevřenost dat spolu s metadaty přidávají datům novou hodnotu,
která může být zhodnocena v různých vyvinutých aplikacích a zejména rozvinuta v
kontextu Otevřených propojitelných dat.
9.3.2 Určení rizik datových sad
Otevřená data přinášejí i rizika. Závažná rizika je proto nutno dopředu identifikovat, aby bylo možné je řídit, až
budou data otevřena. Analýzu rizik opět provádějí Koordinátor otevírání dat s Kurátory dat.
(odkaz POD)
● Analýzu rizik provádějí Koordinátor otevírání dat s Kurátory dat a je doporučen následující postup:
83
● pro datové sady uvedené ve vzorovém publikačním plánu jsou rizika identifikována a lze je snadno
převzít,
● pokud jsou do plánu přidány vlastní datové sady, ohodnocení se provede pásmově:
o
0 - žádné riziko,
o
1 - nízké riziko,
o
2 - střední riziko,
o
3 - významné riziko.
● Celkové zhodnocení rizikovosti datové sady musí být následováno návrhem opatření pro eliminaci či
omezení pravděpodobnosti výskytu nebo negativního dopadu rizik.
● Seznam kritérií pro posouzení rizik:
o
Zveřejnění dat v rozporu se zákonem,
▪
ověření, zda publikaci datové sady nebrání související legislativa.
o
Porušení ochrany obchodního tajemství,
▪
zvážení, zda se publikací neporušuje obchodní tajemství, specifikované např. ve smlouvě
s dodavatelem.
o
Porušení ochrany osobních údajů,
▪
ověření, zda součástí otevřených dat nejsou chráněné osobní údaje.
o
Zveřejnění nevhodných dat či informací,
▪
zvážení, zda publikovaná data nebudou mít negativní dopady, např. z hlediska kvality
publikovaných dat.
o
Dezinterpretace dat,
▪
zvážení, zda otevřená data nebude možno dezinterpretovat, např. nevysvětlením
používaných pojmů.
o
Absence konzumentů dat,
▪
ověření, zda je o publikovaná data zájem ze strany budoucích uživatelů dat.
o
Překrývání dat,
▪
ověření, zda se datové sady nemohou překrývat s jinými, již publikovanými datovými
sadami.
o
Ohrožení bezpečnosti státu / majetku / osob,
▪
ověřit, zda datové sady nemohou ohrozit bezpečnost státu, majetku, anebo osob.
9.3.3 Ošetření rizik
Celkové zhodnocení rizikovosti datové sady musí být následováno návrhem opatření pro eliminaci či omezení
pravděpodobnosti výskytu nebo negativního dopadu rizik.
● Možná opatření pro zmírnění rizik:
o
Anonymizace/agregace dat,
▪
pokud nelze poskytnout data z důvodu požadavků na jejich ochranu, je vhodné zvážit,
zda lze publikovat alespoň anonymizovaná data či statistiky,
▪
u datové sady, která obsahuje osobní údaje je třeba dbát zvýšené opatrnosti.
▪
Obecně až na úplné výjimky platí, že pokud neexistuje zákonná povinnost taková data
zveřejnit, tak se zveřejnit nemohou.
▪
V případech, že zákonná povinnost existuje, je možné osobní údaje zveřejnit vzhledem k
84
nutnosti splnění takové povinnosti, ale do popisu datové sady je doporučené vložit
následující sdělení určené příjemcům dat:
▪
„Poskytovaná datová sada obsahuje osobní údaje ve smyslu zákona č. 101/2000
Sb., o ochraně osobních údajů a o změně některých zákonů. Příjemce této
datové sady se stává správcem osobních údajů. Vzhledem k tomu musí plnit
zákonné povinnosti, které mu z účinné právní úpravy ochrany osobních údajů
vyplývají.“
o
Návrh vhodné komunikační strategie.
▪
Stanovit, jak bude o datové sadě informováno, identifikovat potenciální negativní reakce
a připravit odpovědi,
▪
vhodné oslovení cílových skupin uživatelů dat před otevřením dat (analýza
zainteresovaných stran).
o
Vytvoření vhodných metadat a doplňujících informací,
▪
uvést do metadat popis předpokladů a omezení využití dat,
▪
publikovat doplňující informace – např. metodiku pořízení a zpracování dat, použité
výpočty, definice ukazatelů apod.
o
Vhodné vymezení datové sady a propojení na související datové sady,
▪
vymezení datové sady s ohledem na minimalizaci překryvů s jinými datovými sadami,
▪
využití již publikovaných datových sad,
▪
propojování na související datové zdroje.
9.4 Datové schéma
9.4.1 Výklad problematiky vymezení věcného obsahu datové sady
Každé navržené téma je zpravidla definováno svým názvem, odpovědným kurátorem a stručným popisem. Toto
ještě ale nemusí znamenat přesné vymezení rozsahu publikovaného kontextu tématu, a tedy ani rozsahu
publikovaných údajů. Je nutné si uvědomit, že při použití zejména hierarchických datových modelů model datové
sady je obvykle určován jednou kořenovou entitou, a ta předurčuje účel využití příslušné datové sady. Při
komplexnějších tématech (zastřešujících například tematickou oblast) to může odpovídající datovou sadu omezit
při jejím využití. Pro komplexnější témata je jednoznačně výhodnější používat pro jejich publikaci grafové modely,
které obsahují kompletní provázaný kontext celé tematické oblasti.
Vysvětlující jednoduchý příklad.
● Navržené téma otevřených dat: Prezenční listina zasedání.
● Popis: Prezenční listina ze zasedání shrnující přítomnost na konkrétním zasedání a případné omluvy.
Tímto způsobem navržené téma je velmi jednoduché, ale také současně málo využitelné. V podstatě se jedná
pouze o publikaci jednoduché tabulky.
Cílem v tomto jednoduchém případě je tedy publikovat informace zachycené v jedné konkrétní prezenční listině, přičemž informace o tom, o jaké zasedání se jednalo a v kterém konkrétním termínu proběhlo, budou obsaženy
85
v metadatech publikované sady.
Rozšíření uvedeného příkladu.
● Navržené téma otevřených dat: „Mini-agenda“ zasedání.
● Popis: Publikace informací o zasedáních.
Zjednodušená představa tématu (konceptuální model) zahrnuje existenci tří provázaných entit.
(Entita je základním pojmem při popisu reálného světa a práci s informacemi o něm. Vlastnosti entit se popisují atributy. Mezi jednotlivými entitami existují vzájemné vztahy – relace.) Zobrazený konceptuální model nyní nabízí následující možnosti jeho publikace. ● Publikace datové sady na základě pouze jedné entity bez publikace vazeb na navázané entity (tabulková data). o Základ entita 1 – publikace seznamu pracovníků. o Základ entita 2 „Prezenční listina“ – publikace účasti na jednom konkrétním zasedání, stejný případ, jako byl uveden u jednoduchého příkladu. o Základ entita 3 – publikace přehledu všech zasedání. ● Publikace datové sad y na základě jedné kořenové entity a s odvozením dalších atributů prostřednictvím navázaných entit (hierarchicky strukturovaná data). o Základní entita 1 a entita 2 – datová sada bude obsahovat informace o pracovnících, jejich účasti na zasedáních, včetně termínů a zda byli případně omluveni za neúčast. Bude reprezentovat nasazení a disciplínu každého pracovníka. o Základní entita 1 a entity 2 a 3 – datová sada přináší navíc informace ohledně vyžadované povinné účasti pracovníků na zasedáních a jakých témat zasedání se měli zúčastnit. Bude reprezentovat plnění pracovních povinností každého pracovníka. o Základní entitou je entita 2 – datová sada bude obsahovat informace o prezenčních listinách, Širším cílem publikace otevřených dat je ale publikace datových sad určených k opakovanému a mnohostrannému využití s možností jejích propojování s dalšími datovými sadami do širších kontextů.
86
kterých zasedání se týkaly, v jakých termínech, jaká byla na nich účast, kdo se jich zúčastnil a kdo byl omluven. o Základní entitou je entita 3 - datová sada bude obsahovat informace o zasedáních a jejich programech, o povinných účastnících a informace o skutečné účasti. ● Publikace datové sady se všemi entitami a vztahy mezi nimi (propojená data). o Způsob použití a možnosti vytěžení informací z datové sady je omezen pouze kvalitou namodelování reality – kvalitou konceptuálního schématu.
Další zvažovaná hlediska při vymezení rozsahu obsahu datových sad: ● počet entit (sub jektů a objektů práva v případě agendových údajů) s atributy v údajích a jejich vzájemné vazby – složité datové sady vedou ke komplikovaným datovým schématům a konceptuálním modelům, ● vymezení tematických oblastí, např. v případě agend zákon ustavující příslušnou agendu může přesně vymezovat (oddělovat) vedené rejstříky, seznamy a evidence, ● smysluplný kontext – i samostatná datová sada by měla být cíleně použitelná a měla by dávat smysl, ● cíl publikace a použití publikované datové sady – vymezuje kořenovou entitu a její atributy, předurčuje jednoduchost / složitost její struktury, ● místo evidence a správy publikovaných údajů (entit, jejich atributů a vzájemných vazeb), v případě rozprostření informací mezi více zdrojů (informačních systémů) je nutné mít na pamě ti, že automatizovaná publikace datových sad by byla komplikovaná, ● místa evidence a správy informací o subjektech a objektech práva agendy (jednotlivé ISVS), v případě rozprostření informací mezi více ISVS je nutné mít na paměti, že publikace datových sad (zpřístupnění a katalogizace) je vždy zajišťována tím ISVS, který informace spravuje (publikace společné datové sady s informacemi z více ISVS by byla komplikovaná), Rozhodnutí o rozsahu publikovaného kontextu tématu je zásadním předpokladem pro zajištění široké využitelnosti publikovaných datových sad.
87
● množství publikovaných atributů – hodně atributů vzniká v důsledku vazeb na jiné objekty ( entity), v
takových případech je vhodnější údaje rozdělit do několika datových sad (například podle jednotlivých
entit) a tím zmenšit datové struktury, a přitom dodržet publikaci všech atributů,
● celkové množství publikovaných dat – obtížnější práce s velkými datovými soubory.
9.4.2 Stanovení stupně otevřenosti
Detailní výklad problematiky stanovení stupně otevřenosti je uveden na stránkách Portálu otevřených dat (odkaz
POD).
Pro každou datovou sadu je nutné rozhodnout, na jakém stupni otevřenosti bude otevřena. Pro tento účel je
definováno 5 stupňů otevřenosti.
V souvislosti s určením stupně otevřenosti je nutno zvolit i technickou podobu zveřejnění datové sady. To
zahrnuje ur čit, v jakých distribucích bude obsah datové sady zveřejněn a v jakém datovém formátu budou
distribuce vyjádřeny. Postup určení technické podoby se liší v závislosti na zvoleném stupni otevřenosti datové
sady.
Míru otevřenosti dat je možné vyjádřit pomocí 5 stupňů otevřenosti:
● stupeň 1 - datová sada je dostupná v síti WWW s vhodnými podmínkami užití otevřených dat,
● stupeň 2 - datová sada je poskytována ve strojově čitelném formátu, který umožňuje automatizované
strojové zpracování,
● stupeň 3 - datová sada je poskytována v otevřeném formátu, tj. ve formátu s volně dostupnou
specifikací,
● stupeň 4 - na identifikaci entit v datové sadě se používají IRI,
● stupeň 5 - datová sada splňuje standard propojených dat.
Jednotlivé orgány veřejné správy mohou publikovat své datové sady na nižších stupních otevřenosti, ale tyto
datové sady pak nejsou otevřené. Neznamená to však, že otevřená datová sada nesmí být publikována na stupni
otevřenosti 2.
Je vždy nutné zajistit publikaci kompletního obsahu datové sady na stupni otevřenosti alespoň 3 a vedle toho
lze její obsah publikovat i na stupni 2 (příp. 1, pokud to je smysluplné a účelné).
V praxi to znamená, že uživatelům dat je dostup ná jak varianta na úrovni 2 tak varianta na úrovni 3. V případě
datové sady s tabulkou je např. možné zveřejnit distribuci datové sady v podobě XLSX souboru, který obsahuje
řadu grafických prvků a formátování pro přehledné zobrazení tabulky na obrazovce už ivatele – čtenáře (stupeň
2) a vedle toho další distribuci této datové sady v podobě jednoduchého CSV souboru, který žádné grafické prvky
a formátování neobsahuje a umožňuje uživatelům – programátorům aplikací a datovým analytikům co nejsnazší
přístup k údajům v tabulce (stupeň 3).
Dále je možné, aby poskytovatel provozoval nad svými otevřenými daty nějakou webovou, mobilní či jinou
softwarovou aplikaci, která data zpřístupňují široké veřejnosti (kterou často nezajímají strojově čitelná data, ale
V kontextu veřejné správy České republiky je nejnižším stupněm otevřenosti stupeň 3. Datové sady
publikované na stupních otevřenosti 0, 1 a 2 nejsou považovány za otevřené.
88
právě apli kace, které jsou nad nimi vytvořené). Existence nebo neexistence takových aplikací však nijak
neovlivňuje otevřenost datové sady.
9.5 Datové specifikace
Interoperabilita publikovaných otevřených dat je zajištěna standardizací jejich publikace na základě Otevřených
formálních norem (OFN) vydaných garantem otevřených dat a Datových specifikací vytvářených jednotlivými
poskytovateli dat.
Datová specifikace je z pohledu obsahu a struktury všech vytvořených artefaktů v podstatě shodná s OFN, se
dvěma zásadními rozdíly:
● není oficiálně vydaná a autorizovaná garantem OD veřejné správy ČR dle § 3a odst. 3 zákona č.
106/1999 Sb.
● součástí datové specifikace nejsou předpřipravená metadata v podobě vzorových metadatových
záznamů pro registraci do NKOD.
OFN je v principu specializací Datové spec ifikace, přičemž její specializace je dána především její přípravou,
způsobem publikace a autorizací garantem OD veřejné správy ČR.
Základní struktura datové specifikace:
● Přehledové schéma (konceptuální model, datový model).
● Specifikace datových tříd, jejich vlastností a vazeb na jiné datové třídy nebo sdílené specifikace. Pro
každou vlastnost je uveden její identifikátor, který je pro její reprezentaci použit ve všech dato vých
formátech, její název, datový typ, popis a příklad. Všechny třídy, které nejsou specifikovány jinou
otevřenou formální normou nebo číselníkem, dědí vlastnosti a vazby třídy „Věc“.
o Příklad specifikace vlastnosti „Tituly před jménem“ datové třídy „Člověk“:
▪ Vlastnost: jméno
▪ Vlastnost: tituly_před
▪ Typ: Text
▪ Jméno: Tituly před jménem
▪ Popis: Tituly před jménem.
Pokud poskytovatel dat provozuje pouze aplikaci (např. HTML formulář pro vyhledávání záznamů a jejich
následné zobrazení) n ad otevřenými daty a neposkytuje současně kompletní obsah datové sady na stupni
otevřenosti minimálně 3, neposkytuje otevřená data.
Datová specifikace popisuje strukturu a sémantiku konkrétní datové sady nebo datových sad. Obsahuje
dokumentaci významu obsahu datové sady v podobě jejího konceptuálního modelu, jeho popisu a datová
schémata určující datové struktury, ve kterých je obsah distribuován v různých formátech.
Datovou specifikaci na rozdíl od OFN vydává konkrétní poskytovatel
a specifikuje pomocí ní konkrétní podobu datové sady, datových sad,
nebo často se opakujících částí jeho konkrétních publikovaných
datových sad (obdoba sdílených specifikací v případě OFN), ve kterých
veřejné údaje zpřístupňuje.
Návrh Datové specifikace musí respektovat a vycházet ze stávajících
OFN dostupných v Repositáři OFN.
Pro poskytovatele registrovaných veřejných údajů (publikace do
VDF) je příprava Datových specifikací pro publikovaná data
povinná.
Technická podoba dat určených pro sdílení prostřednictvím VDF
musí být vždy definována jejich datovou specifikací nebo otevřenými
formálními normami.
89
▪ Povinnost: Nepovinná
▪ Příklad: RNDr.
● Uvedené příklady reprezentace v různých úrovních detailu, ve formátu JSON a JSON-LD.
Informace o použité „Datové specifikaci“, nebo o použité OFN při návrhu publikované datové sady je uvedena
v jejím katalogizačním záznamu v položce „Specifikace“.
Více informací k přípravě „Datové specifikace“ lze nalézt v „Návodu k použití OFN poskytovateli dat“ a také v již
připravených a publikovaných OFN.
9.5.1 OFN
9.5.1.1 Stručné seznámení s OFN
Otevřené formální normy (OFN) jsou technická doporučení zaměřená na vybrané datové sady. Zajišťují, že stejná
data publikovaná různými poskytovateli budou interoperabilní a bude je možné jednodušeji využívat nezávisle
na tom, kdo data poskytuje. Pro poskyt ovatele otevřených dat, kteří jsou povinnými subjekty dle zákona č.
106/1999 Sb. o svobodném přístupu k informacím, jsou doporučení vyplývající z OFN závazná dle § 4b odst. 1.
Dále uvedené postupy v této kapitole jsou pro názornost demonstrovány formou „ručních operací“, jejichž
výsledkem je pouze zajištění syntaktické interoperabil ity. Pro zajištění i plné sémantické interoperability jsou
nezbytné připravené konceptuální modely s vazbami do slovníku sémantických pojmů, pro jejichž přípravu lze
výhodně využít tzv. „výrobní linku pro modelování“. Z vytvořených konceptuálních modelů lz e totiž následně
pomocí specializovaného nástroje (dataspecer) přímo generovat nejen datová schémata (datové specifikace), ale
i nové otevřené formální normy, a to vše včetně využití již vydaných stávajících OFN a sdílených specifikací. Více
v kapitole „Podpora nástroji“.
Obecný princip konstrukce OFN bez zřetele na konkrétní témata.
Konstrukce OFN je založena na výstavbě datových specifikací (datových modelů) pomocí standardizovaných
„stavebních prvků“. Jednotlivé stavební prvky jsou vytvářeny postupnou konstrukcí a kombinacemi od těch
nejjednodušších prvků (základní datové typy) až po ty nejsložitější (OFN pro úplná datová témata). Všechny
vytvářené prvky dědí vlastnosti od svého společného předka „Věc“. Ve strojo vém vyjádření jsou konstrukce
vytvářených „vyšších“ stavebních prvků tvořeny pouze pomocí vzájemných referenčních odkazů, což znamená,
že „nižší“ stavební prvky jsou vzájemně pouze sdíleny.
Základním stavebním prvkem OFN jsou základní datové typy, pomocí kterých je jednak vytvořen společný předek
„Věc“ pro všechny další prvky vytvářených OFN, a také jsou základem vytvořených sdílených specifikací. Výsledná
OFN je následně tvořena kombinací všech vytvořených prvků (základní datové typy a sdílené specifikace ) a
zděděnými vlastnostmi společného předka „Věc“.
Při tvorbě OFN pro konkrétní datové sady sehrává klíčovou roli téma OFN a jeho významový kontext vyjádřený
konceptuální modelem..
OFN jsou v principu specializací Datové specifikace, přičemž její specializace je dána především její přípravou,
způsobem publikace a autorizací garantem OD veřejné správy ČR
90
Obsah a struktura repozitáře OFN:
● Základní datové typy o Ano či ne (booleovská hodnota), Celé číslo, Desetinné číslo, Datum, Čas, Datum a čas, Řetězec, URL, Cena, Množství ● Věc o Společný předek sdílených specifikací, charakterizovaný základními vlastnostmi: identifikátor, název, popis, čas zneplatnění apod. ● Sdílené specifikace o Společné části vyskytující se ve více datových sadách, na které se odkazují ostatní otevřené formální normy a specifikace. o V přehledových obrázcích v OFN jsou tyto typy entit označovány rámečkem s šedě podbarveným nadpisem. ● Specifické OFN o Zachycují ucelený kontext konkrétního publikovaného tématu, nebo řešeného problému. o Dělí se na: ▪ OFN pro konkrétní datové sady: specifikují, jak publikovat data o konkrétních věcech, např. sportovištích, akcích apod. ▪ Obecnější OFN pro různé typy dat: nejsou spojeny s žádným konkrétním tématem, ale spíše s typy, nebo způsobem publikace datových sad.
Obsah repozitáře OFN je dostupný na stránkách Portálu otevřených dat. Repositář OFN si lze také představit jako množinu hierarchických stromových modelů dat (reprezentující datová