● čtení obsahu NKOD, ● dotazovací služby. Každá služba vyžaduje specifické propojení funkcí jednotlivých komponent VDF. Propojení mezi komponentami je tvořeno komunikací využívající webové standardy. ISGOD umožňuje 3 základní druhy přístupu ke zpřístupněným údajům: ● čtení publikovaného datového souboru (distribuce) s obsahem datové sady, ● čtení publikované položky datové sady na základě jejího referenčního IRI, ● dotazování nad obsahem datové sady voláním dotazovacích služeb. Služby jsou realizovány jako webové služby postavené na principech REST, které jsou poskytovány jednotlivými komponentami VDF: ● REST služby NKOD umožňují číst metadata o datových sadách a jejich distribucích. ● REST služby úložiště datových sad umožňují číst obsah uložených datových sad v úložišti následujícími způsoby: ○ stahování datových souborů s obsahem uložených datových sad (povinný způsob), ○ přístupu k IRI jednotlivých položek obsahu uložených datových sad (volitelný způsob), ○ SPARQL dotazy nad obsahem uložených datových sad (volitelný způsob). ISGOD je logickým zastřešením vybraných komponent VDF v závislosti na typu poskytovaných služeb.
- Příprava datových sad k publikaci
Příprava datových sad k publikaci se skládá z několika na sebe navazujících kroků.
● Legislativní vymezení oblastí a typů informací k publikaci do VDF v podobě otevřených dat, v
souladu s možnostmi a povinnostmi vyplývajícími ze stávající legislativy. Ta se samozřejmě v
průběhu času vyvíjí a rozšiřuje okruh informací k veřejnému užití.
● Identifikovat ve vymezených oblastech konkrétní agendy a konkrétní množiny údajů k publikaci
do VDF v podobě otevřených dat.
● Seskupení vybraných (veřejných) dat k publikaci do smysluplných ucelených datových sad.
● Pro zformované datové sady použít otevřené formální normy k návrhu struktury datové sady
a specifikaci jednotlivých datových položek.
● Připravit obsah datové sady ve vybraném základním otevřeném formátu na základě
navrženého datového schématu a tuto předat systému pro zpřístupnění údajů.
7.1 Legislativní vymezení oblastí a typů informací k publikaci do VDF
Posláním VDF je zajistit sdílení veřejných informací veřejné správy mezi veřejnoprávními subjekty
navzájem a sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou v ČR na základě
publikovaných veřejných údajů veřejné správy v podobě otevřených dat. Za veřejné údaje jsou
považovány údaje vedené, nebo vytvářené, v rámci agend registrovaných v RPP, a pro které platí, že
jsou přístupné veřejnosti.
Výběr těchto údajů aktuálně upravuje a usnadňuje novelizace zákona o svobodném přístupu k
informacím č. 106/1999 Sb.
Nový § 5a odstavec 2 zavádí za účelem následného efektivního využití zveřejněných informací
povinnost poskytovat každému dostupné informace obsažené v registrech jako otevřená data.
Pojem „registr“ je legislativní zkratkou založenou v § 5a odst. 1 , která označuje registry, evidence,
seznamy nebo rejstříky obsahující informace, které jsou na základě zákona každému přístupné, přičemž
se jedná jen o takové registry, které jsou vedené nebo spravované na základě z ákona, tedy nikoli
dobrovolně vedené registry (které si povinné subjekty vedou samy o svém rozhodnutí).
Jinými slovy, § 5a odst. 2 zakládá povinnost poskytovat informace , které jsou na základě zákona veřejné, a které jsou vedené v zákonem založených nebo předvídaných registrech také jako otevřená data.
Jedná se o projev zásady „standardního zpřístupnění dokumentů ve formě otevřených dat“ stanovené bodem 16 preambule a čl. 5 odst. 2 Směrnice 2019/1024 (tzv. „Open Data směrnice“). § 5a odst. 2 nahradil předchozí právní úpravu povinných otevřených dat spočívající v nařízení vlády č. 425/2016 Sb., které provádělo § 4b odst. 2 zákona č. 10 6/1999 Sb. ve znění pozdějších předpisů v účinnosti do 24. 7. 2021. Nové ustanovení věcně nepředstavuje velký rozdíl, protože i do nařízení vlády č. 425/2016 Sb. mohly být vybírány pouze informace, které již byly na základě zákona veřejně dostupné a byly vedeny v zákonem založených předvídaných registrech. Z toho důvodu platí i nadále povinnost, která se vztahovala na informace uvedené nařízení vlády č. 425/2016 Sb. Povinné subjekty, které spravují informace, na které tato povinnost od července 2021 dopadla nově mají na jejich zveřejnění lhůtu do 31. 12. 2023 a to na základě Čl. LI zákona č. 261/2021 Sb., kterým se mění některé zákony v souvislosti s další elektronizací postupů orgánů veřejné moci. Při analýze, které informace je potřeba v souladu s § 5a odst. 2 poskytovat jako otevřená data je možné vyjít z jednoduchého schématu dělení informací, kde lze definovat pomocí následujících 5 kategorií:
● Kategorie 1 - Informace, které již byly součástí nařízení vlády č. 425/2016 Sb ., o seznamu
informací zveřejňovaných jako otevřená data, a existuje tedy povinnost jejich pos kytování v
podobě otevřených dat. Tato povinnost platí i nadále a okamžitě po nabytí účinnosti
změnového zákona č. 261/2021 Sb . Přechodné ustanovení se totiž týká pouze od kladu
zveřejnění, ale pokud již informace zveřejněná byla, tato povinnost je naplněna a bylo by proti
smyslu zákona, kdyby přechodné ustanovení bylo vykládáno jako možnost odstranění těchto
informací a pak jako následná povinnost jejich opětovného zveřejnění.
● Kategorie 2 – Informace, které povinný subjekt musí poskytovat jako otevřená data podle § 5a
odst. 2 (přechodné ustanovení zakládá lhůtu na splnění této povinnosti do 31. 12. 2023). Jedná
se o takové informace, u nichž již existuje primární povinnost jejich poskytování povinnými
subjekty a které jsou zároveň vedené v zákonem založených nebo předvídaných registrech.
Jinými slovy, informace vedené v zákonem založených nebo předvídaných registrech, které má
již povinný subjekt povinnost poskytovat, budou povinně poskytována rovněž jako otevřená
data. Zároveň je třeba nezapomenout na nutné provedení pseudonymizace v souladu s
výjimkou uvedenou v § 5a odst. 2.
● Kategorie 3 – Informace, které je možné poskytovat jako otevřená data na základě diskrece
povinného subjektu (v souladu s ustanovením § 5 odst. 5 zákona č. 106/1999 Sb., o svobodném
přístupu k informacím). Jde tedy o informace, u kterých neexistuje právní povinnost jejich
zveřejnění, nebo o informace, které jsou sice zveřejňovány na základě právní povin nosti, ale
nejsou vedeny v zákonem založeném, nebo předvídaném registru. Takové informace může
povinný subjekt zveřejnit, pokud se tak na základě vlastní diskrece rozhodne. Tyto informace
je však nezbytné poskytovat v kvalitě, kterou předepisuje § 4b , která se otevřeným datům
přibližuje.
● Kategorie 4 – Informace, které není možné poskytovat jako otevřená data proto, že je jejich
poskytování vyloučenou výjimkou uvedenou v § 8a nebo v § 9 -11 zákona č. 106/1999 Sb. ,
případně jiným zvláštním zákonem.
● Kategorie 5 – Informace, které jsou zcela vyňaty z působnosti zákona 106/1999 Sb ., o
svobodném přístupu k informacím. Právní úprava otevřených dat podle tohoto zákona se tak
na ně přímo nevztahuje a pro jejich poskytování je třeba se řídit jejich zvláštními právními
předpisy. Jde například o informace spadající pod působnost zákona č. 123/1998 Sb., nebo o
informace katastru nemovitostí.
7.2 Identifikace konkrétních agend a konkrétních množin údajů
K přesnému vymezení veřejných údajů konkrétních agend, aktuálně odpovídajících novelizaci zákona
o svobodném přístupu k informacím č. 106/1999 Sb. (viz. 7.1. Nasměrování identifikace veřejných
informací k publikaci”, je nutné znát podrobnější informace o samotných agendách a jejich údajích.
K získání potřebných informací se nabízí několik způsobů.
● Poskytovatel otevřených dat má dokonalou znalost provozovaných agend a spravovaných
údajů agendou, proto dokáže snadno identifikovat všechny veřejné údaje splňující požadavky
legislativy (viz. 7.1).
● Poskytovatel otevřených dat prostřednictvím uživatelského rozhraní RPP může v evidenci RPP
dohledat všechny potřebné údaje o jím provozovaný ch agendách a spravovaných veřejných
údajích. Nutnou podmínkou je ale řádná a úplná evidence údajů v RPP, která ale není v
současnosti splněna. Tuto možnost mohou tedy využít pouze ti poskytovatelé, jejichž agendy
mají evidenci v RPP v pořádku. Komplikací může být skutečnost, že v RPP zatím schází
informace uvedené u rozšířené evidence údajů pro potřebu VDF. Z tohoto pohledu by bylo
žádoucí, aby ohlašovatelé agend tuto rozšiřující evidenci doplnili jako první krok při pří pravě
publikace. V opačném případě je nutné posuzovat všechny údaje požadavky legislativy ( viz.
7.1).
● Poskytovatel otevřených dat může dohledat všechny potřebné údaje o jím provozovaných
agendách a spravovaných veřejných údajích prostřednictvím publikovaných datových sad s
obsahem evidence RPP. Katalogizační záznamy jsou k dispozici v NKOD s využitím klíčového
slova “ RPP”, datové sady jsou k dispozici v růz ných formátech včetně uvedení SPARQL
Endpointu. I v tomto případě je ale nutnou podmínkou řádná a úplná evidence údajů v RPP,
jako u předchozího způsobu.
● Poslední možností je pracné zjišťování a hledání informací o provozovaných agendách u
správce ISVS a v legislativě definující agendu.
7.3 Rozdělení a seskupení dat k publikaci do ucelených datových sad.
Nalezené veřejné údaje agendy, které budou předmětem publikace, je nutné seskupit do ucelených a
smysluplných datových sad.
Při návrhu a vytváření datových sad (a souvisejících Datových specifikací) je vhodné brát v úvahu:
● počet entit s atributy v údajích agend a jejich vzájemné vazby – složité datové sady vedou ke
komplikovaným Datovým specifikacím (datovým schématům a konceptuálním modelům), a
také k pracnému použití prvků repositáře OFN,
● definice a striktní vymezení tematických oblastí zákonem ustavujícím příslušnou agendu - např.
zákon může přesně vymezovat (oddělovat) vedené rejstříky, seznamy a evidence,
● smysluplný kontext – i samostatná datová sada by měla být cíleně použitelná a měla by dávat
smysl (nabízí se použití konceptuálního modelování, případně využití již hotových
konceptuálních modelů),
● cíl a použití publikované datové sady – vymezuje kořenovou entitu a její atributy, předurčuje
jednoduchost / složitost její struktury,
● množství publikovaných atributů – hodně atributů vzniká v důsledku vazeb na jiné objekty
(entity), v takových případech je vhodnější údaje rozdělit do několika datových sad (například
podle jednotlivých entit) a tím zmenšit datové struktury, a přitom publikovat všechny atributy,
● množství publikovaných dat – obtížnější práce s velkými datovými soubory.
Jednoduchá ukázka využití publikovaných datových sad s obsahem RPP
● Pro vyhledání detailů o agendách je možné využít datovou sadu “Agendy” (anotace datové
sady: “Agendy evidované v Registru práv a povinností ve smyslu § 51 zákona č. 111/2009 Sb. o
základních registrech.”)
● Katalogizační záznam datové sady je dostupný v NKOD prostřednictvím odkazu.
● Pro ukázku práce s datovými sadami jsou použity jejich distribuce ve formátu JSON a jejich vizualizace je provedena v nástroji MS Excel. ● Zobrazení obsahu staženého souboru s datovou sadou a ukázka výběru některých informací například k agendě A 1041 Vnitrozemská plavba:
● Ohlašovatel agendy:
○
orgán-veřejné-moci, IČO 66003008 - Ministerstvo dopravy.
● Vykonavatel agendy:
● orgán-veřejné-moci, IČO 66003008 - Ministerstvo dopravy.
● orgán-veřejné-moci, IČO 00003352 - Státní plavební správa.
● Informace o údajích spravovaných agendou lze například zjistit v datové sadě “ Subjekty a objekty údajů a jejich údaje”, katalogizační záznam v NKOD:
● Ukázka zobrazení obsahu staženého souboru a filtrace údajů pro agendu A1041:
V uvedeném příkladu je zřejmé, že se jedná o jednoduchý rejstřík vedený na základě Zákona č.
114/1995 Sb. o vnitrozemské plavbě, přičemž objekt 1 “Plavidla jiná než malá” je evidován na základě
§ 14 zákona, objekt 2 “Malá plavidla” je evidován dle § 15a.
Současně je v odstavci § 14 odst. 2 uvedeno, že plavební rejstřík je veřejný seznam.
Na první pohled je tedy evidentní, že údaje se týkají dvou entit, a tak se nabízí i údaje rozdělit do dvou
datových sad:
Datová sada 1 “Plavidla jiná než malé”.
● Kořenová entita:
○
Plavidlo jiné než malé.
● Atributy:
○
Vlastník plavidla.
○
Provozovatel plavidla.
○
Poznávací znaky.
○
Jméno lodě.
○
Druh plavidla, oblast jeho provozu na vodní cestě a účel, pro který je plavidlo určeno.
○
Nosnost, dovolený počet cestujících a ostatní základní technické údaje.
○
Zástavní právo k plavidlu.
○
Datum zápisu a výmazu z plavebního rejstříku.
Datová sada 2 “Malá plavidla”.
● Kořenová entita:
○
Plavidlo malé.
● Atributy:
○
Vlastník plavidla.
○
Provozovatel plavidla.
○
Poznávací znaky.
○
Druh plavidla, oblast jeho provozu na vodní cestě a účel, pro který je plavidlo určeno.
○
Nosnost, dovolený počet cestujících a ostatní základní technické údaje.
○
Datum zápisu a výmazu z plavebního rejstříku.
Bylo by samozřejmě možné publikovat všechny údaje v jedné datové sadě “Plavidla” s jednou
kořenovou entitou “plavidlo” a přidáním nového atributu pro rozlišení plavidel, ale mohlo by to
zkomplikovat práci s daty. Navíc v tomto případě by to nebylo ani v souladu se Zákonem č. 114/1995
Sb., neboť první datová sada vychází z definice § 14 (Plavební rejstřík), druhá datová sada z § 15a
(Rejstřík malých plavidel).
Při návrhu datových sad je vždy nutné přistupovat ke každé tematické oblasti individuálně a brát v
úvahu již výše uvedená poznámky.
7.4 Příprava a použití prvků repositáře otevřených formálních norem
pro publikaci údajů
Nutnou podmínkou pro publikaci veřejných údajů do VDF je používání a dodržování konceptu
otevřených formálních norem pro každou publikovanou datovou sadu. Prakticky to znamená přípravu
Datové specifikace publikované sady s využitím standardizovaných prvků datových schémat
dostupných v repositáři OFN.
Základním východiskem pro návrh a přípravu Datové specifikace je výsledek rozdělení a seskupení dat
k publikaci do ucelených datových sad. Tento výsledek předurčuje složitost a pracnost tvorby Datové
specifikace publikované datové sady.
Příprava Datové specifikace ve zkratce:
● Základní princip vychází z principu tvorby OFN a spočívá v transformaci konceptu
(konceptuálního modelu) do datového modelu pomocí standardizovaných stavebních prvků
(sdílených specifikací a základních datových typů) obsažených v repositáři OFN.
● Výchozím stavebním prvkem jsou základní datové typy, pomocí kterých je vytvořen společný
předek (Věc) a také jsou základem vytvořených sdílených specifikací. Tyto sdílené specifikace