C2V6.pdf

Type: Document | Status: ready

● čtení obsahu NKOD, ● dotazovací služby. Každá služba vyžaduje specifické propojení funkcí jednotlivých komponent VDF. Propojení mezi komponentami je tvořeno komunikací využívající webové standardy. ISGOD umožňuje 3 základní druhy přístupu ke zpřístupněným údajům: ● čtení publikovaného datového souboru (distribuce) s obsahem datové sady, ● čtení publikované položky datové sady na základě jejího referenčního IRI, ● dotazování nad obsahem datové sady voláním dotazovacích služeb. Služby jsou realizovány jako webové služby postavené na principech REST, které jsou poskytovány jednotlivými komponentami VDF: ● REST služby NKOD umožňují číst metadata o datových sadách a jejich distribucích. ● REST služby úložiště datových sad umožňují číst obsah uložených datových sad v úložišti následujícími způsoby: ○ stahování datových souborů s obsahem uložených datových sad (povinný způsob), ○ přístupu k IRI jednotlivých položek obsahu uložených datových sad (volitelný způsob), ○ SPARQL dotazy nad obsahem uložených datových sad (volitelný způsob). ISGOD je logickým zastřešením vybraných komponent VDF v závislosti na typu poskytovaných služeb.

  1. Příprava datových sad k publikaci Příprava datových sad k publikaci se skládá z několika na sebe navazujících kroků. ● Legislativní vymezení oblastí a typů informací k publikaci do VDF v podobě otevřených dat, v souladu s možnostmi a povinnostmi vyplývajícími ze stávající legislativy. Ta se samozřejmě v průběhu času vyvíjí a rozšiřuje okruh informací k veřejnému užití. ● Identifikovat ve vymezených oblastech konkrétní agendy a konkrétní množiny údajů k publikaci do VDF v podobě otevřených dat. ● Seskupení vybraných (veřejných) dat k publikaci do smysluplných ucelených datových sad. ● Pro zformované datové sady použít otevřené formální normy k návrhu struktury datové sady a specifikaci jednotlivých datových položek. ● Připravit obsah datové sady ve vybraném základním otevřeném formátu na základě navrženého datového schématu a tuto předat systému pro zpřístupnění údajů. 7.1 Legislativní vymezení oblastí a typů informací k publikaci do VDF Posláním VDF je zajistit sdílení veřejných informací veřejné správy mezi veřejnoprávními subjekty navzájem a sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou v ČR na základě publikovaných veřejných údajů veřejné správy v podobě otevřených dat. Za veřejné údaje jsou považovány údaje vedené, nebo vytvářené, v rámci agend registrovaných v RPP, a pro které platí, že jsou přístupné veřejnosti. Výběr těchto údajů aktuálně upravuje a usnadňuje novelizace zákona o svobodném přístupu k informacím č. 106/1999 Sb. Nový § 5a odstavec 2 zavádí za účelem následného efektivního využití zveřejněných informací povinnost poskytovat každému dostupné informace obsažené v registrech jako otevřená data. Pojem „registr“ je legislativní zkratkou založenou v § 5a odst. 1 , která označuje registry, evidence, seznamy nebo rejstříky obsahující informace, které jsou na základě zákona každému přístupné, přičemž se jedná jen o takové registry, které jsou vedené nebo spravované na základě z ákona, tedy nikoli dobrovolně vedené registry (které si povinné subjekty vedou samy o svém rozhodnutí).
    Jinými slovy, § 5a odst. 2 zakládá povinnost poskytovat informace , které jsou na základě zákona veřejné, a které jsou vedené v zákonem založených nebo předvídaných registrech také jako otevřená data.
    Jedná se o projev zásady „standardního zpřístupnění dokumentů ve formě otevřených dat“ stanovené bodem 16 preambule a čl. 5 odst. 2 Směrnice 2019/1024 (tzv. „Open Data směrnice“). § 5a odst. 2 nahradil předchozí právní úpravu povinných otevřených dat spočívající v nařízení vlády č. 425/2016 Sb., které provádělo § 4b odst. 2 zákona č. 10 6/1999 Sb. ve znění pozdějších předpisů v účinnosti do 24. 7. 2021. Nové ustanovení věcně nepředstavuje velký rozdíl, protože i do nařízení vlády č. 425/2016 Sb. mohly být vybírány pouze informace, které již byly na základě zákona veřejně dostupné a byly vedeny v zákonem založených předvídaných registrech. Z toho důvodu platí i nadále povinnost, která se vztahovala na informace uvedené nařízení vlády č. 425/2016 Sb. Povinné subjekty, které spravují informace, na které tato povinnost od července 2021 dopadla nově mají na jejich zveřejnění lhůtu do 31. 12. 2023 a to na základě Čl. LI zákona č. 261/2021 Sb., kterým se mění některé zákony v souvislosti s další elektronizací postupů orgánů veřejné moci. Při analýze, které informace je potřeba v souladu s § 5a odst. 2 poskytovat jako otevřená data je možné vyjít z jednoduchého schématu dělení informací, kde lze definovat pomocí následujících 5 kategorií:

● Kategorie 1 - Informace, které již byly součástí nařízení vlády č. 425/2016 Sb ., o seznamu informací zveřejňovaných jako otevřená data, a existuje tedy povinnost jejich pos kytování v podobě otevřených dat. Tato povinnost platí i nadále a okamžitě po nabytí účinnosti změnového zákona č. 261/2021 Sb . Přechodné ustanovení se totiž týká pouze od kladu zveřejnění, ale pokud již informace zveřejněná byla, tato povinnost je naplněna a bylo by proti smyslu zákona, kdyby přechodné ustanovení bylo vykládáno jako možnost odstranění těchto informací a pak jako následná povinnost jejich opětovného zveřejnění. ● Kategorie 2 – Informace, které povinný subjekt musí poskytovat jako otevřená data podle § 5a odst. 2 (přechodné ustanovení zakládá lhůtu na splnění této povinnosti do 31. 12. 2023). Jedná se o takové informace, u nichž již existuje primární povinnost jejich poskytování povinnými subjekty a které jsou zároveň vedené v zákonem založených nebo předvídaných registrech. Jinými slovy, informace vedené v zákonem založených nebo předvídaných registrech, které má již povinný subjekt povinnost poskytovat, budou povinně poskytována rovněž jako otevřená data. Zároveň je třeba nezapomenout na nutné provedení pseudonymizace v souladu s výjimkou uvedenou v § 5a odst. 2. ● Kategorie 3 – Informace, které je možné poskytovat jako otevřená data na základě diskrece povinného subjektu (v souladu s ustanovením § 5 odst. 5 zákona č. 106/1999 Sb., o svobodném přístupu k informacím). Jde tedy o informace, u kterých neexistuje právní povinnost jejich zveřejnění, nebo o informace, které jsou sice zveřejňovány na základě právní povin nosti, ale nejsou vedeny v zákonem založeném, nebo předvídaném registru. Takové informace může povinný subjekt zveřejnit, pokud se tak na základě vlastní diskrece rozhodne. Tyto informace je však nezbytné poskytovat v kvalitě, kterou předepisuje § 4b , která se otevřeným datům přibližuje. ● Kategorie 4 – Informace, které není možné poskytovat jako otevřená data proto, že je jejich poskytování vyloučenou výjimkou uvedenou v § 8a nebo v § 9 -11 zákona č. 106/1999 Sb. , případně jiným zvláštním zákonem.
● Kategorie 5 – Informace, které jsou zcela vyňaty z působnosti zákona 106/1999 Sb ., o svobodném přístupu k informacím. Právní úprava otevřených dat podle tohoto zákona se tak na ně přímo nevztahuje a pro jejich poskytování je třeba se řídit jejich zvláštními právními předpisy. Jde například o informace spadající pod působnost zákona č. 123/1998 Sb., nebo o informace katastru nemovitostí. 7.2 Identifikace konkrétních agend a konkrétních množin údajů K přesnému vymezení veřejných údajů konkrétních agend, aktuálně odpovídajících novelizaci zákona o svobodném přístupu k informacím č. 106/1999 Sb. (viz. 7.1. Nasměrování identifikace veřejných informací k publikaci”, je nutné znát podrobnější informace o samotných agendách a jejich údajích. K získání potřebných informací se nabízí několik způsobů.
● Poskytovatel otevřených dat má dokonalou znalost provozovaných agend a spravovaných údajů agendou, proto dokáže snadno identifikovat všechny veřejné údaje splňující požadavky legislativy (viz. 7.1). ● Poskytovatel otevřených dat prostřednictvím uživatelského rozhraní RPP může v evidenci RPP dohledat všechny potřebné údaje o jím provozovaný ch agendách a spravovaných veřejných údajích. Nutnou podmínkou je ale řádná a úplná evidence údajů v RPP, která ale není v současnosti splněna. Tuto možnost mohou tedy využít pouze ti poskytovatelé, jejichž agendy mají evidenci v RPP v pořádku. Komplikací může být skutečnost, že v RPP zatím schází informace uvedené u rozšířené evidence údajů pro potřebu VDF. Z tohoto pohledu by bylo žádoucí, aby ohlašovatelé agend tuto rozšiřující evidenci doplnili jako první krok při pří pravě

publikace. V opačném případě je nutné posuzovat všechny údaje požadavky legislativy ( viz. 7.1). ● Poskytovatel otevřených dat může dohledat všechny potřebné údaje o jím provozovaných agendách a spravovaných veřejných údajích prostřednictvím publikovaných datových sad s obsahem evidence RPP. Katalogizační záznamy jsou k dispozici v NKOD s využitím klíčového slova “ RPP”, datové sady jsou k dispozici v růz ných formátech včetně uvedení SPARQL Endpointu. I v tomto případě je ale nutnou podmínkou řádná a úplná evidence údajů v RPP, jako u předchozího způsobu. ● Poslední možností je pracné zjišťování a hledání informací o provozovaných agendách u správce ISVS a v legislativě definující agendu. 7.3 Rozdělení a seskupení dat k publikaci do ucelených datových sad.
Nalezené veřejné údaje agendy, které budou předmětem publikace, je nutné seskupit do ucelených a smysluplných datových sad. Při návrhu a vytváření datových sad (a souvisejících Datových specifikací) je vhodné brát v úvahu: ● počet entit s atributy v údajích agend a jejich vzájemné vazby – složité datové sady vedou ke komplikovaným Datovým specifikacím (datovým schématům a konceptuálním modelům), a také k pracnému použití prvků repositáře OFN, ● definice a striktní vymezení tematických oblastí zákonem ustavujícím příslušnou agendu - např. zákon může přesně vymezovat (oddělovat) vedené rejstříky, seznamy a evidence, ● smysluplný kontext – i samostatná datová sada by měla být cíleně použitelná a měla by dávat smysl (nabízí se použití konceptuálního modelování, případně využití již hotových konceptuálních modelů), ● cíl a použití publikované datové sady – vymezuje kořenovou entitu a její atributy, předurčuje jednoduchost / složitost její struktury, ● množství publikovaných atributů – hodně atributů vzniká v důsledku vazeb na jiné objekty (entity), v takových případech je vhodnější údaje rozdělit do několika datových sad (například podle jednotlivých entit) a tím zmenšit datové struktury, a přitom publikovat všechny atributy, ● množství publikovaných dat – obtížnější práce s velkými datovými soubory. Jednoduchá ukázka využití publikovaných datových sad s obsahem RPP ● Pro vyhledání detailů o agendách je možné využít datovou sadu “Agendy” (anotace datové sady: “Agendy evidované v Registru práv a povinností ve smyslu § 51 zákona č. 111/2009 Sb. o základních registrech.”)
● Katalogizační záznam datové sady je dostupný v NKOD prostřednictvím odkazu.

● Pro ukázku práce s datovými sadami jsou použity jejich distribuce ve formátu JSON a jejich vizualizace je provedena v nástroji MS Excel. ● Zobrazení obsahu staženého souboru s datovou sadou a ukázka výběru některých informací například k agendě A 1041 Vnitrozemská plavba:

● Ohlašovatel agendy:
○ orgán-veřejné-moci, IČO 66003008 - Ministerstvo dopravy. ● Vykonavatel agendy:
● orgán-veřejné-moci, IČO 66003008 - Ministerstvo dopravy. ● orgán-veřejné-moci, IČO 00003352 - Státní plavební správa.

● Informace o údajích spravovaných agendou lze například zjistit v datové sadě “ Subjekty a objekty údajů a jejich údaje”, katalogizační záznam v NKOD:

● Ukázka zobrazení obsahu staženého souboru a filtrace údajů pro agendu A1041:

V uvedeném příkladu je zřejmé, že se jedná o jednoduchý rejstřík vedený na základě Zákona č. 114/1995 Sb. o vnitrozemské plavbě, přičemž objekt 1 “Plavidla jiná než malá” je evidován na základě
§ 14 zákona, objekt 2 “Malá plavidla” je evidován dle § 15a. Současně je v odstavci § 14 odst. 2 uvedeno, že plavební rejstřík je veřejný seznam.

Na první pohled je tedy evidentní, že údaje se týkají dvou entit, a tak se nabízí i údaje rozdělit do dvou datových sad: Datová sada 1 “Plavidla jiná než malé”. ● Kořenová entita:
○ Plavidlo jiné než malé. ● Atributy: ○ Vlastník plavidla. ○ Provozovatel plavidla. ○ Poznávací znaky. ○ Jméno lodě. ○ Druh plavidla, oblast jeho provozu na vodní cestě a účel, pro který je plavidlo určeno. ○ Nosnost, dovolený počet cestujících a ostatní základní technické údaje. ○ Zástavní právo k plavidlu. ○ Datum zápisu a výmazu z plavebního rejstříku. Datová sada 2 “Malá plavidla”. ● Kořenová entita:
○ Plavidlo malé. ● Atributy: ○ Vlastník plavidla. ○ Provozovatel plavidla. ○ Poznávací znaky. ○ Druh plavidla, oblast jeho provozu na vodní cestě a účel, pro který je plavidlo určeno. ○ Nosnost, dovolený počet cestujících a ostatní základní technické údaje. ○ Datum zápisu a výmazu z plavebního rejstříku. Bylo by samozřejmě možné publikovat všechny údaje v jedné datové sadě “Plavidla” s jednou kořenovou entitou “plavidlo” a přidáním nového atributu pro rozlišení plavidel, ale mohlo by to zkomplikovat práci s daty. Navíc v tomto případě by to nebylo ani v souladu se Zákonem č. 114/1995 Sb., neboť první datová sada vychází z definice § 14 (Plavební rejstřík), druhá datová sada z § 15a (Rejstřík malých plavidel). Při návrhu datových sad je vždy nutné přistupovat ke každé tematické oblasti individuálně a brát v úvahu již výše uvedená poznámky. 7.4 Příprava a použití prvků repositáře otevřených formálních norem pro publikaci údajů Nutnou podmínkou pro publikaci veřejných údajů do VDF je používání a dodržování konceptu otevřených formálních norem pro každou publikovanou datovou sadu. Prakticky to znamená přípravu Datové specifikace publikované sady s využitím standardizovaných prvků datových schémat dostupných v repositáři OFN. Základním východiskem pro návrh a přípravu Datové specifikace je výsledek rozdělení a seskupení dat k publikaci do ucelených datových sad. Tento výsledek předurčuje složitost a pracnost tvorby Datové specifikace publikované datové sady. Příprava Datové specifikace ve zkratce: ● Základní princip vychází z principu tvorby OFN a spočívá v transformaci konceptu (konceptuálního modelu) do datového modelu pomocí standardizovaných stavebních prvků (sdílených specifikací a základních datových typů) obsažených v repositáři OFN. ● Výchozím stavebním prvkem jsou základní datové typy, pomocí kterých je vytvořen společný předek (Věc) a také jsou základem vytvořených sdílených specifikací. Tyto sdílené specifikace