C2V5.pdf

Type: Document | Status: ready

23

● popis údajů často formou pouhého opakování odkazovaného znění zákona, bez ohledu na informační hodnotu uvedeného textu a řádnou definici údaje, – právní předpisy nejsou koncipovány jako objektově orientovaný popis reality, ● pro potřeby VDF nejsou evidovány jednotlivé údaje, ale skupiny údajů, které jsou označeny jedním názvem, bez samostatné evidence jednotlivých údajů není možné: ○ správně evidovat údaje, jejich kódování číselníky a uvádět odkazy na publikované datové sady, které je obsahují, ○ publikaci údaje do VDF takovým způsobem, aby byly použitelné v dalších agendách i mimo ně, jako veřejně dostupná otevřená data, ○ není to v souladu se zákonem, ● nekonzistence (neúplnost) mezi evidencí údajů a oprávněními k přístupu k údajům, ○ čerpající agendy čerpají údaje, které poskytující agendy nemá v evidenci a k dispozici je pouze identifikátor čerpaného údaje bez dalších informací o údaji, ● neaktuálnost evidovaných údajů (odkazy na neplatnou legislativu). Celkově lze konstatovat: ● podhodnocené ohlašování agend ze strany ohlašovatelů, ● ohlašování agend a evidence údajů neprobíhá dle stanovené metodiky, často prováděné neodborně, ● metodicky není zvládnut přechod ze světa legislativy (definice agend zákonem a dalšími průvodními dokumenty) do světa informatiky a odvození údajů z právních textů, ● dochází k nesouladu údajů evidovaných v RPP a údajů vedených a spravovaných agendovými informačními systémy, ● není dodržovaná zákonná povinnost evidence údajů v RPP ze strany ohlašovatelů agend, ● schází doplnění informací u evidovaných údajů dle novelizace zákona č. 111/2009 Sb. o základních registrech – informace o veřejnosti údaje, kódování číselníkem a uvádění odkazů na příslušné číselníky. 3.3 Kritické faktory evidence Mezi kritické faktory patří především: ● Správná a přesná identifikace všech subjektů a objektů práva v agendách, vycházející z příslušné legislativy a jejich správná evidence v RPP. ● Detailní výčet všech údajů (vlastností) subjektů a objektů práva, vycházející z příslušné legislativy a navázaných dalších relevantních dokumentů, případně získaných z dokumentace agendového informačního systému, a také jejich správná evidence v RPP. ● Správné odvození všech údajů agendy z identifikovaných subjektů a objektů práva a jejich vlastností. ● Udržování konzistence mezi informacemi o evidovaných údajích a jejich aktuálnost. ● Provedení ohlášení agend a evidence údajů přesně dle příslušné metodiky a proškoleným pracovníkem. ● Plnohodnotná informovanost ohlašovatelů agend o zákonné povinnosti evidence údajů agend v RPP dle novelizace zákona č. 111/2009 Sb. o základních registrech. ● Doplnění všech vyžadovaných informací, u již stávajících evidovaných údajů dle novelizace zákona č. 111/2009 Sb. o základních registrech.

24

3.4 Využitelnost stávající evidence údajů v RPP pro návrh datových sad při publikaci do VDF. Aktuální stav evidence údajů naprosté většiny agend v RPP je bohužel takový, že její využití pro návrh datových sad bez doplnění informací z příslušné legislativy není možné.
Lze nalézt agendy, kde evidence subjektů a objektů práva je akceptovatelná, avšak v údajích převažují evidované skupiny údajů, což pro zajištění správné funkcionality VDF je nedostačující.
Aby bylo možné z evidence v RPP vyjít při návrhu datových sad, bude nutné s pomocí legislativy seskupené údaje rozdělit na jednotlivé údaje a pak přistoupit k návrhu datových sad.
K tomu, aby bylo možné navržené datové sady publikovat do VDF, bude ale nezbytné nejdříve správně doplnit evidenci jednotlivých údajů do RPP. Využití stávající evidence v RPP k návrhu datových sad k publikaci brání: ● Kvalita informací evidovaných v RPP o údajích agend. ● Nedostatečný počet agend s evidovanými údaji. ● Neúplnost evidovaných údajů agend. Zdroje zaměřené na publikaci dat do VDF a upravující analýzu agend a evidenci údajů v RPP: ● Metodika definice údajů vedených v agendě. ● Metodika poskytování dat ve veřejném datovém fondu. ● Metodika tvorby a údržby sémantického slovníku pojmů veřejné správy. ● Tento dokument.

25

4 Pracovní rámec pro provedení analýzy agend a návrhu datových sad Pro analýzu agend veřejné správy a návrh datových sad k publikaci do VDF byl připraven úplný pracovní rámec pro přípravu publikace dat do VDF, vycházející z metodik: ● „Metodika definice údajů vedených v agendě“,
● „Metodika tvorby a údržby sémantického slovníku pojmů veřejné správy“ a
● „Metodika poskytování dat ve veřejném datovém fondu“.
Pro zachycení úplného kontextu analýzy agend a návrhu datových sad je do rámce doplněna také oblast publikace údajů do VDF, a také oblast využití výstupu analýz agend pro publikaci otevřených dat mimo VDF. Základní struktura pracovního rámce:

4.1 Analýza agendy a návrh datových sad Oblast se skládá ze dvou částí: „Analýza agendy“ a „Odvození údajů, evidence v RPP a návrh datových sad“. 4.1.1 Analýza agendy

Základem analýzy agendy jsou postupy používané při tvorbě sémantického slovníku agendy, které jsou uvedeny v dokumentu „Metodika definice údajů vedených v agendě“ v části „Provedení analýzy agendových údajů“

26

Základní skupiny činností analýzy agendy: • shromáždění relevantní legislativy,
• vytvoření sémantického slovníku agendy, o vytvoření glosáře agendy, ▪ identifikace základních pojmů,
o vytvoření konceptuálního modelu agendy Detailní úplný popis je uveden v „Metodice definice údajů vedených v agendě“ a „Metodice tvorby a údržby sémantického slovníku pojmů veřejné správy“. Sémantický slovník se skládá z glosáře agendy a konceptuálního modelu agendy. V závislosti na účelu analýzy agendy lze v zásadě rozlišit tři typy analýzy se třemi mírně odlišnými výstupy. Typ 1 - Kompletní (úplná) analýza agendy s využitím konceptuálního modelování.
o Analýza kompletní agendy nebo její části včetně všech navazujících a souvisejících legislativních dokumentů dle „Metodiky pro definici údajů vedených v agendě“. o Předmětem identifikace a následného zpracování jsou tyto pojmy vyskytující se v legislativě analyzované agendy: ▪ Pojmy, které označují subjekty práva.
▪ Pojmy, které označují objekty práva. ▪ Pojmy, které označují vlastnosti. ▪ Pojmy, které označují události nebo činnosti. ▪ Pojmy, které označují vztah mezi subjekty a objekty práva. o Výstupem analýzy je sémantický slovník agendy (glosář agendy, konceptuální model agendy), který slouží jako zdroj pro odvození údajů agendy. o Tento typ analýzy je možné použít na analýzu kompletní agendy, nebo také jenom na její část – vybranou věcnou doménu. o Cílem analýzy je příprava informací pro:
▪ evidenci údajů v RPP,
▪ návrh datových sad,
▪ publikaci údajů celé (nebo vybrané části) agendy. o Ukázky analýzy jsou uvedeny v další části dokumentu: ▪ příklad analýzy celé agendy – agenda „A104 Základní registr – registr práv a povinností“, ▪ příklad analýzy části agendy – agenda „A998 Agenda o podmínkách provozu vozidel na pozemních komunikacích“, část „Registr silničních vozidel“.
Typ 2 - Identifikace subjektů a objektů práva (nejčastější obsah registrů, seznamů, …). o Předmětem analýzy je identifikace subjektů a objektů práva, které jsou agendou evidovány a spravovány v registrech, seznamech, rejstřících, … o Pro identifikaci subjektů a objektů práva není nutný konceptuální model agendy ani její úplný glosář. Vytvořený neúplný glosář je pojmenován jako „glosář pojmů registrů a seznamů“ na základě předmětu analýzy. Legislativa slouží pouze pro identifikaci souvisejících pojmů a upřesnění evidovaných údajů. o Pro tento typ analýzy je dostačující zjednodušená verze postupů popsaných v „Metodice

27

definice údajů vedených v agendě“. Zjednodušený postup je uveden v kapitole „Identifikace subjektů a objektů práva“.
o Předmětem identifikace a následného zpracování jsou tyto pojmy vyskytující se v legislativě analyzované agendy: ▪ Pojmy, které označují subjekty práva. ▪ Pojmy, které označují objekty práva. ▪ Pojmy, které označují vlastnosti. ▪ Pojmy, které označují vztah (roli) mezi subjekty a objekty práva. o Výstupem je vytvořený glosář pojmů registrů a seznamů. o Cílem analýzy je příprava informací pro:
▪ evidenci údajů v RPP,
▪ návrh datových sad, ▪ publikaci registrů a seznamů (údajů vybraných subjektů nebo objektů práva). o Ukázka tohoto typu analýzy je uvedena v další části dokumentu: ▪ příklad analýzy – agenda „A1041 Vnitrozemská plavba“. Typ 3 – Identifikace agendových číselníků o Předmětem analýzy je identifikace vlastností subjektů a objektů práva, které jsou vyjádřeny hodnotou danou číselníkem. o Obvykle se bude jednat o agendy s neveřejnými údaji, které zavádí a spravují číselníky, neboť u agend s veřejnými údaji je identifikace číselníků součástí analýzy typu 2. o Pro identifikaci subjektů a objektů práva není nutný konceptuální model agendy ani její úplný glosář. Vytvořený neúplný glosář je pojmenován jako „glosář pojmů číselníků“ na základě předmětu analýzy. Legislativa slouží pouze pro identifikaci souvisejících pojmů a upřesnění spravovaných údajů číselníky. o Předmětem identifikace a následného zpracování jsou dále uvedené pojmy vyskytující se v legislativě analyzované agendy: ▪ Pojmy, které označují subjekty práva. ▪ Pojmy, které označují objekty práva. ▪ Pojmy, které označují vlastnosti kódované číselníky. o Výstupem je vytvořený glosář pojmů číselníku. o Cílem analýzy je příprava informací pro:
▪ pro evidenci číselníků v RPP,
▪ návrh obsahu číselníků,
▪ návrh datových sad dle příslušné otevřené formální normy (dále OFN), ▪ publikaci vybraných číselníků. o Ukázka tohoto typu analýzy je uvedena v další části dokumentu: ▪ příklad analýzy – agenda „A101 Základní registr – registr obyvatel“.

28

4.1.2 Odvození údajů, evidence v RPP a návrh datových sad

4.1.2.1 Odvození údajů V této části se na základě výstupů analýz agend odvozují údaje pro jejich evidenci v RPP, navrhují datové sady a jejich schémata k publikaci do VDF. Způsob odvození údajů se mírně liší v závislosti na použitém typu předcházející analýzy agendy. Analýza agendy typu 1 ● Vstupem pro odvození údajů je sémantický slovník agendy (glosář agendy, konceptuální model agendy). ● Odvození údajů se provádí dle postupů uvedených v dokumentu „Metodika definice údajů vedených v agendě“ v části „Odvození evidence údajů agendy“.
● Odvození údajů je možné i částečně automatizovat na základě vytvořeného konceptuálního modelu s využitím vhodných sw nástrojů. Analýzy agendy typu 2 a 3 ● Odvození údajů využívá některé postupy uvedené v dokumentu „Metodika definice údajů vedených v agendě“ v části „Odvození evidence údajů agendy“, ale zjednodušeným způsobem. Odvození údajů nevychází z úplné analýzy agendy, ale pouze z vytvořených zjednodušených glosářů pojmů: ○ glosář pojmů registrů a seznamů, nebo ○ glosář pojmů číselníku. ● Zjednodušený postup odvození údajů pro typy analýzy 2 a 3 je uveden u příkladu analýzy agendy „A1041 Vnitrozemská plavba“. 4.1.2.2 Evidence / doplnění údajů v RPP:
Způsoby evidence, případně doplnění stávající evidence údajů agend v RPP jsou upraveny dokumenty dostupnými na stránkách Správy základních registrů. Při realizaci tohoto kroku je nutné respektovat novelizaci zákona č. 111/2009 Sb. o základních registrech a z ní vyplývající aktuální úpravy RPP související s implementací VDF. Úpravy zavádí dodatečné povinnosti ohledně zadávání dalších metadat evidovaných údajů a jsou popsány v dokumentu „Metodika definice údajů vedených v agendě“ v části „Odvození evidence údajů agendy“ v odstavci 6. 4.1.2.3 Návrh datových sad a jejich schémat pro publikaci do VDF Návrh datových sad je shodný pro všechny typy analýz agend, neboť vstupem pro jejich návrh jsou evidované

29

údaje v RPP.
Přístup vychází z požadavku zajištění funkcionality VDF, která se opírá o komplex informací zachycený v “mapě údajů veřejné správy”. Ta je vytvářena propojením údajů evidovaných v RPP a údajů evidovaných v NKOD. RPP obsahuje informace o agendách a jejich údajích, NKOD obsahuje informace o datových sadách, ve kterých jsou veřejné údaje publikovány. Protože publikace datových sad vyžaduje správnou identifikaci (a také evidenci) údajů v RPP, nabízí se návrh datových sad provádět až na základě údajů již evidovaných v RPP.

Výchozím zdrojem pro návrh datových sad je tedy evidence údajů v RPP, případně, v případě typu analýz 1, konceptuální model agendy za předpokladu využití specializovaného sw pro vytváření datových struktur přímým odvozením z tohoto modelu. I v tomto případě ale pouze za splnění správné evidence údajů v RPP. Návrh datových sad a jejich schémat je již předmětem informatiky, proto je nutné přejít k standardním informatickým termínům a ukázat souvislosti mezi entitami, subjekty, objekty a atributy.

  1. Entita je základním pojmem při popisu reálného světa a práci s informacemi o něm.
  2. RPP používá pro označení entit při evidenci údajů poskytovaných agendou pojem „Objekty/subjekty“. Ve veřejné správě a obecně v právu jsou používány dva základní typy entit: ○ subjekty práva
    ○ objekty práva.
  3. V rámci výkonu veřejné správy se o jednotlivých instancích těchto entit (subjektů a objektů) vedou informace, evidují se a případně vyměňují.
  4. Atributy popisují vlastnosti entit
  5. Mezi jednotlivými entitami mohou být definovány vzájemné vztahy – relace. Relace mohou vyjadřovat například vztahy vlastnické či příbuzenské nebo přiznání určitého práva či zavázání povinností. Postup návrhu datových sad na základě evidence v RPP:

30

Návrh (rozdělení) datových sad je velmi individuální pro každý úřad a je nezbytně k tomu nutná doménová znalost problematiky. Někdy to mohou být všechny informace o jednom subjektu nebo objektu, nebo několika subjektů a objektů, nebo pouze část informací jednoho subjektu nebo objektu, pokud jsou informace rozprostřené ve více systémech (architektura VDF předpokládá, že každý informační systém bude mít svůj vlastní lokální katalog, vlastní úložiště, vlastní systém pro publikaci, a z toho vyplývá, že publikace datové sady bude samostatnou záležitostí každého systému), někdy je rozhodující logická smysluplnost publikovaných údajů, apod. Postup návrhu: ● Získání informací o evidovaných subjektech a objektech práva agendy v RPP a o všech jejich evidovaných údajích. ● Návrh významových kontextů/konceptů (vymezení domén a následně jednotlivých datových sad). Zvažovaná hlediska: ○ počet entit (subjektů a objektů práva) s atributy v údajích agend a jejich vzájemné vazby – složité datové sady vedou ke komplikovaným datovým schématům a konceptuálním modelům, ○ definice a striktní vymezení tematických oblastí zákonem, ustavujícím příslušnou agendu - např. zákon může přesně vymezovat (oddělovat) vedené rejstříky, seznamy a evidence, ○ smysluplný kontext – i samostatná datová sada by měla být cíleně použitelná a měla by dávat smysl (nabízí se použití konceptuálního modelování, případně využití již hotových konceptuálních modelů), ○ cíl a použití publikované datové sady – vymezuje kořenovou entitu a její atributy, předurčuje jednoduchost / složitost její struktury, ○ místo (ISVS) evidence a správy informací o subjektech a objektech práva agendy, neboť v případě rozprostření informací mezi více ISVS je nutné mít na paměti, že publikace datových sad je vždy zajišťována ISVS, který dotčené informace spravuje, což znamená, že publikace datové sady s informacemi z více ISVS by byla komplikovaná, ○ množství publikovaných atributů – hodně atributů vzniká v důsledku vazeb na jiné objekty (entity), v takových případech je vhodnější údaje rozdělit do několika datových sad (například podle jednotlivých entit) a tím zmenšit datové struktury, a přitom publikovat všechny atributy, ○ množství publikovaných dat – obtížnější práce s velkými datovými soubory. ● Vytvoření seznamu navržených datových sad a jejich popis, dle vymezených významových kontextů/konceptů. ● Transformace entit (subjektů a objektů práva) a jejich atributů do datové podoby
○ Pro každou navrženou datovou sadu: ■ Identifikace a příprava kořenové entity: ● určení kořenové entity připraveného konceptu (schématu) - určuje téma datové sady, ● kořenová entita bude většinou vycházet ze subjektů nebo objektů práva agendy, jejíž veřejná data budou publikována, ● ošetření kořenové entity prostřednictvím sdílené specifikace "věc", ● označení položek, které jsou atributy kořenové entity, ● ošetření atributů základními datovými typy z Repositáře OFN. ■ Příprava zbývajících položek konceptu: