C2V4.pdf

Type: Document | Status: ready

103

a každý prvek speciálního prvku je také prvkem specializovaného). 9.7.2 Konceptuální model. ● Konceptuální model je zcela obecný a základní pojmový model, nezávislý na jakékoliv potenciální implementaci jeho obsahu. ● Konceptuální model je vyjádřen v grafické podobě diagramu. ● Vzniká na základě pojmů definovaných slovníkem a tyto pojmy propojuje významovými vazbami (vztahy), které zachycují klíčové vazby v analyzované doméně. ● Doplňuje význam pojmů zachycených v glosáři o kontexty, ve kterých se modelované pojmy v analyzované doméně vyskytují. ● Věcné (sémantické) souvislosti mezi pojmy doplňuje následujícím způsobem: o klasifikuje pojmy glosáře do typů (např. „typ subjektu“, …), o přiřazuje typy vlastností k ostatním typům, o přiřazuje typy vztahů k typům, které se vztahu účastní, o přiřazuje typy událostí a činností k typům, které se jich týkají, o propojuje typy pomocí obecných pojmenovaných vzájemných asociací k zachycení souvislostí, které nejsou takového významu, aby byly modelovány jako typy vztahů, o určuje specializační vazby, které modelují, že určitý typ je speciálnější než jiný typ, o přiřazuje typy subjektů k typům rolí. Ukázka specializace (hierarchie) pojmů.

9.7.3 Sémantický slovník Komplet slovníku pojmů (s jejich významy) a souvisejícího konceptuálního modelu (s vazbami mezi pojmy a zachycenými kontexty) představuje sémantický slovník. Není přitom nutné nejprve vytvořit úplný glosář a teprve potom přistoupit k tvorbě konceptuálního modelu. Glosář lze opakovaně rozšiřovat o nové pojmy. Sémantický slovník pojmů veřejné správy (SSP) je tvořen všemi slovníky pojmů a všemi konceptuálními modely veřejné správy. Jeho prohlížení, vytváření a využití je dostupné prostřednictvím odkazu https://slovník.gov.cz. Struktura slovníků vzniká postupně (inkrementálním způsobem) s každou analyzovanou agendou, nebo její částí, věcnou doménou a také s každou publikovanou datovou sadou. Což znamená, že například pro každou agendu

104

(analyzovanou věcnou doménu, datovou sadu) musí být vytvořen vlastní sémantický slovník agendy, který sestává ze sémantických slovníků jednotlivých AIS, které agendu podporují, a propojuje je do jednoho uceleného slovníku agendy. Sémantické slovníky agend jsou pak propojeny do sémantického slovníku úřadu/resortu. Sémantické slovníky úřadů/resortů společně tvoří propojený sémantický slovník pojmů celé veřejné správy. Struktura sémantického slovníku: ● Základní slovník (Z-SGoV) o Základní sémantický slovník pojmů definuje modelovací jazyk, který je používán pro tvorbu konceptuálních modelů a především součástí Sémantického slovníku pojmů. ● Slovník veřejného sektoru (V-SGoV) o Sémantický slovník pojmů veřejného sektoru (V-SGoV) zavádí konsensuální pojmosloví používané napříč veřejnou správou zejména v oblasti základních pojmů teorie práva, struktury dat a jejich evidence. ● Doménové slovníky o Doménový sémantický slovník může např. definovat pojmy z daného zákona, rozšiřovat sémantický slovník pojmů daného zákona o pojmy používané v dané agendě, nebo zavést technické pojmy používané v kontextu daného AIS nebo datové sady v samostatném slovníku. o Při tvorbě doménových sémantických slovníků je nutné postupovat podle Metodiky tvorby a údržby sémantických slovníků veřejné správy. o Výchozí sémantické slovníky: ▪ generický sémantický slovník pojmů veřejného sektoru – zavádí konsensuální pojmosloví používané napříč veřejnou správou zejména v oblasti základních pojmů teorie práva, struktury dat a jejich evidence, ▪ např.: subjekt práva, objekt práva, právní vztah, číselník, evidenční systém, ▪ sémantický slovník pojmů základních registrů – zavádí pojmosloví základních registrů, které není specifické pro jeden konkrétní základní registr, ▪ např.: osoba, fyzická osoba, ▪ sémantický slovník pojmů registru osob – zavádí pojmosloví specifické pro registr osob, ▪ např.: osoba v registru osob, právnická osoba, podnikající fyzická osoba, ▪ sémantický slovník pojmů registru obyvatel – zavádí pojmosloví specifické pro registr obyvatel, ▪ např.: subjekt údajů vedený v registru obyvatel, ▪ sémantický slovník pojmů registru práv a povinností – zavádí pojmosloví specifické pro registr práv a povinností, ▪ např.: orgán veřejné moci, soukromoprávní uživatel údajů, agenda, činnost, služba, ▪ sémantický slovník pojmů registru územních identifikátorů, adres a nemovitostí – zavádí pojmosloví specifické pro registr územních identifikátorů, adres a nemovitostí, ▪ např.: územní prvek. Význam a výhody sémantického slovníku: ● zajišťuje podmínky: o pro sdílení významu pojmů v rámci veřejné správy ČR, o automatické vytváření výkladových slovníků,

105

o k zajištění sémantické interoperability agendových informačních systémů v rámci propojeného datového fondu (PPDF) veřejné správy a veřejného datového fondu (VDF), o k zajištění interoperability publikovaných otevřených dat veřejné správy, ● zvyšuje kvalitu popisu otevřených datových sad: o přispívá k omezení duplicit v pojmenovávání stejných prvků různými jmény, nebo různých prvků stejnými jmény, o umožňuje propojování souvisejících atributů dvou (dosud nepropojených) datových sad významovou vazbou, ● zjednodušuje přípravu a návrh publikovaných otevřených dat, o sjednocuje způsob modelování jednotlivých datových sad, o zjednodušuje modelování jednotlivých datových sad prostřednictvím již vytvořených konceptuálních modelů v sémantickém slovníku, o podporuje tvorbu datových schémat založenou na používání Otevřených formálních norem, o automatické generování datových schémat otevřených dat, ● zajišťuje podmínky pro nové funkcionality NKOD založené na významovém propojení obsahu publikovaných otevřených dat (vyhledávání vzájemných významových souvislostí mezi datovými sadami, schématy a rozhraními), ● zjednodušuje evidenci údajů subjektů a objektů práva při ohlašování agendy v Registru práv a povinností, a to včetně přesné specifikace významu s odkazem na legislativu, a také identifikováním a zachycením významových vazeb na další pojmy. 9.7.4 Analýza agendy a odvození údajů V rámci analýzy je nutné identifikovat a popsat nejen samotné údaje potřebné v agendě, ale také subjekty práva, které v agendě vystupují v agendových rolích (kontextech), a objekty práva, které jsou předmětem práv nebo povinností těchto subjektů práva. Identifikované subjekty práva ve svých agendových rolích, objekty práva a údaje potřebné v agendě o těchto subjektech a objektech práva pak musí ohlašovatel agendy, s případnou podporou správce agendového informačního systému, ohlásit do registru práv a povinností (RPP). V rámci analýzy je vytvořen tzv. sémantický slovník pojmů agendy. Pro každou agendu musí být vytvořen vlastní sémantický slovník agendy, který sestává ze sémantických slovníků jednotlivých AIS, které agendu podporují, a propojuje je do jednoho uceleného slovníku agendy. Jako vstupy pro analýzu slouží legislativní předpisy (tj. zákony, prováděcí vyhlášky, nařízení atd.) definující agendu a AIS, které agendu podporují. Výstupem analýzy je sémantický slovník pojmů agendy, ve kterém jsou identifikovány subjekty a objekty práva, jejich agendové role a agendové údaje připravené pro evidenci v registru práv a povinností. Celá problematika analýzy agendy je detailně vysvětlena v doplňujících zdrojích.

106

9.7.5 Doplnění entit, atributů a vazeb mezi entitami dle datové sady Zařazení (specializace) nového pojmu (entity – subjektu/objektu). ● Postupné procházení hierarchické struktury SSP až do nalezení významově nejbližšího pojmu. ● Specifikace názvu nového pojmu dle Metodiky. ● Zavedení (specializace) nového pojmu v Termitu. ● Vyplnění všech potřebných souvisejících náležitostí. ● Zobrazení všech zděděných atributů a vazeb zavedeného pojmu (zobrazení kontextu pojmu). ● Doplnění nových atributů a jejich specifikací. ● Doplnění nových vazeb. 9.7.6 Správa Sémantického slovníku veřejné správy.
Správcem Úložiště konceptuálních modelů je DIA, která je také správcem a věcným garantem ontologie veřejné správy. Konceptuální modely kontextů vypracovávají ohlašovatelé agend a ukládají je do Úložiště konceptuálních modelů. DIA, Odbor hlavního architekta eGovernmentu pro tvorbu konceptuálních modelů poskytuje volně dostupný nástroj pro konceptuální modelování kontextů a také udržuje Metodiku konceptuálního modelování kontextů. Kontroluje požadovanou kvalitu konceptuálních modelů dodaných do Úložiště konceptuálních modelů. jejich vazeb na evidenci definic údajů v RPP, v případě zjištěných nedostatků vyžaduje jejich nápravu ze strany ohlašovatelů agend. 9.7.7 Podpora nástroji Sémantické slovníky lze realizovat dvěma základními způsoby: ● Nezávisle na existenci a správě Sémantického slovníku pojmů veřejné správy (SSP), což znamená bez naplnění cíle harmonizace významů pojmů veřejné správy, a bez zajištění sémantické interoperability otevřených dat, a to: o stylem „tužka/papír“, tedy bez jakýchkoliv technických prostředků, nebo o s pomocí libovolného nástroje pro konceptuální datové modelování (např. volně dostupný PlantUML nebo komerční Enterprise Architect). o V případě takto připravených slovníků pojmů je nutné, aby poskytovatel datových sad je veřejně zpřístupnil k zajištění sémantiky publikovaných dat. o Pojmy obsažené v těchto slovíncích ale nebudou součástí (ani konzistentní) se slovníkem pojmů veřejné správy SSP. ● V plně integrovaném a konzistentním prostředí sémantického slovníku pojmů veřejné správy (SSP). V tomto případě je základní sémantický slovník pojmů SSP postupně rozšiřován a doplňován o nové pojmy s každým novým konceptuálním modelem publikované datové sady nebo analyzované agendy. Stávající pojmy jsou sdíleny, a navíc případně uváděny do nových souvislostí (kontextů) vyplývajících z každé nově modelované oblasti.
Uvedený postup je uveden pouze pro přiblížení problematiky, reálné postupy se budou záviset na výsledku zavedení modelovacích nástrojů do běžného užívání. Aktuálně jsou k dispozici pouze prototypy nástrojů, která vyžadují absolvování k tomu určených školení.

107

o Tento způsob tvorby sémantického slovníku je již ale nutné provádět s vhodnou podporou k tomu určených a volně dostupných nástrojů (zatím ve verzí prototypů), které jsou připraveny agenturou DIA.
o Nástroje podporují postupy uvedené v příslušných metodikách a umožňují vytvářet sémantický slovník pojmů v podobě, která je dále strojově zpracovatelná. o Připravené nástroje: ▪ Termit – tvorba slovníků pojmů, nástroj pro správu odborného pojmosloví a jeho propojení na legislativu, ▪ Ontographer – tvorba konceptuálních modelů, nástroj pro správu konceptuálních modelů využívajících vytvořené pojmosloví, ▪ Dataspecer – nástroj pro automatizovanou tvorbu datových specifikací a OFN přímo z vytvořených konceptuálních modelů, ▪ ShowIT – webový prohlížeč a vyhledávač pojmů v sémantickém slovníku pojmů (SSP). o Aktuálně jsou k dispozici pouze zcela funkční a použitelné prototypy nástrojů, ale pro práci s nimi je vhodné absolvovat příslušná školení a seznámení se s Metodikou tvorby a údržby sémantického slovníku veřejné správy. o Po zavedení prototypů nástrojů do běžného užívání budou připraveny ze strany DIA návody a doporučení pro všechny připravené nástroje. 9.7.8 Doplňující zdroje ● Koncepce sémantického slovníku pojmů pro potřeby konceptuálního datového modelování agend. ● Metodika tvorby a údržby sémantického slovníku veřejné správy. ● Metodika definice údajů vedených v agendě. ● Definice scénářů využití konceptuálních modelů. ● Návrh a prototypování výrobní linky pro tvorbu a údržbu konceptuálních modelů agend. ● Ověření prototypu výrobní linky v podobě vytvoření konceptuálních modelů vybraných agend. ● Analýza existujících informačních systémů veřejné správy vč. jejich příslušné legislativy a identifikace datových sad pro veřejný datový fond. Příloha. 9.8 Katalogizační záznam. 9.8.1 Metadata záznamu datové sady a pravidla pro jejich vyplňování. Příklad katalogizačního záznamu datové sady v NKOD

108

Seznam jednotlivých položek katalogizačního záznamu: ● Název datové sady (povinný atribut). o Krátký název datové sady, ze kterého je zřejmé, co je obsahem datové sady. o V názvu je vhodné použít i název publikující organizace. o Název by měl být optimálně (max.) v rozsahu jednoho řádku textu. ● Popis datové sady (povinný atribut). o Delší text, který detailněji popisuje, co je obsahem datové sady. o Pokud je pro správné pochopení nutné, je vhodné uvést i o čem data nevypovídají. o Optimální velikost textu max. v rozsahu jednoho odstavce do 10 řádků. ● Téma datové sady (povinný atribut). o Povinně: Výběr tématu z evropského číselníku datových témat, které datovou sadu nejlépe vystihuje. o Volitelně také pojmy ze sémantického slovníku pojmů ● Periodicita aktualizace (povinný atribut). o Výběr periodicity aktualizace datových zdrojů (publikace nových nebo aktualizace obsahu již publikovaných distribucí). Např. při výběru týdenní periodicity to znamená, že každý týden bude přidán nový datový zdroj nebo aktualizován obsah již publikovaného datového zdroje. o Periodicita aktualizace se vyplňuje dle EU slovníku pro frekvence. Příklady možností: ▪ Denně ▪ Týdně ▪ Měsíčně ▪ Čtvrtletně ▪ Pololetně ▪ Ročně ▪ Nikdy / jednorázová publikace ▪ Nepravidelně ● Klíčová slova (povinný atribut). o Jedno nebo více libovolných klíčových slov, které charakterizují obsah datové sady. ● Související geografické území (povinný atribut). o Výběr geografického území, kterého se datová sada týká. Může to být např.: ▪ území, které by datová sada pokrývala, pokud by byla zobrazena na mapě,

109

▪ správní území orgánu veřejné správy, který datovou sadu publikuje (v případě, že by zobrazení na mapě nedávalo smysl). o K identifikaci geografického území lze využít identifikátory RÚIAN, např.: ▪ Datová sada s veřejnými parkovišti na území obce má jako související geografickou oblast přiřazenou obec (pokud by se parkoviště zobrazily na mapě, rozprostíraly by se na území obce). ▪ Datová sada s rozpočtem krajského úřadu má jako související geografickou oblast přiřazeno území vyššího samosprávného celku, tj. kraje (rozpočet nedává smysl zobrazovat na mapě, vhodnější formou je správní území kraje). o K identifikaci se používá se dvojice hodnot: ▪ typ prvku RÚIAN (Území obce, Území státu), ▪ kód prvku RÚIAN (Praha (554782), Česká republika (1)). ● Dotčené časové období (doporučený atribut). o Časové období (datum od, případně do), které je pokryto obsahem datové sady. o Vyplňuje se pouze, pokud to dává smysl, např.: ▪ Datová sada s demografickými údaji za posledních 5 let v jednotlivých letech může mít nastaven „datum od“ (1.1. prvního roku) a „datum do“ (31.12. posledního roku), konkrétně například 2010-01-01 a 2014-12-31 ▪ Datová sada s odtaženými auty může mít nastaven jako „datum od“ datum, od kdy je evidence vedena, „datum do“ nastaven nemá, protože se jedná o aktuální datum a evidence je průběžně aktualizována. ▪ Datová sada s aktuální polohou dopravních spojů nemá nastaven „datum od“ ani „datum do“, neboť je zveřejňován vždy aktuální stav. ● Jméno Kurátora dat (doporučený atribut). o Jméno konkrétní osoby nebo název útvaru organizace, který je Kurátorem dat pro danou datovou sadu. ● Email Kurátora dat (doporučený atribut). o Kontaktní email Kurátora dat, může být i jednotný pro celou organizaci. ● Odkaz na dokumentaci datové sady (doporučený atribut). o Odkaz na dokument, který je určený pro použití lidmi, a který popisuje obsah datové sady a také vysvětluje jeho správné použití/interpretaci. ● Klasifikace dle EUROVOC (doporučený atribut). o Vybrané koncepty z taxonomie EUROVOC. Tezaurus EUROVOC obsahuje koncepty, jejichž názvy (pojmy, termíny) jsou udržovány ve všech jazycích Evropské unie, a je proto vhodný pro klasifikaci datových sad. o Měl by být vybraný vždy alespoň jeden koncept charakterizující obsah datové sady. o Způsob vyhledání a použití EUROVOC konceptu je uveden na POD. ● Odkaz na specifikaci. o Odkaz na specifikaci, jíž se datová sada řídí. Takovou specifikací jsou zejména Otevřené formální normy.