C5V2.pdf

Type: Document | Status: ready

který se účastní tohoto typu vztahu , ● je vlastností - propojuje typ vlastnosti s typem objektu nebo typu události, na kterém je typ vlastnosti závislý, ● specializační vazba (šipka s prázdnou trojúhelníkovou hlavou) vede mezi prvky stejného geometrického tvaru (z typu objektu do typu objektu, apod.) a propojuje pojem s jeho generalizací, ● má účastníka - propojuje typ události s typy objektu, které se typu události účastní. Ke všem uvedeným vazbám existuje i symetrická vazba, např. k vazbě je vlastností existuje symetrická vazba má vlastnost. Pro všechny typy vazeb kromě vazby specializační je možné up řesnit pomocí tzv. kardinalit, kolik prvků může na každé straně do vazby vstupovat. Kardinalita má tvar X..Y, kde X je nula nebo přirozené číslo a Y ≥ X je buď přirozené číslo, nebo symbol * (s významem neomezeně). Číslo X značí minimální počet prvků na da né straně vazby a Y značí maximální počet. Je -li X=Y, potom se zápis zkracuje z X..Y pouze na X.
Typické kombinace X a Y jsou: ● 0..1 - prvek daného typu je ve vazbě přítomný nejvýše jednou, ● 1 - prvek daného typu je ve vazbě přítomný právě jednou, ● 0..* - prvek daného typu je ve vazbě přítomný libovolně krát (i vůbec), ● 1..* - prvek daného typu je ve vazbě přítomný alespoň jednou.

Příklad konceptuálního modelu

Tento příklad používá pojmy z ukázkového tezauru výše a propojuje je pomocí významových vazeb. ● Pojmy stavba, budova a adresa jsou v konceptuálním modelu klasifikovány jako typy objektů (obdelníky). ● Pojmy ulice a číslo popisné jsou klasifikovány jako typy vlastností (elipsy) a jsou připojeny k typu objektu adresa pomocí vazeb je vlastností. Model vyjadřuje, že ulice a číslo popisné jsou vlastnostmi budov. ● Pojem má adresu je klasifikován jako typ vztahu (kosočtverec) a je připojen k typům objektů budova a adresa. Model vyjadřuje, že pro budovy mohou mít přiřazeny adresy. ● Typ objektu budova specializuje typ objektu stavba. Tím je vyjádřeno, že význam pojmu budova je speciálnější (užší) než význam pojmu stavba. Jinými slovy, každá budova je stavbou, ale jen některé stavby jsou budovou.

Kardinality např. určují, že budova může a nemusí mít adresu, má ale nejvý še jednu. Podobně se na adrese může nacházet jedna nebo více budov, nemusí se tam ale nacházet žádná. Také určují, že každá adresa má právě jedno číslo popisné.

Příklad konceptuálního modelu v kompaktním zobrazení

Pro předchozí příklad je možné použít kompaktní zobrazení tak, jak je znázorněno na tomto diagramu.

Kompaktní zobrazení je přehledné, neumožňuje však vytvářet některé typy vazeb (např. specializační vazby mezi typy vztahů a typy vlastností). Přesto, z důvodů jednoduchosti použití jsme první metodický postup pro tvorbu konceptuálních modelů zaměřili na modely v kompaktním zobrazení, tak jak je popsáno ve výstupu C5V4 - Metodika tvorby a údržby konceptuálních datových modelů agend.
4.2.3. Mapování na stávající doménové slovníky Mapování umožňuje přeložit pojem slovníku do jiného externího slovníku, a to mimo ekosystém SGoV - jedná se zejména o evropské a světové organizace používající již dříve standardizované slovníky. Mapování pojmů se provádí stejným způsobem, jako se vytváří vztahy mezi pojmy jednoho slovníku.
4.3. Základní slovník (Z-SGoV) Tato sekce upravuje a rozšiřuje sekci 3.3 Koncepce sémantického slovníku pojmů, výstup projektu Implementace strategií v oblasti otevřených dat II, CZ.03.4.74/0.0/0.0/15_025/0004172 . Základní sémantický slovník pojmů definuje modelovací jazyk, který je používán pro tvorbu konceptuálních modelů a především součástí Sémantického slovníku pojmů. Základní slovník je založen na části základních ontologií Unified Foundational Ontology (UFO),které popisují klíčové oblasti znalostního popisu reálného světa. Pro účely SGoV tato koncepce přejímá a zjednodušuje některé části ontologií UFO v české verzi: ● UFO-A - sloužící k popisu statických strukturálních modelů - objektů, vlastností, vztahů, atp., viz Ontological foundations for structural conceptual models, 2005, ● UFO-B - sloužící k popisu časově proměnných údajů - událostí, stavů objektů, atp. viz Representing the UFO-B Foundational Ontology of Events in SROIQ, 2017, ● UFO-MLT - popisující modelování typů - typů objektů, událostí, atp. viz Extending the Foundations of Ontology-based Conceptual Modeling with a Multi-Level Theory, 2015. Kromě této široké škály modelů pro jednotlivé klíčové oblasti lidské kognice byly ontologie UFO vybrány z těchto důvodů: ● jsou z velké části kompatibilní s ostatními základními ontologiemi, např. DOLCE, či BFO, jsou však lépe dokumentovány v aktuální odborné literatuře.
● nad ontologií UFO-A byl vystavěn jazyk OntoUML, který je popsaný v Ontological foundations for structural conceptual models, 2005. Základní slovník v představené podobě je výběrem konstruktů ontologií rodiny UFO. Některé části ontologií UFO nejsou do slovníku zahrnuty, neboť by zvýšily složitost popisu, aniž by poskytly zřejmé výhody vzhledem k použitím v oblasti otevřených dat. Slovník je plně kompatibilní s ontologiemi UFO, což do budoucna zajišťuje možnost jeho dalšího rozšiřování.
Příklady pojmů zavedených v základním slovníku jsou objekt, vztah, vlastnost, či událost - jejich definice a podrobnější výčet dalších pojmů základního slovníku lze nalézt v kapitole Příloha 1: Tezaurus základního slovníku. Úplnou definici základního slovníku lze nalézt ve

strojově čitelné podobě v repozitáři na Githubu.
Pojmy v základním slovníku slouží jako základní ka tegorie pro tvorbu pojmů speciálnějších. Např. při zavádění pojmu stavba, se tento pojem vyjádří jako speciální případ objektu. Uvedené příklady pojmů nejsou samoúčelné - pomáhají si uvědomit význam daného pojmu. Pokud bychom zavedli pojem stavba jako proces, na jehož konci vzniká stavba jako objekt, identifikovali bychom jej naopak jako speciální případ události.
Konceptuální model základního slovníku umožňuje reprezentovat objekty a jejich závislé vlastnosti/vztahy. Všechny proměnné prvky mohou být měněn y, vytvářeny či destruovány událostmi, které mají časové a prostorové určení a definují jednotlivé okamžité stavy těchto proměnných prvků. Ukázka základních vazeb mezi pojmy základního slovníku je vidět na tomto diagramu:

Diagram ukazuje několik grafických tvarů. Obdélníky s čárkovaným okrajem označují obecné prvky bez bližší kategorizace. Objekty (Objekt a jeho specializace) označujeme obdélníkem s plným okrajem, vztahy (Vztah a jeho specializace) označujeme kosočtvercem, vlastnosti (Vlastnost a její specializace) elipsou a události (Událost a její specializace) označujeme lichoběžníkem. Jedná se o grafický jazyk, který maximálně využívá označování v konceptuálních modelech (např. E-R diagramech).
Důležitou roli hrají typy - jedná se o proměnné p rvky, které lze použít pro označování/kategorizaci jiných proměnných či neměnných prvků. Pro čtyři klíčové pojmy základního slovníku - objekty, vztahy, vlastnosti a události - využíváme jejich typy jako základní kategorie pro tvorbu konceptuálních modelů:

4.4. Slovník veřejného sektoru (V-SGoV) Sémantický slovník pojmů veřejného sektoru (V -SGoV) zavádí konsensuální pojmosloví používané napříč veřejnou správou zejména v oblasti základních pojmů teorie práva, struktury dat a jejich evidence. Jedná se o některé společné pojmy, které nejsou legislativně ukotveny, mají však široce přijímaný význam, např. pojem Člověk, Organizace, Dokument, atp. Jistá dvojakost je ve V-SGoV způsobena tím, že některé z pojmů teorie práva V-SGoV mají stejný název jako legislativní pojmy. Příkladem budiž pojem Fyzická osoba, který je součástí V-SGoV (viz např. Subjekty, objekty a obsah právních vztahů), a rovněž součástí slovníku zákona 89/2012. Zatímco v prvním případě se jedná o konsensuální pojem právní teorie (a tedy nezávislý na změnách legislativy), ve druhém případě se jedná o význam striktně vázaný na příslušný právní předpis. Struktura dat a evidence je popsána pojmy, které jsou třeba k popisu datových sad, slovníků, registrů, rejstříků a jejich vazby na ostatní části SGoV. Jejic h definice a podrobnější výčet dalších pojmů V-SGoV lze nalézt v kapitole Příloha 2: Tezaurus slovníku veřejného sektoru.

Následující diagram znázorňuje strukturu ontologického modelu veřejného sektoru pojmů z oblasti teorie práva jako základního slovníku. Ústředním pojmem je zde právní vztah, který vytváří vztah mezi subjektem práva a objektem práva.

Pro popis evidencí (datových sad evidujících datové položky o proměnných prvcích jediného typu) zavádíme pojem Evidenční systém, který eviduje tyto proměnné prvky jako položky evidenčního systému :

Strukturu právních předpisů ukazuje následující diagram. Rozlišuje se kontextový dokument (dokument, který je součástí jiného dokumentu) a bezkontextový dokument (doku ment, který je integrální). Struktura právních předpisů byla vytvořena v souladu s připravovanou publikací elektronické sbírky zákonů (projekt eSbírka) v podobě otevřených dat.

4.5. Další typy slovníků Pomocí modelovacího jazyka definovaného v rámci Z -SGoV vytváří různé subjekty své doménové sémantické slovníky. Doménový sémantický slovník může např. definovat pojmy z daného zákona, rozšiřovat sémantický slovník pojmů daného zákona o pojmy používané v dané agendě, nebo zavést technické pojmy používané v kontextu daného AIS nebo datové sady v samostatném slovníku.
Subjekt zodpovědný za danou množinu pojmů vytváří pro tuto množinu slovník pojmů, který pojmenovává tak, aby název slovníku dobře množinu poj mů charakterizoval. Je tak možné vytvořit například: ● Sémantický slovník pojmů zákona 56/2001 Sb. o podmínkách provozu vozidel na pozemních komunikacích – který definuje a modeluje všechny důležité pojmy v tomto zákoně, ● Sémantický slovník pojmů agendy A998 o podmínkách provozu vozidel na pozemních komunikacích – který definuje a modeluje všechny důležité pojmy používané v agendě, ale nezavedené v zákoně 56/2001 Sb., který agendu upravuje, ● Sémantický slovník pojmů AIS registr vozidel – který definuje a modelu je všechny důležité pojmy, které jsou důležité v rámci registru vozidel, ale nejsou součástí agendového ani legislativního slovníku výše.

Při tvorbě doménových sémantických slovníků je nutné postupovat podle Metodiky tvorby a údržby sémantických slovníků veřejné správy, především: ● odvozovat (specializovat) prvky doménových sémantických slovníků v maximální možné míře od prvků V-SGoV. ○ daný typ objektu v doménovém sémantickém slovníku specializovat od prvků subjekt práva nebo objekt práva ve V-SGoV. Toumožňuje využití sémantického slovníku pro automatizaci řady procesů, např. evidenci agendových údajů do Registru práv a povinností. ● odvozovat (specializovat) prvky doménových sémantických slovníků v maximální možné míře od prvků jiných doménových sémantických sl ovníků, které zahrnují nadřazené pojmy z pohledu legislativní hierarchie, např.: ○ odvození od pojmů v zákoně 89/2012 Sb. občanský zákoník, 90/2012 Sb. o obchodních korporacích nebo 111/2009 Sb. o základních registrech ○ odvození agendových pojmů od legislativních pojmů ze zákona, který agendu upravuje. 5. Publikace sémantického slovníku pojmů jako otevřených dat Sémantický slovník pojmů je publikován formou otevřených data na stupni otevřenosti 5*. Nižší stupně otevřenosti nedávají v tomto případě smysl, protože ve strojově čitelné reprezentaci je nutné zaznamenat především propojení mezi jednotlivými pojmy uvnitř jednoho slovníku a napříč různými slovníky. Slovníky nebudou primárně ukládány v jednom datovém zdroji, ale publikovány na různých místech. Propojení je proto nezbytné zaznamenat odděleně od samostatných slovníků, tj. propojení musí být uvažována jako “first-class citizens” uvažované reprezentace. To umožňuje pouze stupeň otevřenosti 5.

Tato sekce ukáže reprezentaci jednotlivých částí sémantického slovní ku pojmů. Spolu s jazykem RDF, který je pro stupeň otevřenosti 5* vyžadován, budou využity dvě standardizované nadstavby - jazyk SKOS (pro popis tezaurů) a jazyk OWL (pro popis ontologických modelů).

Aby bylo možné pojmy snadno sdílet, jsou vytvářeny v souladu s principy propojených dat, viz Linked Data Principles, 2009. To v praxi zjednodušeně znamená, že každý pojem (nikoli slovo) má přidělen globální identifikátor ve tvaru IRI, které funguje jako ● URL pro člověka - při přistoupení z webového prohlížeče se uživateli zobrazí stránka s charakteristikami daného pojmu a vazbami, které má pojem na pojmy ostatní. ● URL pro stroj - vyhledávače, či jiné softwarové nástroje mohou ze stejné URL získat strojově čitelný popis pojmu, jeho charakteristiky a vazby.

5.1. Identifikátory IRI pojmů, slovníků a dalších artefaktů následující tvar: https://slovník.gov.cz/<REFERENČNÍ_IDENTIFIKÁTOR> kde < REFERENČNÍ_IDENTIFIKÁTOR> je pro každý artefakt jedinečný se strukturou popsanou níže. S ohledem na efektivní správu pojmů jednotlivými organizacemi veřejné správy bude odpovědnost za tvorbu identifikátorů primárně na jednotlivých organizacích veřejné správy. Pro tento účel jim bude vytvořen registr jmenných prostorů, které přidělen jmenný prostor v podobě unikátního číselného kódu a v rámci tohoto jmenného prostoru budou vytvářet vlastní lokální identifikátory artefaktů. <IDENTIFIKÁTOR_ARTEFAKTU> tedy bude mít tvar <JMENNÝ_PROSTOR>/<LOKÁLNÍ_IDENTIFIKÁTOR> kde <JMENNÝ_PROSTOR> je unikátní identifikátor dané organizace (např. IČ nebo název) a <LOKÁLNÍ_IDENTIFIKÁTOR> je libovolný číselný identifikátor vydaný danou organizací. Příklad identifikátorů

Např. všechny pojmy vznikající v rámci Ministerstva pro místní rozvoj mají společnou část

https://slovník.gov.cz/66002222/.

Příklad IRI pojmu publikovaného pomocí principů propojených dat:

Např. výše uvedený pojem Budova (dle zákona 256/2013 Sb.) pokud bude zaveden ministerstvem pro místní rozvoj má IRI např.

https://slovník.gov.cz/66002222/1

které je možné sdílet, využívat pro anotaci datových zdrojů, dokumentů, atp.

V následujícím textu budeme využívat předdefinované prefixy pro zkrácení zápisu, dle Seznam prefixů použitých v tomto dokumentu, tedy např. uvedené IRI zapíšeme jako

sgov-66002222:1

Uvedený návrh je jednoduchým řešením, které umožní vytvářet sémantický slovník distribuovaně jednotlivými orgány veřejné správy. V procesu rozvoje slovníku (viz kapitola
Slovníky) však může dojít k potřebě přesunout pojem z jednoho slovníku do jiného, který může být i v jiné organizaci - např. v situaci, kdy původně nelegislativní pojem se dostane do legislativy. V takovém případě MVČR zajistí změnu směrování jednotlivých identifikátorů pomocí směrovací služby, viz Směrovací služba VDF, 2021.

5.2. Struktura slovníku Slovník je OWL dokumentem, který importuje jednotlivé komponenty: ● OWL dokument reprezentující tezaurus. ● OWL dokument reprezentující konceptuální model. ● OWL dokument reprezentující mapování.

<identifikátor slovníku> a z-sgov:slovník, owl:Ontology ; dcterms:title "<název slovníku>"@cs; owl:imports <identifikátor tezauru>; owl:imports <identifikátor modelu>; owl:imports <identifikátor mapování> .

kde ● <identifikátor slovníku> je identifikátor slovníku, ● <název slovníku> je název slovníku v češtině, ● <identifikátor tezauru> je identifikátor tezauru, který je částí daného slovníku, ● <identifikátor modelu> je identifikátor modelu, který je částí daného slovníku, ● <identifikátor mapování> je identifikátor mapování, které je částí daného slovníku.

Příklad reprezentace slovníku:

sgov-66002222:10 a z-sgov:slovník, owl:Ontology ; dcterms:title "Slovník o budovách"@cs; owl:imports sgov-66002222:7; owl:imports sgov-66002222:8; owl:imports sgov-66002222:9.

5.3. Struktura tezauru Tezaury pojmů jsou realizovány v podobě schémat konceptů W3C standardu SKOS, viz SKOS reference, 2009. Tezaurus má následující reprezentaci:

<identifikátor tezauru> a z-sgov:glosář, owl:Ontology, skos:ConceptScheme ; skos:hasTopConcept <identifikátory kořenových pojmů> ; dcterms:hasPart <identifikátor kolekce> .

<identifikátor kolekce> a skos:Collection ; skos:member <Identifikátory vlastních pojmů>;

kde ● <identifikátor tezauru> je identifikátor tezauru pojmů, ve kterém je pojem definován, dle pravidel pro tvorbu identifikátorů tezauru pojmů uvedených výše,