C2V4.pdf

Type: Document | Status: ready

91

schémata a vyjádřených ve formátu JSON), které navzájem sdílí společné prvky repozitáře od těch nejjednodušších (základních datových typů) až po t y nejsložitější (specifické OFN). Toto sdílení výrazně zjednodušuje vytváření OFN i datových schémat datových sad. Při jejich tvorbě stačí pro každou položku datového schématu vždy jenom odkazovat na vrchol hierarchického datového modelu odpovídajícího ošetřované položce datového schématu (odpovídající základnímu datovému typu, nebo sdílené specifikaci).

Návrh datového schématu Návrh na základě prvků repozitáře OFN se soustředí do tří kroků: ● správné odvození datového modelu z konceptuálního modelu tématu datové sady, ● ošetření každého prvku datového modelu referenčním odkazem na vrchol datového modelu odpovídajícího prvku repozitáře OFN, ● sestavení strojově čitelného datového schématu pomocí základních datových typů a referenčních odkazů na prvky repozitáře OFN ve stejné hierarchické struktuře, jako má datový model datové sady.

9.5.1.2 Příklad přípravy datového schématu na základě podobné OFN Jedná se pouze o vizualizaci principu jednoduchého využití připravených OFN. Prakticky není nutné s modely tímto způsobem pracovat, vše lze provést pouze na základě hrubého konceptuálního modelu / konceptu datové sady a změny zavést pouze ve strojovém vyjádření datového schématu (včetně odkazů do SSP v případě zajištění sémantiky datové sady).

92

Výsledkem porovnání je zjištění, že 3 vlastnosti OFN nejsou zapotřebí.
● Dvě vlastnosti OFN (jazyk a typy turistických cílů) jsou nerelevantní pro téma tržnice,
● bezbariérovost je k diskuzi (i u tržnice to může být důležitá informace), ale pro jednoduchost ji není nutné řešit. A naopak schází dvě zamýšlené položky k publikaci – prodejní místo a stánek. Tady se nabízí několik možností řešení. ● Obě položky je možné považova t za složené základní typy (např. množství) a pouze uvádět počet prodejních míst a počet prodejních stánků. ● Obě položky řešit jako samostatné entity se svými vlastními vlastnostmi a mající vztah ke kořenové entitě tržnice (podobně jako sdílené specifikace). ● Informace o obou položkách uvést v dokumentu (nákresu, plánku, ...) a tento dokument navázat jako přílohu kořenové entity. Vybereme tuto variantu jako nejjednodušší řešení. Vizualizace prováděných úprav v datovém modelu:

93

Červeným křížkem jsou označeny položky (případně celé sdílené specifikace), které u cílové datové sady Tržnice nebudou využity: ● Typ turistického cíle ● Jazyk ● Bezbariérovost Zelenou elipsou jsou zvýrazněny části, které budou upraveny, případně doplněny ● Otevírací doba ● Vstupné ● Vlastník ● Atributy kořenové entity ● A nová položka – správce. Výsledný datový model:

● Nevyužité položky jsou odstraněny, některé přejmenovány, aby významově více odpovídaly tématu Tržnice. ● Je přidána nová vazba na sdílenou specifikaci „Člověk či osoba“ s názvem „Správce“. ● Změny názvů: o Otevírací doba – Provozní doba o Vstupné – Poplatky o Vlastník – Zřizovatel o Nová položka – Správce ● U sdílené specifikace Věc je přidána jako příloha plánek tržnice, na kterém budou informace o stáncích, jejich umístění a jednotlivých prodejních místech (příklad zjednodušení uvedení chybějících atributů v původní OFN). ● Úprava strojově čitelného datového schéma. o Podobným způsobem s využitím stejných úprav jako u datové struktury by bylo upraveno i strojově čitelné datové schéma, a to následujícím postupem:

94

▪ Stažení datového schématu z umístění publikované OFN Turistické cíle na portálu otevřených dat. ▪ Provedení úprav schématu ▪ Odstranění nepoužitých sdílených specifikací ▪ Typ turistického cíle ▪ Jazyk ▪ Bezbariérovost ▪ Přidání atributu „Správce“ s odkazem na sdílenou specifikaci „Člověk či osoba“ ▪ Změna názvů: ▪ Otevírací doba – Provozní doba ▪ Vstupné – Poplatky ▪ Vlastník – Zřizovatel ▪ Přidání odkazu na přílohu s plánkem tržnice. ▪ Uložení souboru s upraveným datovým schématem. ▪ Použití souboru při registraci datové sady. Tématu, jakým způsobem pracovat s různými formáty a jak konkrétně provádět úpravy, se věnuje e-learningový kurz „Technické aspekty otevřených dat“. Přizpůsobení připravených strojově čitelných datových schémat není obtížné, jedná se přejmenování datových položek a doplnění chybějících částí.
V případě publikace datové sady s částečnou vazbou do sémantického slovníku úpravy souboru s publikovaným kontextem schématu (soubory typu JSON-LD kontext v OFN) také nejsou obtížné, za předpokladu, že sémantický slovník již obsahuje pojmy odpovídající významu jednotlivých datových položek datové sady.
Pokud ve slovníky pojmy zavedeny nejsou, a datová sada má být publikována se sémantikou, je nutné provést analýzu datové sady dle „Metodiky tvorby a údržby konceptuálních datových modelů agend“ a pojmy do slovníku doplnit. Doplňující informace včetně výkladu jsou k dispozici i v e-learningovém kurzu „Úvod do otevřených formálních norem (OFN)“ na Portálu otevřených dat v sekci vzdělávání. Problematice podobných OFN se věnuje modul „4. Využití připravených OFN pro tvorbu datových schémat“. 9.5.1.3 Příprava datového schématu s využitím sdílených specifikací. Příprava datového schématu je založena na: ● datovém modelu (vycházejícím z konceptuálního modelu nebo konceptu) datové sady k publikaci, ● využití prvků repositáře OFN (sdílených specifikací a základních datových typů) postupným nahrazováním jednotlivých položek datového modelu vhodnými sdílenými specifikacemi a jejich dekompozicí na jednodušší struktury. S výhodou je možné využít skutečnosti, že dekompozice sdílených specifikací je v podstatě základem jejich konstrukce, a že tato dekompozice je plně zachycena v repositáři OFN prostřednictvím vzájemných referencí.
Samotný návrh datového schématu ze strany poskytovatele se tak zaměřuje zejména na návrh datového modelu a náhradu jeho položek prostřednictvím referenčních odkazů na sdílené specifikace a základní datové typy. Návrh datového schématu je tak posunut na logicky vyšší úroveň, kdy není nutné řešit technické a jiné detaily a stačí se plně soustředit na zachycení věcné tématiky publikované oblasti.

95

Vizualizace postupné náhrady vlastností „Tržnice“ sdílenými specifikacemi: Finální výsledek:

● Ze schématu je patrné, že takové kompletní datové schéma je opravdu kompletní a pokrývá všechny možné varianty datově vyjádřit položky uvedené v konceptu datové sady. ● Jedná se o maximalistickou verzi datové struktury publikované datové sady. Zcela stejný přístup, jako je tomu v případě OFN pro konkrétní tematické oblasti. ● Na rozdíl od připravených OFN v tomto případě není k dispozici připravené datové schéma ve strojově čitelném formátu, jediné, co je k dispozice jsou popisy sdílených specifikací na portálu otevřených dat. ● K vlastní tvorbě datového schématu lze přistoupit individuálním ručním výběrem reprezentací pouze použitých datových položek ve využitých sdílených specifikacích. ● Jednalo by se, ale o pracnou práci, jejíž výsledek by navíc představoval málo pružné řešení a při každé eventuální úpravě struktury publikované datové sady by bylo nutné také opět ručně upravovat i soubor s datovým schématem. ● Mnohem vhodnějším a efektivnějším řešením je plně využít vlastnosti a možnosti repositáře OFN. ● Dekompozice sdílených specifikací je v podstatě základem jejich konstrukce, a tato dekompozice je

96

plně zachycena v repositáři OFN prostřednictvím vzájemných referencí. Repozitář OFN si tak lze představit jako množinu hierarchických stromových modelů dat (reprezentující datová schémata a vyjádřených ve formátu JSON), které navzájem sdílí společné prvky repozitáře od těch nejjednodušších (základních datových typů) až po ty nejsložitější (specifické OFN). ● Při náhradě každé položky datového schématu vždy stačí jenom odkazovat na vrchol hierarchického datového modelu odpovídajícího ošetřované položce datového schématu (odpovídající základnímu datovému typu, nebo sdílené specifikaci). ● Příklad ošetření položky „umístění“ a její dekompozice prostřednictvím vnitřních referenčních vazeb. K využití celé sdílené specifikace potom stačí jediný referenční odkaz na tuto specifikaci

● V tomto případě položce konceptu datové sady „provozovatel“ odpo vídá sdílená specifikace “člověk či osoba”. Pro vyřešení této položky stačí vazba na odpovídající sdílenou specifikaci. ● Jakým způsobem je sdílená specifikace navržena a jak je udržována její aktuálnost spadá plně na správce repositáře. Poskytovatel je od t ěchto „malicherností“ odstíněn a má jistotu, že používá komponenty plně standardizované a aktuální. ● Repositář obsahuje další dekompozice sdílených specifikací na detailnější struktury, sdílená specifikace „člověk či osoba“ je dekomponována na další dvě sdílené specifikace „člověk“ a „osoba“. ● Dalším krokem by byla dekompozice například „člověka“ na jeho jednotlivé specifikované atributy a ty by byly opět dále dekomponovány až na úroveň základních datových typů. ● V uvedeném provázání a sdílení prvků repozitáře OFN spočívá základní výhoda používání sdílených specifikací při návrhu datových schémat, vedoucí k celkovému efektivnímu využití připraveného repositáře OFN při návrhu datového schématu. Vyznačené vlastnosti odpovídající sdíleným specifikacím:

● Zjednodušený postup v uvedeném příkladu pro demonstraci: o Označení atributů, které je možné reprezentovat sdílenými specifikacemi. ▪ Kontakt ▪ Umístění

97

▪ Provozovatel ▪ Správce ▪ Zřizovatel ▪ Kapacita tržnice o Ošetření sdílených specifikací uvedením referenčních odkazů na jejich detailní specifikace.

o Atribut „kapacita tržnice“ je ošetřen odkazem na základní datový typ „množství“.
o Vytvoření strojově čitelného datového schématu, ▪ sestavení datového schématu pomocí základních datových typů a referenčních odkazů na prvky repozitáře OFN ve stejné hierarchické struktuře, jako má datový model datové sady. o Ukázka výsledného datového schématu ve strojově čitelném formátu.

98

Doplňující informace včetně výkladu jsou k dispozici i v e-learningovém kurzu „Úvod do otevřených formálních norem (OFN)“ na Portálu otevřených dat v sekci vzdělávání. Problematice využití sdílených specifikací se věnuje modul „5. Tvorba datových schémat s využitím sdílených specifikací“. 9.6 Propojená data Propojená data jsou ideální způsob publikace dat na webu. Jsou inspirována způsobem fungování dnešního webu složeného z webových stránek a jsou také podepřena řadou doporučení konsorcia W3C, které k této formě vydává webové de facto standardy. Cílem publik ace dat jako propojených dat je odstraňovat překážky mezi publikací a užitím dat. Je toho dosahováno několika základními způsoby: ● Globální identifikace a lokalizace datových entit o Žádný jiný způsob publikace dat na webu neumožňuje globální a jednoznačnou i dentifikaci a lokalizaci jednotlivých datových položek. ● Sémantický popis dat o Žádný jiný způsob publikace dat nedosahuje takové úrovně popisu významu dat jako propojená data. ● Jednotný formát o Propojená data používají jednotný formát reprezentace dat, což velmi usnadňuje práci s nimi. ● Integrace o Propojená data jsou na web vystavována j iž integrována s jinými datovými zdroji pomocí linků. Toto přesouvá integrační zátěž od konzumenta dat k poskytovateli, který má pro integraci lepší znalosti a zdroje. Aby bylo možno na tyto výhody dosáhnout, je třeba dodržovat základní sadu konvencí pro p ropojená data. Ty jsou popsány v Otevřené formální normě „ Propojená data “, její součástí jsou také v yčerpávající informace k problematice propojených dat. Podobný dokument pro svá propojená data vydala například standardizační organizace GS1.

99

Doplňující informace včetně výkladu jsou k dispozici i v e-learningovém kurzu „Technické aspekty otevřených dat“ na Portálu otevřených dat v sekci vzdělávání. Problematice propojených dat se věnuje modul „4. Formáty pro otevřená data – Propojená data a model RDF“. 9.6.1 Vytvoření RDF modelu Pro reprezentaci propojených dat se používá datový model RDF – Resource Description Framework [rdf11- concepts]. Aktuální verze 1.1 byla vydána konsorciem W3C v roce 2014.
Jedná se o grafový datový model, tj. data jsou reprezentována jako uzly a hrany v grafu, kde uzly reprezentují entity a datové hodnoty, a hrany reprezentují jejich propojení.
Takový graf s e dá popsat pomocí množiny trojic <uzel 1, hrana, uzel 2>, které říkají, že existuje entita uzel 1, existuje entita uzel 2 a jsou propojeny hranou hrana.
V RDF se jednotlivým částem každé trojice říká subjekt, predikát a objekt, a trojice říká, že objekt je hodnotou vlastnosti predikát nějaké entity subjekt.
Objektem může být primitivní hodnota (řetězec, datum, číslo, …) nazývaná laterál, nebo jiná entita. Subjektem je vždy entita. Entity a predikáty se identifikují pomocí jejich IRI. Příklad trojice v RDF ● Alice je identifikována jako https://příklad.cz/lidé/Alice. ● Bob je identifikován jako https://sociálnísíť.cz/uživatelé/Bob.
● Predikát říkající, že jeden člověk zná jiného má IRI http://xmlns.com/foaf/0.1/knows.
Trojice, která říká, že Alice zná Boba tedy vypadá takto: ✔ https://příklad.cz/lidé/Alice
http://xmlns.com/foaf/0.1/knows
https://sociálnísíť.cz/uživatelé/Bob. Tímto způsobem lze reprezentovat jakákoliv data v RDF. 9.6.2 Serializace RDF modelu Datový model je nutné serializovat, tj. zapsat například do souboru, nebo v nějaké jiné formě přenést prostřednictvím Internetu. Existuje 7 standardních serializací modelu RDF. N-Triples Serializace N -Triples [n-triples] je doporučení konsorcia W3C z roku 2014. Jedná se o nejpřímočařejší RDF serializaci. IRI jednotlivých částí trojice se uzavírají do ostrých závorek < a > a trojice se ukončují tečkou. Pokud je objektem literál, uzavře se jeho hodnota do uvozovek ". IRI datového typu literálu se připojuje za znaky ^^ Soubor s RDF serializací N -Triples má příponu .nt. Tato serializace se hodí tam, kde záleží na jednoduchosti a rychlosti zpracování a nezáleží tolik na lidské čitelnosti a na velikosti dat. Turtle Serializace Turtle [turtle] je doporučení konsorcia W3C z roku 2014. V serializaci N-Triples se řada IRI nebo jejich částí neustále opakuje, navíc tato serializace není příliš čitelná pro lidi. Serializace Turtle proto přidává optimalizace vedoucí k lepší lidské čitelnosti a úspoře počtu znaků.
● Znak středník ; říká, že následující trojice má stejný subjekt jako aktuální, a tedy stačí specifikovat pouze nový predikát a objekt.

100

● Znak čárka , říká, že následující trojice má stejný jak subjekt, tak predikát a tedy stačí specifikovat pouze nový objekt. ● Pro případy opakujících se některých části IRI (napřík lad ty, které identifikují predikáty z jednoho slovníku, nebo entity patřící do stejného nadřazeného prvku), serializace Turtle zavádí tzv. prefix - krátce pojmenovaná opakující se část IRI, kterou lze použít pro zkrácený zápis IRI v dokumentu. Soubor s RDF serializací Turtle má příponu .ttl. N-Quads Serializace N-Quads [n-quads] je doporučení konsorcia W3C z roku 2014 a rozšiřuje serializaci N-Triples o čtvrtou složku, IRI pojmenovaného grafu, do kterého daná trojice patří. Soubor s RDF serializací N-Quads má příponu .nq. TriG Serializace TriG [trig] je doporučení konsorcia W3C z roku 2014. Stejně jako serializace Turtle zavádí zkratky do serializace N-Triples, serializace TriG stejným způsobem rozšiřuje serializaci N -Quads. Jedná se tedy zároveň o rozšíření serializace Turtle o podporu pojmenovaných grafů. Soubor s RDF serializací TriG má příponu .trig. JSON-LD Serializace JSON -LD [json-ld] je doporučení konsorcia W3C z r oku 2014. Jedná se o serializaci RDF v syntaxi JavaScript Object Notation (JSON) [ECMA-404], která je již známá velkému počtu stávajících vývojářů webových aplikací. Hlavní motivací pro tuto serializaci je možnost poskytovat jedním způsobem propojená data jak vývojářům, kteří znají pouze JSON, tak vývojářům znalým technologií propojených dat. Mapování hodnot z JSON do RDF je specifikováno v klíči @context, který mohou JSON vývojáři ignorovat. Soubor s RDF serializací JSON-LD má příponu .jsonld. RDF/XML Serializace RDF/XML [rdf-syntax-grammar] je doporučení konsorcia W3C z roku 2014 a s pecifikuje, jak zapsat datový model RDF do XML dokumentů. Historicky se jedná o první RDF serializaci, nicméně aktuálně ztrácí na významu, jelikož je lidsky poměrně nečitelná, přidává složitost pravidel pro XML dokumenty. Zpracování softwarem, který rozumí XML ale nerozumí RDF se již nepředpokládá. Soubor s RDF serializací RDF/XML má příponu .rdf. RDFa Serializace RDFa [rdfa-core] je doporučení konsorcia W3C z roku 2015 a sp ecifikuje, jak lze datový model RDF zapsat do atributů běžných HTML dokumentů [html53]. Serializace nalezne uplatnění tam kde je požadováno, aby lidsky čitelný zápis v HTML by l doplněn o strojově čitelné informace ve stejném dokumentu, s minimalizací opakování stejných dat pro obě reprezentace. 9.6.3 Pravidla pro výběr slovníků pro vybrané typy dat Nedílnou součástí propojených dat je také standardizace jejich obsahu pomocí tzv. slovníků – popisů významu jednotlivých tříd a predikátů pro daný typ dat. Obecným pravidlem pro tvorbu reprezentace propojených dat je pokrývání jejich obsahu již existujícími slovníky Až teprve v případě, že ještě neexistuje vhodný slovník pro popis nějaké čá sti publikovaných dat, je možné si dodefinovat svůj slovník, který je ale nutné řádně publikovat, aby ho mohli použít ostatní poskytovatelé dat. K

101

vyhledání existujících slovníků je určen registr Linked Open Vocabularies (LOV).
V prostředí veřejné správy ČR je pro tvorbu reprezentace propojených dat a pokrývání jejich obsahu výchozím slovníkem „Sémantický slovník veřejné správy “ (SSP). Pro popis těch části publikovaných dat, pro které ještě neexistuje vhodný slovník, je možné si také dodefinovat svůj vlastní slovník, který je ale nutné řádně publikovat, aby ho mohli použít nejen ostatní poskytovatelé dat ale také jejich uživatelé. Důvodem ustavení „Sémantického slovníku veřejné správy “ jako základu pro pokrývání obsahu datových sad j e skutečnost, že slovník je silně navázán na legislativu ČR (vychází z pojmů a jejich definic v legislativě), stejně jako správa a publikace dat VS ve formátu otevřených dat (více v kapitole „Popis sémantiky veřejné správy“). Nejvíce používané typy dat a slovníky dostupné na webu pro reprezentaci propojených dat: ● Číselníky - Simple Knowledge Organization System (SKOS) o Číselníkem je typicky plochý seznam položek, kde každá má minimálně kód a název. Číselníky se mohou používat například jako seznam možných hodnot pro různé vlastnosti datových entit, což lze využít pro formuláře pro zadávání dat, aplikace vizualizující data apod. Pro reprezentaci číselníků v propojených datech se používá slovník SKOS. ● Statistická data - The RDF Data Cube Vocabulary o The RDF Data Cube Vocabulary (DCV) [vocab-data-cube] je doporučení W3C z roku 2014 pro reprezentaci datových kostek v datovém modelu RDF. Datový model DCV je kompatibilní s datovým modelem SDMX. ● RDF Schema o RDF Schema 1.1 [ rdf-schema] je doporučení W3C z roku 2014 a slouží k jednoduchému popisu tříd a vlastností a také k tvorbě jednoduchých hierarchií dědičnosti tříd a vlastností. Ke každé třídě a vlastnosti je možno specifikovat její název a popis, pro vlastnosti pak navíc definiční obor a obor hodnot. ● OWL o Web Ontology Language 2 [owl2-overview] je doporučení W3C z roku 2012 pro tvorbu ontologií. Umožňuje modelovat i velmi složité sémantické vztahy. V prostředí propojených dat se nejvíce používá predikát owl:sameAs, který říká, že 2 IRI identifikují stejnou entitu reálného světa. 9.6.4 Zpřístupnění publikovaných propojených dat ● Dostupnost souborů ke stažení o Základním způsobem zveřejňování 5* otevřených dat je jejich poskytnutí ve formě RDF dumpu, tj. souboru ke stažení v jedné ze standardních RDF serializací, tj. Turtle, TriG či JSON-LD. Volitelně může být použita komprese gzip. ● Dereference IRI – Již ze základních principů propojených dat vychází potřeba z přístupňovat data o konkrétní entitě při přístupu na IRI této entity, tj. jeho využití jako URL. Data o datové entitě jsou poskytnuta ve formátu RDF. Tato funkcionalita může, ale nemusí využívat SPARQL endpoint, který opět může, ale nemusí být zpřístupněn veřejnosti. ● Dostupnost SPARQL endpointu o Publikace 5* otevřených dat v podobě veřejného SPARQL endpointu může být velmi náročná na hardwarové prostředky, a není bezpodmínečně nutná, uživatelé 5* otevřených dat si mohou stáhnout RDF dump a použít pro dotazování vlastní SPARQL endpoint. Sémantika údajů veřejné správy

102

9.7 Popis sémantiky veřejné správy Sémantický slovník pojmů veřejné správy je nástrojem pro postupnou harmonizaci významu (sémantiky) jejích dat. Je katalogem pojmosloví používaného v rámci veřejné správy. Zahrnuje pojmy, jejich definice, vazby pojmů na legislativu, vzájemné významové vazby pojmů mezi sebou i významové vazby pojmů na standardní veřejné slovníky používané v zahraničí (především z iniciativy EU, např. ISA Core Vocabularies). Jako takový je prostředkem usnadňujícím zajišťování syntaktické a sémantické interoperability dat veřejné správy. Sémantický slovník pojmů je tvořen tzv. tezaurem (glosářem), který definuje důležité pojmy v dané oblasti zájmu (např. pojmy zavedené nějakým zákonem nebo pojmy používané v nějaké agendě, datové sadě, …) s hierarchickým uspořádáním jednotlivých pojmů od nejabstraktnějších po nejkonkrétnější , a konceptuálním modelem, který pojmy propojuje pomocí významových (sémantických) souvislostí.

9.7.1 Slovník pojmů (Glosář, Tezaurus). Základním stavebním kamenem glosáře je pojem. Pojem (též koncept, nebo také význam) je slovo nebo sousloví opatřené definicí, synonymy, zdrojem, příp. dalšími charakteristikami, které zpřesňují jeho význam tak, aby se omezila možnost mu špatně porozumět nebo jej špatně použít.
Základní pojmy glosáře jsou tvořeny pojmy provozovaných agend veřejné správy. Ty jsou odvozené z legislativních dokumentů stejně jako přesné definice jejich významů. Ne všechny pojmy agend jsou ale explicitně uváděny v legislativě, proto je nutné k zajištění sémantické interoperability dat veřejné správy glosář pojmů průběžně doplňovat o další identifikované pojmy (a jejich významy), a tedy i během publikace otevřených dat. Pojmy reprezentují: ● subjekty a objekty v reálném nebo abstraktním světě, ● vlastnosti těchto subjektů a objektů (atributy a vztahy), ● osoby, které jsou subjekty práv nebo povinností v agendě, ● věci, které jsou předmětem (objektem) práv a povinností v agendě, ● role subjektů (role objektů se neuvažují, neboť nemohou konat a „brát na sebe“ roli), ● fáze subjektů nebo objektů, tj. jejich konkrétní specifické stavy, ● události, které jsou pro danou doménu relevantní, a které nějakým způsobem ovlivňují subjekty nebo objekty, ● činnosti (konání, chování, úkony) v rámci domény, Konzistence pojmů a jejich hierarchické uspořádání od nejabstraktnějších po nejkonkrétnější v glosáři jsou zajištěny: ● klasifikací subjektů a objektů dle různých společných vlastností (zatřídění), o generalizací a specializací mezi těmito klasifikačními třídami (zachycení specializační vazbou fakt, že určitý typ subjektu, nebo objektu je speciálnější než jiný typ, je tedy jeho speciálním případem