8
● Publikace datové sady. o Oblast je zaměřena zejména na fyzickou přípravu distribucí datových sad a jejich zveřejnění. Informace jsou uvedeny formou doporučení pro přípravu fyzických dat k jejich transformaci do konkrétních formátů distribucí. o Uvedeny jsou také postupy a způsoby rozhodování při návrhu podmínek užití pro jednotlivé distribuce. o Detailnímu popisu je věnována dílčí část kapitoly 5 „Příprava distribucí datové sady k publikaci“. ● Katalogizace datové sady. o Zaměřeno na zveřejnění datových sad, finalizaci katalogizačních záznamů a postupy katalogizace datových sad, zejména v NKOD.
9
o Detailnímu popisu je věnována dílčí část kapitoly 5 „Publikace otevřených dat“.
Komunikace, propagace a využití otevřených dat.
o Tato oblast nemá přímý metodický charakter a jsou zde shromážděny pouze doporučení, rady a
možné inspirace k uvedeným tématům.
1.5 Omezení metodiky
Obsah metodiky je zaměřen na metodické pokrytí všech oblastí a souvisejících postupů publikace otevřených dat
ve veřejné správě ČR v jejich cílové (správné, úplné a kvalitní) podobě.
Publikace dat ve veřejné správě ČR má za sebou ale již několikaletou historii a hodně dat bylo již publikováno,
často ale bez dodržování požadovaných standardů na jejich publikaci. Rovněž i samotný obsah metodiky byl
vytvářen a precizován postupnými kro ky v souladu s tím, jak byl rozšiřován význam a rozsah pojmu „otevřená
data“, a to:
● v informační architektuře veřejné správy ČR,
● v legislativě ČR a
● v kontextu role otevřených dat v EU.
Přirozeným výsledkem činností prováděných „za pochodu“ je zcela zákoni tě určitý nesoulad mezi aktuálním
stavem publikace datových sad a „nově“ požadovaným stavem.
Snaha a požadavek na postupné zavádění nových postupů v souladu s postupy uváděnými v metodice může místy
vést k omezení její použitelnosti, například z důvodu prozatímní absence některých nástrojů, nebo částí potřebné
infrastruktury prostředí otevřených dat.
Základní omezení je ale zatím spojeno s požadavkem na zajištění sémantické interoperability publikovaných dat
Cílem digitalizace veřejné správy je vytvoření jednotného sdíleného datového fondu, jehož předpokladem je také
podchycení jednoznačného významu všech sdílených údajů, a tedy i publikovaných datových sad, které jsou jeho
součástí. K identifikaci a popisu významu údajů je určeno:
● na straně správy a evidenc e agendových údajů modelování sémantiky agend a postupné vytváření
„Sémantického slovníku pojmů veřejné správy“ (SSP),
● v oblasti publikace otevřených dat je obdobně vyžadováno modelování témat datových sad
(prostřednictvím tvorby jejich konceptuálních mod elů na základě pojmů spravovaných v SSP) a
případné doplňování nových identifikovaných pojmů do SSP, pokud vzniknou jako výstup zmíněného
modelování.
Stávající omezení modelování sémantiky (a tedy také zajištění sémantické interoperability):
● nedostatečný počet namodelovaných agend a s tím související omezený počet pojmů v SSP,
● podpora modelovacími nástroji usnadňujícími analýzu je zatím na úrovni vytvořených prototypů, které
jsou sice zcela funkční, ale zatím nejsou plně implementovány do prostředí veřejné správy (schází
Obsah metodiky je zaměřen na metodické pokrytí všech oblastí a souvisejících postupů publikace otevřených
dat ve veřejné správě ČR v jejich cílové (správné, úplné a kvalitní) podobě.
10
dořešení administrace nástrojů, jejich správa a také správa a administrace vytvářeného slovníku SSP), ● zatím omezený počet vyškolených pracovníků veřejné správy pro práci v oblasti sémantického modelování a pro práci s připravenými nástroji. Prakticky to znamená, že až do ukončení implementace nástrojů budou (bohužel) akceptovatelné i publikace datových sad bez požadovaného zajištění sémantické interoperability dat, avšak požadavek na zajištění syntaktické interoperability se nemění a platí v plném rozsahu.
Význam a role zajištění sémantické interoperability dat bude postupně narůstat s postupnou implementací
podpůrných modelovacích nástrojů.
Metodika bude postupně doplňována dalšími dokumenty a postupy, které budou upravovat používání
podpůrných nástrojů, upravovat procesy při vytváření sémantických modelů, a také procesy spojené s jejich
následným využíváním, identifik ací nových pojmů, rozšiřováním slovníku pojmů a využívaní sémantiky při
zajištění sémantické interoperability publikovaných datových sad.
11
Část 1. Metodika
2 Prostředí publikace otevřených dat veřejné správy ČR
Základní podmínkou publikace kvalitních a interoperabilních otevřených dat je existence vytvořeného prostředí
pro jejich publikaci, a to jak u samotného poskytovatele, tak i v celé veřejné správě ČR.
2.1 Sdílené prostředí publikace OD
Na straně veřejné správy ČR a zejména garanta otevřených dat VS se zejména jedná o:
● Ukotvení otevřených dat a souvisejících povinností v legislativě ČR.
o
Zákon č. 106/1999 Sb. Zákon o svobodném přístupu k informacím
o
Zákon č. 123/1998 Sb. Zákon o právu na informace o životním prostředí
● Metodické pokrytí všech oblastí otevřených dat:
o
Metodika identifikace, publikace, katalogizace a využívání otevřených dat pro samosprávu a pro
státní správu (tato metodika).
o
Metodika tvorby a údržby sémantického slovníku pojmů veřejné správy.
o
Metodika definice údajů vedených v agendě.
o
Metodika poskytování dat ve veřejném datovém fondu.
o
Metodika pro vypracování analýzy dopadu otevřených dat do prostředí ČR.
● Zajištění infrastruktury nutné pro publikaci a využívání otevřených dat:
o Národní katalog otevřených dat (NKOD),
o Veřejný datový fond (VDF) a jeho komponenty,
o Registr práv a povinností (RPP),
o Repositář Otevřených formálních norem (OFN),
o Repositář sémantických modelů.
● Vydané a publikované standardy pro publikaci otevřených dat:
● Nástroje pro monitorování kvality publikace datových sad a zpracovávání zpětné vazby.
● Vzdělávací materiály a e-learningové kurzy na Portálu otevřených dat (POD).
● Připravené prototypy nástrojů pro podporu sémantického modelování dat a vytváření datových
schémat.
o
Termit – tvorba slovníků pojmů, nástroj pro správu odborného pojmosloví a jeho propojení na
legislativu,
o
Ontographer – tvorba konceptuálních modelů, nástroj pro správu konceptuálních modelů
využívajících vytvořené pojmosloví,
o
Dataspecer – nástroj pro automatizovanou tvorbu datových specifikací a OFN přímo z
vytvořených konceptuálních modelů,
o
ShowIT – webový prohlížeč a vyhledávač pojmů v sémantickém slovníku pojmů (SSP).
2.1.1 Národní katalog otevřených dat (NKOD)
Definice ze Zákona o svobodném přístupu k informacím - § 4c, Zákon č. 106/1999 Sb.:
(2) Národní katalog otevřených dat je informační systém veřejné správy přístupný způsobem umožňujícím dálkový
přístup sloužící k evidování informací zveřejňovaných jako otevřená data a dalších informací zveřejňovaných
způsobem umožňujícím dálkový přístup, zejména rozhraním pro programování aplikací a informací o produktech
12
a službách, které otevřená data a další informace využívají. Informace obsažené v národním katalogu otevřených
dat jsou poskytovány způsobem umožňujícím dálkový přístup jako otevřená data.
(3) Správcem národního katalogu otevřených dat je Digitální a informační agentura.“
2.1.2 Veřejný datový fond
Veřejný datový fond (VDF) je metoda sdílení veřejných agendových údajů v prostředí VS, která je tvořena a
zajišťována:
● provázanými již existujícími, ale i zatím neexistujícími technologickými komponentami architektury VS
ČR, které se dělí do dvou skupin:
o společné komponenty VDF – jsou zaměřeny především na správu a organizaci zpřístupňovaných
údajů a souvisejících procesů, jsou plně zajišťovány garantem otevřených dat,
o komponenty jednotlivých agend – jsou zaměřeny především na zpřístupnění a užívání údajů
jednotlivých agend, jsou zajišťovány jednotlivými OVM, správci agend, správci ISVS,
● všemi veřejnými agendovými údaji VS publikovanými ve formátu otevřených dat,
● pravidly a postupy vytvářejícími a zabezpečujícími metodu sdílení údajů v duchu její definice v Informační
koncepci ČR v dílčím cíli 5.10,
● standardy zajišťujícími plnou interoperabilitu sdílených údajů napříč VS.
Podrobnější informace o VDF jsou uvedeny v kapitole „Stručný popis VDF“.
2.1.3 Registr práv a povinností (RPP)
Registr práv a povinností (AIS působnostní) obsahuje a spravuje informace pro řízení přístupu k údajům
základních registrů a k údajům v agendových informačních systémech.
Pro potřeby VDF je RPP rozšířen o evidenci doplňujících informací k agendám a jejich údajům, a také obsahuje
nové následující komponenty:
● Úložiště číselníků a evidence RPP,
o obsahuje a zpřístupňuje datové sady publikovaných veřejných číselníků,
o obsahuje a zpřístupňuje obsah (údaje) RPP jako datové sady.
● Lokální katalog RPP,
o obsahuje katalogizační záznamy pro:
▪
datové sady zastřešující verze číselníků,
▪
datové sady s verzemi číselníků,
▪
datové sady s údaji, které jsou evidovány a spravovány v RPP (obsah RPP).
o zpřístupňuje katalogizační záznamy k jejich katalogizaci v NKOD.
● Systém pro zpřístupnění údajů RPP,
o připravuje obsah RPP a veřejné číselníky do podoby datových sad a dávkově je předává do úložiště
datových sad k publikaci.
2.1.4 Nástroje pro monitorování kvality publikace datových sad
Za kvalitu dat i katalogizačních záznamů zodpovídají jednotliví poskytovatelé. Ti musí na kvalitu svých dat dbát,
pravidelně ji sledovat a dělat kroky k nápravě zjištěných nedostatků. K usnadnění těchto činností Portál
otevřených dat obsahuje následující připravené nástroje:
13
Statistiky NKOD a dashboardy – denně je zjišťována dostupnost zdrojů registrovaných v Národním katalogu
otevřených dat a také zpracovávány statistiky kvality jejich metadatových záznamů.
Základní ukazatele vypočítané z metadat NKOD:
● Kvalita metadatových záznamů v NKOD.
● Statistika dostupnosti distribucí, schémat, podmínek užití a dokumentace.
● Druhy registrace datových sad v NKOD.
● Denní změny v NKOD.
● Měsíční změny v NKOD.
Statistiky jsou pro každého poskytovatele vizualizované pomocí dashboardů, a to jak pro okamžitý aktuální stav,
tak i v delším časovém pohledu vypovídajícím o jejich trendu.
Příklady špatné praxe – praktický doplněk monitorování kvality publikace datových sad, který shromažďuje často
se opakující problémové situace . Pro každou problémovou oblast je uveden seznam nejčastějších nedostatků,
včetně navrhovaných řešení.
2.1.5 Otevřené formální normy (OFN)
Definice ze Zákona o svobodném přístupu k informacím - § 3a odst. 3, Zákon č. 106/1999 Sb.:
„(3) Otevřenou formální normou se pro účely tohoto zákona rozumí pravidlo, které bylo vydáno písemně a
obsahuje specifikace požadavků na zajištění schopnosti různých programových vybavení vzájemně si poskytovat
služby a efektivně spolupracovat.“
Zatím bylo vydáno 34 otevřených formálních norem včetně sdílených specifikací, což jsou otevřené formální
normy specifikující části, které jsou společné pro více jiných otevřených formálních norem, datových specifikací
a schémat datových sad.
OFN je věnována kapitola „ OFN“, a doplňující informace (zejména k jejich použití) jsou ještě uvedeny v dalších
relevantních kapitolách metodiky,
2.1.6 Vzdělávací materiály a e-learningová školení
Vzdělávací materiály:
● Analýza existujících informačních systémů veřejné správy vč. jejich příslušné legislativy a identifikace
datových sad pro veřejný datový fond (odkaz na dokument a přílohu).
● Komunikační strategie pro cílové skupiny otevřených dat (odkaz na dokument a přílohu).
● Propagační články a vizualizace ke konkrétním otevřeným datům v NKOD (sekce „ Články ze světa
otevřených dat“ na „Portálu otevřených dat“).
● Výstupy projektu KODI - Rozvoj datových politik v oblasti zlepšování kvality a interoperability dat veřejné
správy – OPZ CZ.03.4.74/0.0/0.0/15_025/0013983.
● Publikované informace a návody na „Portálu otevřených dat“.
E-learningová školení:
● Co jsou otevřená data – základní informace o tom, co jsou otevřená data, proč se mají publikovat a jaký
je jejich kontext v ČR.
● Publikační plán a publikace dat – poskytnutí informací k vytvoření publikačního plánu organizace.
● Katalogizace otevřených dat - základní informace k rozhodnutí o způsobu katalogizace otevřených dat a
vytvoření katalogizačních záznamů.
● Úvod do otevřených formálních norem (OFN) – poskytnutí informací k posouzení možností/nutností
využití otevřených formálních norem a k výhodám jejich využití.
14
● Technické aspekty otevřených dat – poskytnutí informací k získání přehledu o technologiích a
technických postupech používaných v otevřených datech.
● Veřejný datový fond (VDF) v architektuře veřejné správy – seznámení s novou metodou sdílení údajů ve
veřejné správě prostřednictvím veřejného datového fondu (VDF), který je definován v Informační
koncepci ČR (IKČR) jako dílčí cíl 5.10 a je součástí eGovernmentu VS ČR.
Záznamy školení v kanálu Youtube „Digitální a informační agentury“:
● Modelování významu dat ve veřejné správě – seznámení s modelováním významu dat, použití
sémantických slovníků pro vyhledávání a dokumentaci dat a způsob tvorby sémantických slovníků s
využitím konkrétních softwarových nástrojů.
● Zpracování a vizualizace otevřených dat – seznámení se způsoby čištění dat, jejich zpracováním,
vyhledáváním a způsoby transformace do konkrétních výstupů.
● Propojená data jako další stádium vývoje OD – seznámení se základy propojených dat, slovníky pro popis
významu dat, modelem RDF a dotazovacím jazykem SPARQL.
● Právní úprava otevřených dat – seznámení s právním zakotvením otevřených dat v kontextu českého
právního řádu a práva EU.
● Práva k informacím a datům: Právní překážky pro otevřená data – seznámení se specifickými právními
překážkami, které je třeba vyřešit v průběhu procesu poskytování otevřený ch dat a během jejich
opětovného užití.
● Záznam workshopu " Publikace úředních desek jako otevřená data " - představení povinného způsobu
zveřejnění pomocí otevřené formální normy pro úřední de sky (praktická ukázky použití OFN) a jeho
doplnění ukázkami „Ověření správnosti publikace dat Úředních desek“.
Záznamy Výročních konferencí „Otevřená data ve veřejné správě“:
● Konference Otevřená data ve veřejné správě 2017–1. část, 2. část.
● Konference Otevřená data 2020.
● Konference Otevřená data 2021.
● Konference Otevřená data 2022.
2.2 Prostředí poskytovatele OD
Prostředí poskytovatele a jeho příprava je plně v kompetencích konkrétního poskytovatele, a bude zcela určitě
vždy závislé na velikosti organizace a množství spravovaných a potenciálně publikovaných dat. Lze připusti t i
publikaci způsobem ad hoc (bez implementace činností spojených s přípravou a publikací otevřených dat do
provozních činností organizace), avšak i v takovém případě je nutné naplňovat požadovanou kvalitu
publikovaných dat a kvalitu publikace.
Dále popisované prostředí poskytovatele představuje systémový přístup k publikaci, a je vhodný pro jakýkoliv
typ organizace jakékoliv velikosti. Přizpůsobení je pouze otázkou konkrétní implementace v konkrétní organizaci.
Na straně poskytovatele se jedná zejména o:
Bez dodržení požadované kvality publikovaných dat je jakákoliv publikace otevřených dat zbytečná a pouhé
plýtvání zdroji.
15
● „Politické“ rozhodnutí o otevírání dat a stanovení základních cílů v této oblasti vedením organizace. ● Implementaci činností nutných k publikaci otevřených dat do chodu organizace a jejich zakotvení vhodnou interní legislativou. ● Personální zajištění implementovaných činnosti prostřednictvím přiřazení požadovaných rolí konkrétním pracovníkům organizace. ● Zajištění (vyhrazení) nezbytné technické infrastruktury pro potřeby publikace: o případný Lokální katalog otevřených dat (LKOD), o úložiště publikovaných datových sad. ● Zajištění údržby publikovaných otevřených dat. ● Zahrnutí otevřených dat do informační strategie organizace. 2.2.1 Organizační zabezpečení publikace poskytovatelem
Z – zodpovídá S – spolupracuje R – rozhoduje Vedení organizace Koordinátor otevírání dat Rozhodnutí (politické) o otevírání dat Z
Implementace organizace činností Z
Obsazení role Koordinátora otevírání dat Z
Vydání interní legislativy
R
Z
Obsazení dalších rolí
R
Z
2.2.1.1 Rozhodnutí (politické) o otevírání dat
Rozhodnutí („politické prohlášení“) vedení organizace má výrazný vliv na přístup organizace k otevřeným datům.
Není výjimkou, že v NKOD jsou katalogizované datové sady otevřených dat, které jsou až nepoužitelné, bez nějaké
hodnoty, a že se v podstatě jedná o plýtvání ze strany organizace.
Přístup vedení organizace k otevřeným datům lze v zásadě klasifikovat následujícím způsobem:
● Žádný, bohužel poměrně dosti běžný. Pro tento přístup platí výše uvedený text.
● Nesystémový, publikace probíhá bez vyjasněné strategie, sleduje spíše krátkodobé malé cíle, případně
reaguje na nové vznikající povinnosti, vyplývající například ze zákona. Nejedná se o cílový přístup
organizací veřejné správy, ale pro zapojení se (zejména počáteční) do publikace otevřených dat se jedná
o legitimní způsob.
Absence „politického“ prohlášení a zapojení vedení organizace do publikace otevřených dat vede k:
nedostatečné motivaci pracovníků organizace se otevřenými daty seriózně zabývat,
nízké kvalitě výběru publikovaných témat,
nedodržování kvalitativních požadavků na publikované datové sady,
časté publikaci způsobem ad hoc pouze nadšenci z řad pracovníků organizace.