C3V11 - Analýza dopadu otevřených dat do prostředí ČR za rok 2022
Vytvořeno v rámci projektu
Rozvoj datových politik v oblasti zlepšování kvality a interoperability dat veřejné správy CZ.03.4.74/0.0/0.0/15_025/0013983
Klíčová aktivita: 04 Návrhy a realizace opatření pro zvyšování povědomí o otevřených datech
Hodnocení dopadu otevřených dat je založeno na měření připravenosti celého prostředí
otevřených dat k jejich zhodnocování, prostřednictvím sady vybraných vlastností a
charakteristik reprezentujících požadovanou připravenost. Ta je dána kvalitou otevřených dat,
zhodnocováním otevřených dat a užíváním výstupů vzniklých z otevřených dat. Tyto tři oblasti
byly identifikovány jako klíčové a vychází z Metodiky pro vypracování analýzy dopadu OD do
prostředí ČR. V těchto třech oblastech je popsáno několik ukazatelů, jež jsou každoročně
monitorovány a tvoří výsledné hodnocení, které najdete v tomto dokumentu.
Váhy jednotlivých měřených charakteristik v ukazatelích jsou stanoveny expertně pomocí
Saatyho metody párového porovnání. Každému dílčímu ukazateli byla vždy přiřazena skupina
metrik, které mají expertně přiřazeny váhy v jednotlivých ukazatelích a všechny jsou dále
detailně popsány.
Aby měření bylo v maximální míře objektivní a poskytovalo obraz o potenciálním
zhodnocování otevřených dat (a tedy o potenciálně vzniklých hodnotách), je měření založeno
na hodnocení celého hodnototvorného prostředí vůči ideálnímu stavu takového prostředí.
Ideální stav je charakterizován souborem objektivně stanovených hodnot vybraných atributů
jeho jednotlivých prvků.
Toto vzorové (ideální) prostředí je ohodnoceno celkově 1000 body a v tomto dokumentu je změřen reálný obraz dopadu otevřených dat v roce 2022, který je vyjádřený počtem bodů.
Rok 2022 můžeme z hlediska dopadu otevřených dat vyjádřit hodnotou 451 bodů z 1000 možných. Nejlepší výsledky byly zaznamenány u oblasti Užívání dat (H3), která je úspěšná z 71 %. Naopak nejhůře hodnocenou oblastí je oblast Zhodnocování (H2), a to pouze s 18 %.
Kromě samotného hodnocení metrik a oblastí autoři v dokumentu navrhují několik opatření, jež by danou oblast mohly posunout k lepším výsledkům. Dokument také obsahuje hodnocení jednotlivých oblastí a závěrečné shrnutí dopadu otevřených dat.
Oblast Data, - atributy a podmínky kvalitní suroviny Ukazatel H1 reprezentuje hodnotu oblasti produkující otevřená data a patří do 2. úrovně měření (pro více informací o úrovních měření viz. metodiku pro vypracování analýzy dopadu otevřených dat do prostředí ČR). Měření je založeno na měření následujících charakteristik otevřených dat:
kvalita dat - ukazatel H1_1,
kvalita metadat - ukazatel H1_2,
dostupnost dat - ukazatel H1_3,
kvalitou poskytovatelů - ukazatel H1_4,
Open data governance - ukazatel H1_5.
Shrnutí Počet bodů: 319/518
Oblast dat, atributů a podmínek se meziročně zlepšila o 21 bodů. Ke zlepšení došlo u 4 z 5 kategorií. Obecně se dá říci, že poskytovatelé reflektují povinnosti vyplývající z publikace otevřených dat, jak v datové kvalitě, tak v oblasti metadat. Rovněž však reflektují i další, nepovinné kroky, které jsou s publikací dat spojeny. Zhoršila se mírně dostupnost dat (ve smyslu kvality poskytování), což ale může být dané poměrně velkým nárůstem poskytovatelů dat a datových sad samotných, přičemž někteří noví poskytovatelé ještě některé kroky nezvládli zahrnout do procesu publikace a katalogizace.
Kvalita dat - 46 % (43 z 93 bodů)
Kvalita metadat - 83 % (76 z 91 bodů)
Dostupnost dat - 57 % (108 z 188 bodů)
Kvalita poskytovatelů - 64 % (53 z 83 bodů)
Open data governance - 62 % (39 z 63 bodů)
Kompletní detailně rozepsané bodování viz. Příloha_8_Tabulka bodování H1_1 Kvalita dat Ukazatel H1_1 hodnotí kvalitu správného a rovnoměrného pokrytí věcných oblastí publikovanými daty a uspokojování poptávky po datech ze strany zpracovatelů. Přehled dosažené % úspěšnosti metrik: A_01 - 51 % A_02 - 18 % A_03 - 50 % A_04 - 55 %
Hlavním sdělením výsledků této oblasti je, že se zvyšuje tematické pokrytí datových sad, a to jak v oblasti témat definovaných v NKOD (A_01), tak prostřednictvím témat evropského slovníku EuroVoc (A_02). Dá se tedy konstatovat, že v roce 2022 se zvýšil záběr poskytovaných témat a zvýšil se tak standard všestranného informování veřejnosti prostřednictvím OD. Přestože se jedná o signifikantní nárůst, tak zejména v pokrytí EuroVoc jsou velké rezervy a je nutno nabádat poskytovatele, aby témata vyplňovaly řádně.
Druhá část této kategorie je v porovnání s předchozím rokem spíše konstantní. Uživatelé či potenciální uživatelé nadále dávají podněty na zveřejňování datových sad (A_03 – viz. Příloha_1_Seznam poptávaných datových sad (podněty)) a rovněž poskytovatelé se svými uživateli komunikují (A_04). Do budoucna bude žádoucí tento standard dále udržet, čili neustále nabádat uživatele k novým podnětům na zveřejnění datových sad a rovněž zajistit, aby sami poskytovatelé komunikovali se svými uživateli, což zejména u těch menších poskytovatelů (2 a více datových sad) může být obtížné.
Tato podoblast dostala celkem 43 z 93 bodů (46 %). Meziročně se jedná o zlepšení o 5b.
H1_2 Kvalita metadat Ukazatel H1_2 hodnotí zejména dodržování předepsaných informací při registraci datových sad.
Přehled dosažené % úspěšnosti metrik: A_05 - 95 % A_06 - 88 % A_07 - 27 %
Hlavním sdělením výsledků této kategorie je zvyšování kvality poskytovaných metadatových záznamů, která se meziročně zvedla o 14 bodů (62 → 76) z 91 možných. Pozitivně je nutné vnímat i zvyšující se nárůst bodů u 3 ze 3 metrik, přičemž změna u A_05 byla minimální, z čehož vyplývá, že i při nárůstu počtu datových sad se udržuje stejná kvalita metadatových záznamů. Jinými slovy se dá konstato vat, že poskytovatelé jsou již ve velké míře (95 %) naučeni řádně vyplňovat metadatové záznamy u datových sad. Mezi pomyslné hříšníky v této metrice patří statutární města Plzeň a Ostrava, jejíž datové záznamy požadovanou kvalitu nesplňují.
Metrika hodnot ící vyplněná témata u datových sad (A_06) je rovněž hodnocena velmi přívětivě. Míra úspěšnosti metriky je 88 %, čili poskytovatelé vnímají potřebu u datových sad tuto metadatovou část řádně označit. Svědčí o tom i meziroční nárůst o 6 bodů. Za důležité považujeme apelovat na instituce ČTÚ a Ministerstvo zdravotnictví, kteří i přes to, že mají přes 100 datových sad, téma nemají vyplněné ani v jednom případě. Podobně je tomu u MŽP a MD.
Co se týče metriky A_07 hodnotící vyplněnost datových sad tématem EuroV oc, tak zde je situace komplikovanější. Přesto, že evidujeme meziroční nárůst o 2b, jedná se o nejhůře hodnocenou metriku v metadatové části (2 7 %). Je však možné, že tuto možnost neevidují ani samotní poskytovatelé a nemají namapované témata NKOD na témata EuroVoc, případně nemusí mít odpovídající metadatový systém. Při registraci datové sady skrz formulář je k dispozici pole pro vyplnění tématu Eurovoc, v lokálních katalozích ta možnost mnohdy chybí. Eurovoc se rovněž nehodí na klasifikaci veškerého obsah u - jedná se o slovník určený primárně pro evropské záležitosti. I proto je možnost vyplnění tématu Eurovoc doporučená, nikoli povinná. Nárůst úspěšnosti této metriky do budoucna tedy příliš velký nečekáme, je však určitě vhodné komunikovat a vysvětlovat vhodnost využití tohoto slovníku, případně i poradit poskytovatelům (udělat návod), jak do svých LKODů mohou Eurovoc zařadit, případně jak Eurovoc namapovat na stávající témata v NKOD.
Tato kategorie dostala celkem 76 z 91 bodů (83 %). Meziročně se jedná o zlepšení o 14b.
H1_3 Dostupnost dat Ukazatel H1_3 měří skutečné dostupnosti publikovaných datových sad a hodnotí trvalou platnost zveřejňovaných odkazů na datové sady.
Přehled dosažené % úspěšnosti metrik: A_08 - 97 % A_09 - 49% A_10 - 8 % A_11 - 24 % A_12 - 30 % A_13 - 95 %
U této kategorie byl zaznamenán mírný meziroční pokles (11 5→108), přičemž jednotlivé metriky mají rozdílný průběh. Nejkomplexnější metriku s nejvyšší váhou je A_08 týkající se dostupností schémat, distribucí a podmínek užití. Meziročně došlo k poklesu o 1b., nicméně stále je metrika splněna na 97 % (58 b., což je více než polovina obdržených bodů v této kategorii). Nejvyšší chybovost, respektive nedostupnost je možné nalézt u podmínek užití, a sice 9,7 %, přičemž nejvyšší míru nedostupnosti podmínek užití mají Česká obchodní inspekce, Česká školní inspekce, Hlavní město Praha a Ministerstvo obrany.
Metriky A_09, A_10 a A_11 se zabývají dostupnosti otevřených dat u jednotlivých
organizačních složek veřejné správy. V případě metriky A_09 hodnotící vybrané formy OVM
se dostupnost zhoršila o 9 bodů (z 26 na 17). U této metriky nově přibyly jako hodnotící
kriterium (SPARQ_L04 a SPARQL_05A) instituce KO 198 - Všechny státní orgány. V
hodnocení této oblasti je třeba vycházet pouze z tohoto roku (2022), jelikož se měnil počet
subjektů v porovnávané datové základně. Stejně tak došlo k poklesu i u A_10 hodnotíc í
dostupnost OD u ostatních organizací OVM registrovaných v RPP. K nárůstu došlo pouze u
metriky A_11 hodnotící dostupnost OD u organizací mimo RPP.
Zbylé 2 metriky se zaobírají přístupností a publikací dat v rámci projektů ICT ve VS. Zejména u metriky A _13 (viz. Příloha_7_Seznam schválených žádostí OHA s příslibem OD) , jež hodnotí přístup k datům v nových projektech IS VS, nastalo významné zlepšení, a to o 7b, čímž je úspěšnost metriky 95 %. Což se dá interpretovat tak, že povinnost publikovat OD v rámci nových projektů VS je již silně zakotvena v zaběhlých procesech.
Tato kategorie dostala celkem 108 ze 188 bodů (57 %). Meziročně se jedná o zhoršení o 7 b. Dostupnost dat tedy spíše stagnuje.
H1_4 Kvalita poskytovatelů Ukazatel H1_4 hodnotí poskytovatele z hlediska znalostní vybavenosti, správnosti publikace dat, metadat a následnou komunikaci s uživateli.
Přehled dosažené % úspěšnosti metrik: A_14 - 92 % A_15 - 85 % A_16 - 100 % A_17 – 91 % A_18 - 37 %
A_19 - 23 % A_20 - 24 % A_21 - 29 %
U této kategorie byl zaznamenán mírný nárůst bodů (50→53), přičemž v meziročním vývoji nejsou žádné významné změny. Metrika A_14 se zaobírá (ne)dostupností distribucí, schémat, podmínek užití a dokumentace datových sad; sestává se tedy z 4 dílčích indikátorů. Nejvyšší chybovost, tedy nedostupnost, je u distribucí datových sad, a to 15 %. Zde by bylo na místě kontaktovat statutární město Hradec Králové a AOPK, jež mají na tomto významný záporný podíl. Další 3 indikátory v rámci A_14 jsou již nad 96 %, tedy t éměř na maximu. Celkově je metrika úspěšná z 92 % a dostala 15 z 16 bodů.
Metrika A_15 hodnotí proces registrace datových sad, konkrétně vyplnění povinných atributů při registraci. Doporučujeme “zakleknout” na město Olomouc, Liberec a Hradec Králové. Celkově je však metrika úspěšná z 85 % (13 z 15).
Co se týče realizovaných školení (A_16 – viz. Příloha_2_Seznam realizovaných akcí v oblasti otevřených dat), tak v letošním roce jich proběhlo 68, jak tedy realizovanými MV, tak ostatními poskytovateli OD. Metrika je 100%, což je dané vysokým počtem školení. Horní hranice byla stanovena v době, kdy tato školení organizovalo téměř výhradně Ministerstvo vnitra, nicméně v posledních letech obdobná školení realizují i další OVM.
Metriky A_17 až A_19 hodnotí pov innost přiřazovat datové sady k tématům, slovníku EuroVOC či k OFN. Nejlepší hodnocení dosáhla metrika A_17, čili přiřazování k tématům, kde vyplněnost této položky dosahuje 91 %, což odpovídá 7 bodů z 8. Největšími “hříšníky” v této oblasti jsou ČTÚ, Mini sterstvo zdravotnictví a město Děčín. U metriky A_18 (vyplněnost EuroVOC) je situace horší, průměrná vyplněnost je u 37 % datových sad. Zde je na místě pochválit Ministerstvo spravedlnosti, které má oblast vyplněnou u všech 194 datových sad (jedná se však o agregaci dat za instituce publikující metadata z úředních desek jako OD, to stejná pak platí v případě metriky A_19). Ještě horší je pak průměrné pokrytí z hlediska otevřených formálních norem, které je pouze 23 %. Zajímavým úkazem je pak Ostrava, která má 46/178 datových sad dle OFN, ale uvádí ji i u datových sad, pro které OFN neexistuje. Obdobné nalezneme například i datasetů ČOI. Zde je nutno uvést, že NKOD nevaliduje, zda je pro daný dataset vytvořená OFN a zda -li je s ní v souladu. Tuto skutečnost z adává poskytovatel. Kolektiv autorů doporučuje zvážit přidání této funkcionality do NKOD.
Organizační připravenost poskytovatelů (A_20) k publikaci OD posuzuje procesní ukotvení do činností VS, kde daná instituce deklaruje zpracování směrnice k publikaci OD. V úvahy byly brány pouze instituce s více než 2 datovými sadami v NKOD. 17 ze 7 5 institucí na otázku odpovědělo kladně, což odpovídá 2 bodům (ze 7). Poslední metrika pak hodnotí systémový přístup k publikaci (A_21), kde poskytovatel é odpovídají na otázku zpracovaného publikačního plánu OD. Zde je situace o něco lepší, 22 ze 7 5 poskytovatelů odpovědělo, že publikační plán zpracovaný mají, což odpovídá 1 bodu ze 4 (25 %). Tyto dva ukazatele je dobré brát jako základní předpoklady ke koncepční pr áci s otevřenými daty. To se však ukazuje jako stále nedostatečné, a to i u významných a velkých poskytovatelů. Doporučujeme, aby se obě dvě metriky staly součástí ICT strategií a datového managementu jednotlivých organizací.
Celkově se dá říci, že nejv ětší nedostatky je možné eliminovat zejména při konzultaci s velkými, často statutárními městy, jež nemají nastavenou dostatečnou kvalitu procesu publikace a správy otevřených dat.
Tato kategorie dostala celkem 53 z 83 bodů (64 %). Meziročně se jedná o zlepšení o 3 b.
H1_5 Open data governance
Charakteristika získala 62 % možných bodů a skládá se ze tří metrik. Jelikož metrika A_24 -
Legislativní podpora dosáhla 100% naplněnosti tak potenciál růstu je zde u dvou metrik a to
A_22 - Otevřené formální normy pro publikaci otevřených dat VS a A_23 - Metodiky a postupy
pro publikaci otevřených dat VS.
Přehled dosažené % úspěšnosti metrik: A_22 - 32 % A_23 - 42 % A_24 - 100 %
U metriky A_22 bylo za rok 2022 dosaženo 6 bodů, což je mí rný pokles oproti roku 2021 (8 bodů) a úspěšnost metriky dosáhla úroveň 32 %. Metrika měří kvalitu, rozšíření a úroveň použití OFN. Body se dosahují zařazením do jednotlivých kategorií národním koordinátorem. Posun do další kategorie s vyšším skóre vyžaduj e, aby OFN měly kromě kvality také dostatečný počet a rovnoměrné pokrytí v tematických oblastech. Pro dosažení těchto cílů autoři doporučují, aby byly identifikovány další oblasti, ve kterých by bylo možné zavést povinnost publikovat otevřená data v podobě OFN, obdobně jako tomu bylo u úředních desek. Vzhledem k složitosti tvorby a implementace OFN v současné době je také důležité zaměřit se na vytvoření výrobní linky pro OFN, která by měla zrychlit a zjednodušit celý proces. V případě, že ani jedna z navrh ovaných možností zásadním způsobem nepomůže zrychlit tempo tvorby a implementace OFN, je potřebné vytvořit systematizovaný postup pro jejich tvorbu pod vedením DIA/národního koordinátora otevřených dat/menším týmem odborníků. Doporučujeme také zjistit od k olegů z jiných evropských zemí, jak zajišťují interoperabilitu u tematicky shodných dat, jak k tomu přistupují a co vše by nám mohlo pomoci s rozšířením a využíváním OFN v ČR.
Metrika A_23 - Legislativní podpora, sice nedosáhla maximálního možného počtu bodů, ale pro jeho zisk se stačí už jenom posunout do poslední/nejvyšší kategorie. Nejvyšší kategorie popisuje, že téměř všechny oblasti otevřených dat by měly být pokryty metodikami a doporučenými postupy. V této oblasti už jsme dosáhli podstatného posunu, a je proto potřeba setrvat v nastaveném trendu a podpoře. V případě, že bychom nedokázali ani v několikaletém horizontu dosáhnout maximálního možného počtu bodů, autoři doporučují identifikovat zbylé oblasti, ve kterých chybí metodiky a postupy a zaměřit se pak na jejich tvorbu a podporu při jejich tvorbě.
Celkově tato charakteristika vykazuje nadprůměrně vysokou úroveň zisku bodů, a proto doporučujeme vložit do naplnění této charakteristiky relativně menší lidské a časové zdroje a zaměřit se spíše na jiné oblasti.
Oblast Zhodnocování otevřených dat Ukazatel H2 reprezentuje hodnotu oblasti zhodnocující otevřená data a patří do 2. úrovně měření. Měření je založeno na měření následujících charakteristik:
množství aplikací a portálů využívajících otevřená data - ukazatel H2_1,
využívání otevřených dat v roli nástroje egovernmentu - ukazatel H2_2,
role otevřených dat při naplňování cílů open governmentu - ukazatel H2_3,
otevřená data jako zdroj pro nové služby a produkty - ukazatel H2_4. Shrnutí Počet bodů: 72/397 Tato oblast primárně monitoruje vzniklé aplikace a implementace rozdílných systémů, produktů a nástrojů nad OD. Ačkoli v roce 2021 měla oblast poměrně nízký bodový zisk, situace se v roce 2022 nijak nezlepšila. Naopak můžeme mluvit dokonce o mírném zhoršení, kdy oproti roku 2021 poklesl celkový počet bodů o 8 a dosáhl hranice 72 bodů z 397 Oblast zhodnocování otevřených dat tak přinejlepším vykazuje známky stagnace a je oblastí s největším potenciálem pro zlepšení. Za rok 2022 bylo dosaženo 18 % možných bodů a jednotlivé charakteristiky dosáhly tuto úroveň:
Aplikace a portály využívající otevřená data - 28 % (38 z 136)
Nástroj open governmentu - 23 % (16 z 69)
Nástroj egovernmentu - 0 % (0 ze 100)
Nové služby a produkty - 20 % (18 z 92) H2_1 Aplikace a portály využívající otevřená data V roce 2022 bylo celkově evidováno 64 produktů(aplikace, portály, služby/produkty, zpravodajské weby, viz. Příloha_3_Seznam aplikací) které aktivně využívali otevřená data. I přesto, že oproti roku 2021, se jedná o významný nárůst až 37 produktů, tak tato charakteristika vykázala jen velmi nízkou úroveň dosažených bodů (20%) a je zde vysoký potenciál pro zlepšení. Autoři vidí největší potenciál zejména v metrikách:
B_05 - Zapojení poskytovatelů otevřených dat do jejich zhodnocování
B_06 - Zájem poskytovatelů o způsob využití svých publikovaných dat aplikacemi a portály
Tyto metriky měří zájem poskytovatelů OD vytvářet aplikace nad OD a jejich zájem aktivně sledovat, jak jsou jejich data využívána dále. Za rok 2022 se asi jen třetina poskytovatelů podílela na vytvoření alespoň dvou aplikací a jenom asi 10 % aktivně sledovalo využívání vlastních OD. Samozřejmě je nad rámec MV vyžadovat od poskytovatelů, aby vytvářeli nové