C3V10.pdf

Type: Document | Status: ready

C3V10 - Metodika pro vypracování analýzy dopadu otevřených dat do prostředí ČR

Vytvořeno v rámci projektu

Rozvoj datových politik v oblasti zlepšování kvality a interoperability dat veřejné správy CZ.03.4.74/0.0/0.0/15_025/0013983

Klíčová aktivita: 04 Návrhy a realizace opatření pro zvyšování povědomí o otevřených datech

2

Obsah 1 Úvod 6 2 Princip měření a jeho struktura 6 2.1 Měření dopadu otevřených dat 6 2.2 Princip a struktura měření 9 2.2.1 Struktura měření 9 2.2.2 Systém měření 10 2.2.3 Použité způsoby měření v metrikách 11 2.2.4 Zdroje informací a údajů pro měření 13 2.2.5 Základní ukazatele 15 2.2.6 Doplňující ukazatele 17 2.3 Přehled navržených metrik 20 2.3.1 Metriky oblasti publikovaných dat 20 2.3.2 Metriky oblasti zhodnocování otevřených dat. 21 2.2.3 Metriky oblasti užívání dat. 23 3 Popis metrik a základních ukazatelů 23 3.1 Měření oblasti publikovaných dat 24 3.1.1 Ukazatel “H1 Data, - atributy a podmínky kvalitní suroviny” 25 3.1.2 Ukazatel “H1_1 Kvalita dat” 25 A_01 Tematická vyváženost publikace OD 25 A_02 Vyváženost publikace údajů ve formátu OD napříč tématy EuroVoc. 26 A_03 Podněty uživatelů k publikaci otevřených dat ("open data wishlist") 27 A_04 Komunikace s uživateli otevřených dat 28 3.1.3 Ukazatel “H1_2 Kvalita metadat” 28 A_05 Kvalita metadatových záznamů v NKOD 29 A_06 Tematického zařazení publikovaných datových sad. 29 A_07 Kvalita popisu datových sad pomocí slovníku Eurovoc. 30 3.1.4 Ukazatel “H1_3 Dostupnost dat” 31 A_08 Dostupnost distribucí, schémat, podmínek užití a dokumentace v NKOD 31 A_09 Dostupnost otevřených dat publikovaných organizacemi vybraných kategorií OVM

33 A_10 Dostupnost otevřených dat organizací registrovaných v RPP ostatních kategorií OVM 34 A_11 Dostupnost otevřených dat organizací neregistrovaných v RPP. 35 A_12 Zahrnutí publikace OD do nových projektů VS 36 A_13 Zajištění přístupu k datům v nových projektech IS VS 36 3.1.5 Ukazatel “H1_4 Kvalita poskytovatelů” 37 A_14 Zajištění dostupnosti distribucí, schémat, podmínek užití a dokumentace poskytovateli OD 38 A_15 Kvalita registrace metadat poskytovateli OD. 39 A_16 Školení pracovníků VS v oblasti otevřených dat 39

3

A_17 Dodržování povinného přiřazení datových sad k tematickým oblastem publikace poskytovateli. 40 A_18 Využívání slovníku EuroVoc poskytovateli k popisu datových sad 41 A_19 Publikace OD dle otevřených formálních norem 42 A_20: Organizační připravenost poskytovatelů k publikaci OD 43 A_21 Systémový přístup k publikaci otevřených dat 44 3.1.6 Ukazatel “H1_5 Open data governance” 44 A_22 Otevřené formální normy pro publikaci otevřených dat VS 44 A_23 Metodiky a postupy pro publikaci otevřených dat VS 45 A_24 Legislativní podpora 45 3.2 Měření oblasti zhodnocování otevřených dat 46 3.2.1 Ukazatel “H2 Zhodnocení, - oblasti a způsoby zhodnocování” 46 3.2.2 Ukazatel “H2_1 Aplikace a portály využívající otevřená data” 47 B_01 Pokrytí tematických oblastí publikace dat aplikacemi a portály 47 B_02 Aplikace a portály pro specifické skupiny občanů využívající otevřená data 48 B_03 Zpravodajské weby využívající otevřená data 51 B_04 Trend zhodnocování otevřených dat prostřednictvím aplikací, portálů a zpravodajských webů. 52 B_05 Zapojení poskytovatelů otevřených dat do jejich zhodnocování. 53 B_06 Zájem poskytovatelů o způsob využití svých publikovaných dat aplikacemi a portály 53 3.2.3 Ukazatel “H2_2 Nástroj open governmentu” 54 B_07 Transparentnost hlasování samospráv 54 B_08 Otevřenost parlamentu ČR 55 B_09 Dostupnost otevřených dat, které slouží jako nástroj transparentnosti, u organizací vybraných kategorií OVM 56 B_10 Dostupnost otevřených dat, které slouží jako nástroj transparentnosti, u organizací registrovaných v RPP ostatních kategorií OVM 57 B_11 Dostupnost otevřených dat, které slouží jako nástroj transparentnosti, u neregistrovaných organizací v RPP 58 B_12 Aplikace a portály monitorující činnost organizací na základě otevřených dat 59 3.2.4 Ukazatel “H2_3 Nástroj egovernmentu” 60 B_13 Otevření veřejných údajů agend VS pro jejich publikaci v podobě otevřených dat.

60 B_14 Zpřístupnění registrovaných veřejných údajů prostřednictvím VDF 61 B_15 Využívání registrovaných veřejných údajů z VDF organizacemi veřejné správy při výkonu agend 61 B_16 Využívání registrovaných veřejných údajů z VDF agendami. 62 3.2.5 Ukazatel “H2_4 Nové služby a produkty” 63 B_17 Nové produkty a služby 63 B_18 Využití OD ve výzkumných projektech 64 3.3 Měření oblasti užívání dat 64 3.3.1 Ukazatel “H3 Uživatel” 65 C_1 Odborné články na portálech otevřených dat 65

4

C_2 Komunity v oblasti publikace a užívání otevřených dat 66 C_3 Rozvoj digitální gramotnosti na úrovni VŠ 66 C_4 Organizované konference, hackathony, semináře a další akce související s otevřenými daty 67 C_5 Využití OD v závěrečných pracích VŠ 67 3.4 Doplňující ukazatele 68 4 Metodické a praktické pokyny pro práci s metrikami 71 Přehled existujících studií 72 5 Závěr 73 Přílohy. 74 Příloha 1 - Seznam dotazů SPARQL 74 SPARQL_01 74 SPARQL_02 76 SPARQL_03 76 SPARQL_04 77 SPARQL_05 78 SPARQL_06 81 SPARQL_07 82 SPARQL_08 83 SPARQL_09 83 SPARQL_10 84 SPARQL_11 86 SPARQL_12 87 SPARQL_13 89 SPARQL_14 91 SPARQL_15 92 SPARQL_16 92 SPARQL_17 92 SPARQL_18 93 SPARQL_19 93 SPARQL_20 93 SPARQL_21 93 SPARQL_22 93 Příloha 2 - Tematické oblasti pro katalogizaci otevřených dat. 93 Příloha 3 - Témata slovníku Eurovoc 94 Příloha 4 - Koeficienty ukazatelů H4_1 až H4_4. 97 Příloha 5 - Stanovení vah základních ukazatelů 98 Příloha 6 - Vyhledávání informací na webu 101 Pokročilé vyhledávání Google 101 Vyhledávání na konkrétních portálech 101 Příloha 7 - Vizualizace vah ukazatelů a metrik. 103

5

Detail metrik 104 Příloha 8 - Seznam aplikací a portálů 105 Příloha 9 - Příklad evidence vstupních údajů 106

6

1 Úvod Metodika shrnuje postupy pro vypracování analýzy dopadů otevřených dat v České republice, popisuje východiska pro měření dopadů otevřených dat a vysvětluje samotný pojem “dopad otevřených dat”. V praktické části (Metodické a praktické pokyny pro práci s metrikami) je popsán samotný postup měření a analýzy dopadů otevřených dat.
2 Princip měření a jeho struktura 2.1 Měření dopadu otevřených dat Posuzování dopadu otevřených dat je stále obecně považováno za oblast bez všeobecného konsensu, nejen pokud jde o definici pojmu “dopady otevřených dat”, ale i samotných přístupů k jejich měření. Základním problémem je skutečnost, že otevřená data se neprojevují bezprostředně v životě společnosti, ale až zprostředkovaně na základě užití a působení nově vytvořených hodnot z otevřených dat a často navíc s časovým zpožděním. Pro pochopení navrženého přístupu k měření dopadu otevřených dat v této metodice je vhodné celý problém více vysvětlit. Legitimita, zavádění a používání otevřených dat jsou všeobecně (např. dle Open Data's Impact - The GovLab) určovány následujícími cíli:

  1. Zlepšení vládnutí v oblastech působnosti organizací a jejich kompetencí: o boj proti korupci, o posílení veřejných služeb a účinnější alokace zdrojů, o zvýšení transparentnosti.
  2. Posílení postavení občanů: o informovanější rozhodování, o vytváření nových forem sociální mobilizace, o zavádění nových způsobů komunikace a přístupu k informacím.
  3. Vytváření nových ekonomických příležitostí: o podpora inovací, o podpora hospodářského růstu, o vytváření pracovních míst.
  4. Řešení veřejných problémů: o přístupy k novým formám hodnocení těchto problémů založené na datech, o zapojení občanů založené na datech, které vede k cílenějším intervencím a lepší vzájemnou spolupráci. Z uvedeného výčtu je patrné, že mimo cíle č.3 ostatní cíle pro své naplnění většinou vyžadují změnu zakotvených způsobů chování, přístupů a paradigmat ve společnosti. Toho je možné dosáhnout pouze vznikem nových hodnot vytvořených na základě otevřených dat a jejich postupnou a časově náročnou implementací do života společnosti. S užíváním takto vytvořených hodnot se také následně objeví i přínosy vyplývající z otevřených dat a měření jejich dopadu se stane reálné.

7

Přímé měření dopadů otevřených dat tedy není zatím možné, ale klíčem k jejich „předstižnému“ měření by mohly být hodnoty vznikající jejich využíváním a zhodnocováním.
Bohužel ale ani v tomto případě se nejedná o snadný úkol, neboť zhodnocování otevřených dat se většinou týká kategorie „digitálních produktů“, které jsou charakteristické skutečností, že nepředstavují úplnou a konečnou hodnotu produktu. Digitální produkty jsou nositelem „potenciální hodnoty“ a naplnění jejich potenciálu (doplnění úplné hodnoty produktu) je závislé na znalostní a dovednostní výbavě uživatele těchto produktů a také jeho zájmu a chuti produkt používat. Dobrý produkt v rukou nevhodného uživatele může být snadno degradován na bezcennost s nulovou hodnotou. Měření vytvořených hodnot založených na otevřených datech není proto snadné a vyžaduje komplexnější přístup zaměřený na celé prostředí otevřených dat reprezentující hodnototvorný proces, přičemž uživatel je jeho nedílnou součástí. Problém je navíc komplikován faktem, že neexistuje jednoduchý způsob, jak stanovit a vyjádřit (kvantifikovat) konkrétní hodnotu jednotlivých vytvořených produktů nebo služeb. Velká část vytvořených hodnot spadá do kategorie “společenských hodnot”, kde jakákoliv snaha o kvantifikaci hodnocení je iluzorní a v podstatě až nereálná. Například jakým způsobem by bylo možné stanovit (kvantifikovat) hodnotu „Transparentnost rozhodování organizace“? Vnímání hodnoty je navíc velmi závislé na způsobu jakým je užita a také na tom, kdo ji užívá. Vnímání hodnoty je tedy také navíc do značné míry subjektivní, což pro objektivní měření dopadu otevřených dat je opět další překážka.
Přímé měření dopadu otevřených dat i měření vytvořených hodnot na jejich základě je tedy problematické a zatím až nereálné. Nabízí se ale nepřímý přístup, který je založen na měření připravenosti celého prostředí otevřených dat k jejich zhodnocování, prostřednictvím sady vybraných vlastností a charakteristik reprezentujících požadovanou připravenost. Konkrétně to znamená :
● Měření oblasti produkující kvalitní otevřená data, která je charakterizovaná: ○ kvalitou samotných dat, ○ kvalitou metadat, ○ dostupností dat, ○ kvalitou a přístupem poskytovatelů dat, ○ řízením a správou prostředí otevřených dat ve veřejné správě - Open data governance. ● Měření oblasti zhodnocující otevřená data, která je charakterizovaná: ○ dostatečným množstvím aplikací a portálů využívajících otevřená data, ○ způsoby využívání otevřených dat v roli nástroje egovernmentu, ○ rolemi otevřených dat při naplňování cílů open governmentu, ○ využíváním otevřených dat jako zdroje pro nové služby a produkty. ● Měření oblasti užívající vytvořené hodnoty, která je charakterizovaná celkovou erudovaností uživatelů. Aby měření bylo v maximální míře objektivní a poskytovalo obraz o potenciálním zhodnocování otevřených dat (a tedy o potenciálně vzniklých hodnotách), je měření založeno na hodnocení celého hodnototvorného prostředí vůči ideálnímu stavu takového prostředí. Ideální stav je charakterizován souborem objektivně stanovených hodnot vybraných atributů jeho jednotlivých prvků.

8

Obrázek 1 Hodnototvorné prostředí otevřených dat Vznik hodnoty otevřených dat vyžaduje souhru, synergii a vzájemnou provázanost tří oblastí: ● Oblast publikovaných dat ve formátu otevřených dat (otevřená data). ● Oblast zhodnocování otevřených dat (zpracovatelé, zprostředkovatelé, ...). ● Oblast užívání dat i zhodnocených forem (občané, pracovníci VS, společnosti, organizace VS, zpracovatelé OD, ...). Realizace výsledné hodnoty je závislá na všech třech oblastech hodnototvorného prostředí a jenom přítomnost a souhra všech oblastí je zárukou, že hodnota otevřených dat se naplní. Všechny tři uvedené oblasti reprezentují prvky ekosystému otevřených dat, pro které platí, že mezi nimi existují vzájemné interaktivní vazby. Tyto vazby mají podobu zpětnovazebních smyček, které zajišťují, že celý ekosystém (hodnototvorný řetězec) bude funkční i bez působení externích faktorů. Interakce mezi jednotlivými prvky ekosystému ve formě posilovacích zpětnovazebních smyček mohou ale také vést k jeho nefunkčnosti v případě absence, nebo nedostatečné funkčnosti jeho jednotlivých prvků. Pro úplnost je nutné dodat, že čtvrtou oblastí ekosystému s velkým vlivem na jeho celkovou funkčnost jsou dopady (benefity) otevřených dat do života společnosti.

Měření je tedy zaměřeno na kvalitu a úplnost celého hodnototvorného prostředí a předmětem měření jsou charakteristiky jednotlivých oblastí prostředí a jejich detailnější struktury reprezentované konkrétními metrikami. Z výsledků měření lze usuzovat do jaké míry jsou jednotlivé oblasti prostředí schopny ve vzájemném souladu vytvářet potenciální hodnoty otevřených dat.

9

2.2 Princip a struktura měření 2.2.1 Struktura měření Předmětem měření jsou tři oblasti hodnototvorného prostředí, u každé oblasti se posuzují její základní charakteristiky na základě údajů zjištěných vždy odpovídající sadou metrik.
Struktura měření se skládá ze čtyř úrovní.

● Úroveň 1. ○ Jeden souhrnný ukazatel: “Prostředí - struktura základních hodnototvorných prvků”.

10

○ Jedná se o nejvyšší úroveň měření zaměřenou na zjištění hodnoty celého hodnototvorného prostředí ve srovnání s nejvyšší možnou hodnotou “ideálu” reprezentovanou 1000 bodů. Hodnota je dána sumarizací hodnot jednotlivých metrik. ● Úroveň 2. ○ Druhá úroveň měření je vyhrazena ukazatelům, které zpracovávají hodnoty ukazatelů ze třetí úrovně měření, a které jsou zaměřeny na hodnocení celých jednotlivých oblastí hodnototvorného prostředí: ■ “Data, - atributy a podmínky kvalitní suroviny” ■ “Zhodnocení, - oblasti a způsoby zhodnocování” ■ “Uživatel” ● Úroveň 3. ○ Třetí úroveň měření je reprezentována ukazateli, které zpracovávají hodnoty naměřené metrikami a jsou zaměřené na hodnocení základních zastřešujících charakteristik jednotlivých oblastí. ■ Kvalita dat ■ Kvalita metadat ■ Dostupnost dat ■ Kvalita poskytovatelů ■ Open data governance ■ Aplikace a portály využívající otevřená data ■ Nástroj egovernmentu ■ Nástroj open governmentu ■ Nové služby a produkty ● Úroveň 4. ○ Metriky měřící jednotlivé prvky hodnototvorného prostředí (47 prvků).
○ Každý měřený prvek má navržený způsob měření a jím naměřená hodnota slouží jednak pro posouzení připravenosti samotného prvku k dalšímu zhodnocování a zejména pro další zpracování ukazateli zaměřenými na celé hodnototvorné prostředí. 2.2.2 Systém měření Měření je založeno na měření charakteristických vlastností všech oblastí hodnototvorného prostředí, přičemž každá měřená vlastnost má přiřazenou váhu, která vyjadřuje její význam v procesu zhodnocování otevřených dat. Stanovení významu (vah) jednotlivých charakteristik vychází ze vzorového (ideálního) prostředí, které je ohodnoceno 1000 body (není to tedy ani hodnota otevřených dat, ani vyjádření jejich dopadu do života společnosti). Hodnota vah jednotlivých charakteristik je stanovena na základě konsenzu 11 expertních odhadů. Prakticky to znamená, že každá měřená vlastnost prostředí má vždy určenou její vzorovou (cílovou) podobu a samotné měření je založeno na porovnání skutečnosti s jejím vzorem. Rozdíly mezi skutečnostmi a vzorem jsou ukazateli stávajícího stavu hodnototvorného prostředí, ale také jsou významnými manažerskými informacemi pro řízenou a cílenou kultivaci prostředí otevřených dat. Stručná charakteristika systému měření: ● Měření celého hodnototvorného prostředí se skládá ze 47 měřených prvků (prvků, atributů, charakteristik, ...).

Page 1 of 12