10 Kavakindlalt määrata andmekogude / infosüsteemide põhiandmed ning jälgida nende kasutamist unikaalsuse (mitte-dubleeritavuse) tagamiseks. Tegevused ja vastutajad 2.1 Üleriigilise andmehalduse raamistiku rakendamine. Infoarhitektuuriliste valdkondlike mudelite rakendamine. Vastutaja: a) üleriigiline raamistik: Statistikaamet; valdkondlikult: IT asutused | Kaasatud: IT asutused, MKM, RIA, ITL 2.2 Andmekataloogi koostamise ja haldamise juhis. Vastutaja: Statistikaamet | Kaasatud: IT asutused, asutused; ITL 2.3 Funktsionaalsusnõuded andmestiku haldamiseks. Vastutaja: Statistikaamet ja MKM | Kaasatud: RIA, ITL 2.4 Riigi infosüsteemis eri tüüpi andmestike haldamiseks infoarhitektuurilise lahenduse ja rakenduse loomine (riigi infosüsteemi haldussüsteemi RIHA uuendamine). Vastutaja: RIA ja Statistikaamet | Kaasatud: MKM, Andmekaitseinspektsioon, asutused 2.5 Riigi põhiandmete määratlemine. Vastutaja: JUM ja MKM | Kaasatud: Statistikaamet, RIA, AKI, Maa-amet, Rahvusarhiiv, IT asutused, ITL 2.6 Pilootprojektid – ülevaadete loomine andmestikest valitud asutustes (3-4 asutust või funktsiooni). Vastutaja: Statistikaamet | Kaasatud: valitud asutused Vajalik ressurss Statistikaametis vastutajana ametikohad ning vahendid koordineerimiseks sh riigi põhiandmete üle järelevalveks. Uuendatud funktsionaalsusega RIHA loomine ja rakendamine. Andmekataloogi haldusvahendid asutustes.
- Andmekvaliteet
Andmekvaliteet on kolmas andmehalduse nurgakivi. Andmekvaliteet on tavaliselt esitatava määratluse kohaselt sobivus kasutamiseks (fitness for use). Mis on küllalt kvaliteetne ühel eesmärgil ei pruugi seda olla teisel eesmärgil. Andmekvaliteedi hästi rakenduvad käsitlused on olemas eri valdkondade kohta. Valdkondade ülesed mudelid (Total Data Quality Management – TDQM, Complete Data Quality Management – CDQM, Semantic Data Quality Management Framework – SDQM jt ) on seevastu raskesti rakendatavad, sest on ulatuslikud (kuni 70 tunnust). Valdkondlikud raamistikud, näiteks meditsiin, statistika või piltide osas, on aga omavahel üsna erinevad. 11 Andmekvaliteedi osas eksisteerib hulk mudeleid, mille hulgast tuleb rakendamiseks valida ja kasutusele võtta see, milles kokku lepitakse. Lisaks kvaliteedihalduse erinevatele mudelitele on Eestis Majandus- ja Kommunikatsiooniministeeriumi tellimisel koostatud andmekvaliteedi uuring ja koostanud andmekvaliteedi tagamise jälgimiseks ja juhtimiseks juhend. (Andmekvaliteedi uuring. Lõpparuanne. (August, 2016); Andmekvaliteedi tagamise juhend andmekogu omanikele. Juhend. (Sept, 2016)). Juhend esitab andmekvaliteedi juhtimise raamistiku, mille alusel toimub andmekvaliteedi juhtimise pidev parendamine küpsustasemete tõstmiseks, selle rakendamise metoodika ning andmete kvaliteedi haldamiseks soovituslikud andmekvaliteedi tunnused (komplekt sisaldab üheksat kvaliteeditunnust). On oluline teha vahet, kas andmekvaliteedi raamistikku rakendatakse andmestikule või infosüsteemile (andmekogule). Viimase puhul lisandub kvaliteedi käsitlusele tavaliselt kvaliteedi parendamise mehhanism, mis kannab küpsusmudeli (maturity model) nimetust. Andmekvaliteedi haldus on praktikas asutustes seotud ISO 9000 Quality management (Kvaliteedijuhtimine) kohase kvaliteedijuhtimise käsitlusega ehk kvaliteediprotsessiga. Lisaks on olemas ISO 8000 Data quality (Andmekvaliteet) andmekvaliteedi standardite perekond. See on andmekvaliteedi valdkonna terviklik süstemaatiline ülevaade. Selle kasutus on Eestis teadmata, standardiks see üle võetud ei ole. Andmed, olles kasutuses, võivad muutuda ehk transformeeruda. Seal hulgas toimuvad transformatsioonid andmeanalüüsil. Andmete analüüs toimub erinevates valdkondades ja näiteks pilditöötlusel on andmekvaliteet midagi muud kui andmete statistilisel töötlusel. Teaduses ja üldiselt andmete töötlemisel nende kvaliteedi kindlaks tegemise võimalus ja andmetöötluse jälgitavus on osa andmete usaldusväärsusest. Kogu andmete elukäigu järgimine (data lineage) võimaldab kvaliteeti tuvastada kogu aeg. Euroopa statistikasüsteemi (ESS) kvaliteedikäsitlus vaatleb teemat kahes osas: andmetöötlusprotsessi ja väljundi/toote kvaliteedikriteeriumid. Vaadeldavaid kriteeriume on kokku üheksa. Eesmärgid: Leppida kokku valdkondade ülene kvaliteedimudel, mis on seostub rahvusvaheliste valdkonna käsitlustega. Luua asutustes lihtsalt rakendatav andmekvaliteedi tagamise süsteem. Luua süsteem, mis võimaldab andmete avaldamisel/edastamisel teistele ning andmeanalüütikas veenduda andmekvaliteedis. Tegevused ja vastutajad 3.1 Andmekogude / infosüsteemide kvaliteedi tagamise juhise uuendatud versiooni koostamine. Vastutaja: MKM ja Statistikaamet | Kaasatud: AKI, asutused 3.2 Andmeanalüütikas, sh. statistikas vajaliku andmekvaliteedi tuvastamise ja kirjeldamise metoodika ja juhise loomine. Vastutaja: Statistikaamet | Kaasatud: teadlased; rahvusvahelist statistikat kasutavad asutused
12 Vajalik ressurss Statistikaametis vastutajana ametikohad ning vahendid juhtimiseks ja koordineerimiseks. MKM ressursid andmekvaliteedi tagamise juhendi uuendamiseks. Ressurss publitseeritud andmete sh avaandmete kvaliteedi jälgimiseks (võib olla automatiseeritud süsteem).
- Andmete avaldamine / avaandmed
Andmete ja teabe avaldamine / avalikustamine on üha ulatuslikum. Selle reguleerimiseks on nii kohustavad (teabe avalikustamine) kui ka piiravad isikuandmete, ärisaladuse, konfidentsiaalsusnõude kohta käivad õigusaktid. Andmete avaldamisel piirab nende teisest kasutamist võimatus veenduda andmete usaldusväärsuses. Kuigi avaldatud on palju andmeid, on see teave pigem informatiivne ja ei võimalda sellele toetuda kui faktilisele informatsioonile, mille alusel saaks teostada toiminguid või rajada äriteenuseid. Osalt on tegemist andmekvaliteedi küsimusega, kuid õigete andmete kättesaadavuse teema on olulisuse tõttu eraldi välja toodud. Samuti on olulised andmete käitlemisel privaatsuse ja konfidentsiaalsuse tagamine. See võib põhineda erinevatel anonümiseerimise ja pseudonümiseerimise ning otsest tuvastamist mittevõimaldavale kujule viimise (otmimise) meetoditel. Eestis põimuvad avaandmed ja avalik teave kui lähedased küsimused. Avaandmete õiguslik regulatsioon piirdub termini nimetamisega sulgudes avaliku teabe seaduses, määratledes, et avaandmed on teave, mille üldist kasutamist ei ole seadusega või seadusega kehtestatud korras piiratud. Avaliku teabe seadus kohustab teabevaldaja (s.o asutuse) tal oleva teabe avalikustama oma veebilehel. Teisalt on asutused teinud eraldi avaandmete portaale. Avaandmete rahvusvaheline kogukond kasutab nii avaandmete (open data) kui ka avatud teadmise (open knowledge) definitsiooni. Teadmus on avatud, kui igaüks pääseb sellele vabalt ligi, saab seda vabalt kasutada, täiendada ning jagada — seadmata piiranguid muuks, kui teadmuse allikapärasuse ja avatuse tagamiseks. Avatud tähendab, et igaüks saab vabalt teadmusele juurdepääsu, et seda kasutada, muuta ja jagada tingimusel, et ta vähemalt viitab allikale (näitab ära provenientsi ehk päritolu) ja tagab avatuse. Avatud teadmust käsitletakse selles vaates ühisandmevarana (data commons), mille kasutamises võib igaüks osaleda. Osa andmetest / andmestikest / andmebaasidest on käsitletavad kui teosed. See tähendab, et neile on tekkinud autorlus ja rakenduvad autoriõigused. Andmetele, mis avaldatakse või edastatakse teisele kasutajale tuleks lisada litsentsid, mis kirjeldavad edasisi kasutustingimusi. Teadusandmete avaldamisel on kokku lepitud kindlad printsiibid. Neid tuntakse kui FAIR põhimõtteid: leitavus (Findability), juurdepääsetavus (Accessibility), koosvõimelisus (Interoperability) ja taaskasutatavus (Reusability) (The FAIR Guiding Principles for scientific data management and stewardship, 2016).
13 Eesmärgid: Andmete ja teabe võimalikult ulatuslik avalikustamine. Avaldatud andmete usaldusväärsuse tõstmine. Andmete mitmekordse kasutamise parandamine, järgides samas privaatsus- ja konfidentsiaalsusnõudeid. Litsentside lisamine avaandmetele. Tegevused ja vastutajad 4.1 Andmete usaldusväärsuse tagamise ja selle tuvastamise metoodika koostamine. Vastutaja: RIA, Statistikaamet | Kaasatud: JUM, MKM, AKI 4.2 Anonümiseerimise ja pseudonümiseerimise ning teiste otsest tuvastamist mittevõimaldavale kujule viimise (otmimise) meetodite arendamine ja nende juurutamine. Vastutaja: RIA | Kaasatud: AKI, Statistikaamet 4.3 Andmetele nende avaldamisel lisatavate litsentside kokku leppimine ja unikaalsete identifikaatorite lisamine ning juhend nende kasutamiseks. Vastutaja: MKM | Kaasatud: JUM ja Statistikaamet, avaandmete kogukond; teadusasutused ja raamatukogud Vajalik ressurss Statistikaametis vastutajana ametikohad ning vahendid juhtimiseks ja koordineerimiseks. Anonümiseerimise ja pseudonümiseerimise ning otsest tuvastamist mittevõimaldavale kujule viimise meetodite arendamine ja nende juurutamine. MKM litsentside ja unikaalsete identifikaatorite lisamise juurutamine.
- Andmete elukäiguhaldus
Andmete elukäiguhaldus on neljas andmehalduse nurgakivi. Mitmetest erinevast elukäigu halduse käsitlusest on andmehalduse juurutamiseks oluline tegeleda 1. protsessi elukäigu haldusega ja 2. elukäigu haldusega, mis tähendab andmete säilitamist. Üheks keskseks printsiibiks elukäigu halduse juures on andmete usaldusväärsuse ja muu kvaliteedi tagamine ajas. Teiseks on andmete väärtuse hindamine. Väärtuse välja selgitamisel ja sellest tuleneva säilitustähtaja määramisel lõikuvad kolm vaadet: 1. andmete tõestusväärtus, 2. andmete kasutamine teaduses, mille alla võib lugeda ka kogu andmeanalüüsi ja statistika ning 3. andmete vastu huvi tundmise ühiskondlik dimensioon, mis annab andmete alusel ülevaatlikkuse ühiskonnas toimuvast ja võimaldab osutada andmeteenuseid. Andmete elukäiguhaldus on ühtlasi infosüsteemi funktsionaalsus. See funktsionaalsus väljendub ühelt poolt metaandmetes ja teiselt poolt tegevustes/sündmustes/protsessis, milles andmeid kasutatakse ja mida andmehalduse kontekstis nimetatakse data lineage.
Eraldi vaade andmete elukäigule on nende haldamine ja säilitamine arhiivisüsteemis. Infosüsteemina nimetatakse arhiive sageli repositooriumiteks. Eristuvadki kaks käsitlust: esmalt 14 muutumatute andmete vaade ja teisalt master data (on seotud põhiandmete käsitlusega, kuid ei kattu sellega täielikult) kui tõena käsitletava kirje (system of record – SOR) vaade. Viimane on siin seostatav põhiandmete temaatikaga. Repositoorium toimib nii andmete säilitamise kui ka avalikustamise kohana ning andmed on selles kirjeldatud ja leitavad. Oluline on see, et nad on selles muutumatud. Repositooriumi olemasolu toetab hallatavate andmete üldist usaldatavust. Eesmärgid: Andmete elukäik on halduse all ja seda toetav metoodika on rakendunud. Andmete väärtuse hindamine ja väärtust enam mitte omavate andmete kontrollitud hävitamine. Andmete säilitamiseks ja kasutamiseks repositooriumi (andmearhiivi) loomine (Statistikaametis).
Tegevused ja vastutajad 5.1 Protsessi kui elukäigu haldus: funktsionaalsusnõuded data lineage’i juurutamiseks. Vastutaja: Statistikaamet | Kaasatud: MKM, ITL 5.2 Andmete väärtuse hindamine metoodika ja juhise väljatöötamine. Vastutaja: Statistikaamet ja Rahvusarhiiv | Kaasatud: asutused 5.3 Asutuses andmestike repositooriumite pidamise nõuete või soovituste väljatöötamine. Vastutaja: Statistikaamet ja Rahvusarhiiv | Kaasatud: MKM 5.4 Avaldatud andmestike haldamise ja säilitamise repositooriumi (andmearhiivi) loomine Statistikaametis. Vastutaja: Statistikaamet Vajalik ressurss Statistikaametis vastutajana ametikohad. Vahendid metoodikate ja juhiste väljatöötamiseks ja juurutamiseks. Andmearhiivi / repositooriumi loomise ja juurutamise ressurss.
- Andmehaldur ja täiendkoolitus
Organisatsioonid vajavad hea andmeanalüüsi koostamiseks ning teadmuspõhiste otsuste tegemiseks selget ja arusaadavat ülevaadet andmetest andmestikest ja andmekogudest, nende andmekvaliteedist ja andmete elukäiguhaldusest. Praegu puudub enamikel organisatsioonidel selgus, milline töötaja ja kuidas oleks vastutav andmestike ja andmete eest ehk andmehalduse vaates oleks andmete omanik.
Andmehaldus on infoühiskonna professionaalne tegevus. See tähendab, et andmehalduril on oma kutseoskused. Organisatsioonidel tuleks määrata andmete eest vastutaja (andmete omanik) ehk andmehaldur (data steward). 15 Andmehaldurite saamiseks organisatsioonidesse on vajalik nende täiendkoolitus. Praegu ei ole Eestis neile sobivaid koolitusprogramme. Koolituskava koostamine ja koolitusmaterjalide loomine peab käima koos andmehalduse valdkonna praktilise edendamisega riigis. Eesmärgid: Andmehalduse koolitussüsteemi loomine. Professionaalsete teadmiste ja oskustega andmehaldurite olemasolu neid vajavates asutustes. Tegevused ja vastutajad 6.1 Andmehalduse ülesannete täitmiseks vajalike oskuste omandamiseks andmehalduri töökirjelduse ja koolitusprogrammi koostamine. Vajalike koolitusmaterjalide koostamine. Vastutaja: RM, MKM ja Statistikaamet | Kaasatud: MKM, Kutsekoda, koolitusasutused 6.2 Täiendkoolituse läbiviimine. Vastutaja: koolituse korraldajad ja Rahandusministeerium | Kaasatud: Statistikaamet Vajalik ressurss Koolitusmaterjalide koostamine. Täiendkoolituse läbiviimine.
16 Ajakava 2019-2021 Lisatud ajakava arvestab Statistikaameti strateegia „Statistikaamet riikliku andmehalduse (data governance) juhtrollis“ 2018-2022 meetmetega ning lähtub riigi andmehalduse töörühmas läbi arutatud teemadest. Tabel 1: Tabeli 2 tähistuste selgitus
-
poolaasta täpsusega märgitud tegevus/projekt, millel on konkreetne tulem/väljund
-
pidev tegevus
-
pidev tegevus, mille kestel on konkreetsemaid projekte
Tabel 2: Ajakava tegevuskava valdkondade ja alategevuste ning poolaastate kaupa 2019-2021
2019 2020 2021 I II I II I II
- Andmekirjeldus ja metaandmed
1.1 Andmekirjelduse standardi koostamine
1.2 Semantilist koostalitusvõimet edendavate valdkondlike sõnastike koostamine
1.3 Ülevaate omamine rahvusvahelistest valdkondlikest andmehaldusega seotud standarditest. Standardite ülevõtmine, tõlkimine ja juurutamine sh andmehaldusega seotud mõisted ja terminoloogia
1.4 Klassifikaatorite ühtlustatud kirjelduste juurutamine ja klassifikaatorite haldussüsteemi uuendamine
- Andmestike ülevaade ja põhiandmete määratlemine
2.1 Üleriigilise andmehalduse raamistiku rakendamine. Infoarhitektuuriliste valdkondlike mudelite rakendamine
2.2 Andmekataloogi koostamise ja haldamise juhis
2.3 Funktsionaalsusnõuded andmestiku haldamiseks
2.4 Riigi infosüsteemis eri tüüpi andmestike haldamiseks infoarhitektuurilise lahenduse ja rakenduse loomine (Riigi infosüsteemi haldussüsteemi RIHA uuendamine)
2.5 Riigi põhiandmete määratlemine
2.6 Pilootprojektid – ülevaadete loomine andmestikest valitud asutustes (3-4 asutust või funktsiooni)
- Andmekvaliteet
3.1 Andmekogude / infosüsteemide kvaliteedi tagamise juhise uuendatud versiooni koostamine
3.2 Andmeanalüütikas sh statistikas vajaliku andmekvaliteedi tuvastamise ja kirjeldamise metoodika ja juhise loomine
- Andmete avaldamine / avaandmed
4.1 Andmete usaldusväärsuse tagamise ja selle tuvastamise metoodika koostamine
17
2019 2020 2021 I II I II I II 4.2 Anonümiseerimise ja pseudonümiseerimise ning teiste otsest tuvastamist mittevõimaldavale kujule viimise (otmimise) meetodite arendamine ja nende juurutamine
4.3 Andmetele nende avaldamisel lisatavate litsentside kokku leppimine ja unikaalsete identifikaatorite lisamine ning juhend nende kasutamiseks
- Andmete elukäiguhaldus
5.1 Protsessi kui elukäigu haldus: funktsionaalsusnõuded data lineage’i juurutamiseks
5.2 Andmete väärtuse hindamine metoodika ja juhise väljatöötamine
5.3 Asutuses andmestike repositooriumite pidamise nõuete või soovituste väljatöötamine
5.4 Avaldatud andmestike haldamise ja säilitamise repositooriumi (andmearhiivi) loomise Statistikaametis
- Andmehaldur ja täiendkoolitus
6.1 Andmehalduse ülesannete täitmiseks vajalike oskuste omandamiseks andmehalduri töökirjelduse ja koolitusprogrammi koostamine. Vajalike koolitusmaterjalide koostamine
6.2 Täiendkoolituse läbiviimine