22
Andmeomanik Kirjeldus Osakonna / valdkonna / teenuste juht või peakasutaja, kes on protsesside omanik, kindla huvigrupi esindaja andmekvaliteedi nõuete esitamisel. Andmete tegelik omanik. Vastutab järgmiste tegevuste / otsuste eest • Andmehaldusorganisatsiooni poolt hallatavate andmevarade juhtimise/arhitektuuri printsiipide juurutamine ja järelevalve oma valdkonnas. • Valdkonna mõistete ja reeglite/nõuete kirjeldamine, ühtlustamine ja kooskõlastamine. • Valdkonna kontseptuaalse mudeli loomine, haldamine. • Andmekvaliteedi reeglite seadmine vastavalt reeglistikule. • Huvigruppide ja kasutajate andmekvaliteedi probleemide ja nõuete registreerimine, ootuste juhtimine. • Andmekvaliteedi parendamise protsesside ja projektide algatamine ning järjestamine. • Ärisõnastikul ja ärireeglitel baseeruvate IT arendusnõuete kinnitamine. • Andmehaldurite ja andmetöötlejate määramine. • Andmete kogumise/muutmise, salvestamise, kasutusõiguste, säilitamise ja hävitamise reeglite määramine. Osaleb järgmistes tegevustes • Esitab valdkonnapõhiselt nõuded ja ootused andmehalduse, arhitektuuri printsiipide täiendamiseks ja muutmiseks. • Esitab teistele valdkondadele nõudeid andmete kogumiseks, kvaliteedi parandamiseks. • Andmekvaliteedi reeglitele mõõdikute määramine.
Andmehaldur Kirjeldus Andmete ekspert, kes omab parimat teadmist: • valdkonna andmestikest ja lähtesüsteemide andmetest; • ühiskasutatavatest põhiandmetest; • teenuste ja mõõdikutega seotud andmetest. Vastutab järgmiste tegevuste / otsuste eest • Täidab mõistetega sõnastikku, teeb ettepanekud kontseptuaalse mudeli muudatuseks. • Valdkonna mõistete ühtlustamise protsessi vedamine. • Andmekvaliteedi reeglitele mõõdikute määramine, mõõtetulemuste kogumine ja raporteerimine. • Lahendab probleemid kus võimalik või edastab andmeomanikule. • Nõuete kogumine, nende sõnastikule ja kontseptuaalsele mudelile vastavuse tagamine. • Kaardistab sõnastiku mõistete ja füüsiliste IT andmeobjektide vahelised seosed. • Mõistab ja jälgib andmete õigsust, täielikkust, kooskõla, usaldusväärsust, ajakohasust, reeglipärasust, konfidentsiaalsust, ühekordsust ja mitteliiasust. Lisaks jälgib kättesaadavust, viidete terviklikkust ning üldist arusaadavust. • Andmekvaliteedi probleemide põhjuste väljaselgitamine ja sellest tegevusele tekkiva mõju hindamine. • IT arendusprojektide juures andmete ja andmepõhiste teenuste valideerimine.
23
• Aruannete registri täitmine. Osaleb järgmistes tegevustes • Andmeomanike ja huvigruppide toetamine mõistete, ärireeglite, mudeli, andmekvaliteedi reeglite kirjeldamisel. • Andmetöötlejate töökorraldus ja juhendamine.
Metaandmete analüütik
Kirjeldus
IT- ja metaandmete süsteemide tundja, omab ülevaadet kindla süsteemiga
seotud andmetest ja kvaliteedi mõõtmise vahenditest.
Vastutab järgmiste
tegevuste / otsuste eest
•
Nõuete ja andmekvaliteedi reeglite IT süsteemidesse juurutamise
nõustamine.
•
IT arenduste valideerimine andmetele seatud reeglitega vastavuse
tagamiseks.
•
Regulaarsete ja ühekordsete andmepäringute teostamine
andmekvaliteedi probleemide põhjuste välja selgitamiseks.
•
Aruannete registri täitmine, andmehalduri tähelepanu juhtimine
avastatud probleemidele IT süsteemides.
•
Andmehalduse ja -kvaliteediga seonduva tarkvara juurutamine (ETL,
andmekataloogid, kvaliteedireeglite jälgimine).
Osaleb järgmistes
tegevustes
•
Nõustab andmekvaliteedi mõõdikute väljatöötamist ja andmete
ühtlustamist.
•
Andmetöötlejate töökorraldus ja juhendamine.
•
Valdkonna mõistete loetelu loomine.
Andmetöötleja Kirjeldus Andmete füüsiline sisestamine ja korrigeerimine (peakasutajad, vanem klienditeenindajad jne.). Eeldab toodangusüsteemides kõrgema taseme kasutajaõiguseid. Vastutab järgmiste tegevuste / otsuste eest • Andmete kvaliteetne sisestamine ja uuendamine. • Nõuetele mittevastavate andmete korrigeerimine ja puhastamine. • Andmekvaliteedi mõõdikute jälgimine. • Andmehalduri poolt andmete korrastamiseks antud ülesannete täitmine. • Probleemide kogumine ja eskaleerimine valdkonna andmehaldurile. Osaleb järgmistes tegevustes • Nõustab andmekvaliteedi mõõdikute väljatöötamist ja andmete ühtlustamist.
24
Andmehalduse protsessid Andmehaldus (1) Protsessi eest (vt. Joonis 6) vastutab andmehalduse juht ja töö tulemusena paraneb organisatsioonis andmete kvaliteet. Andmehaldur ja andmeomanik kirjeldavad kindla sisuteenuse , protsessi või infosüsteemi raames kõik mõisted. Nad kirjeldavad seonduvad andmed ning koguvad andmete elutsükli haldamiseks kokku vajalikud nõuded. Mõisted kogutakse sõnastikku, kirjeldatakse seosed ja vajadusel visualiseeritakse mõistete mudelis. Ärireegel on arendusnõude alamosa ning määratleb või piirab äriprotsessi mingit aspekti ehk nende kaudu saab kontrollida või mõjutada organisatsiooni poolt pakutavaid teenuseid. Ärireeglid jagunevad nelja kategooriasse ja on defineeritud kas: a) mõistena, b) mõistete vahelise seosena, c) mingi tegevuse piirangu või käivitajana, d) mingi tegevuse tule mina. Ärireegleid saab teisendada mõõdetavaks andmekvaliteedi reegliks, mille alusel andmekvaliteedist raporteerimine käivitab omakorda erinevaid äri- ja IT arendusprojekte. Joonis 6. Andmehaldus.
25
Väljund
Selgitus
Andmevaldkondade loend ja
kirjeldus
Organisatsiooni
andmeid
kategooriatesse
grupeeriv
dokument, kus on näidatud iga valdkonna andmete eest
vastutav ametikoht (andmeomanik) ja andmevara asukoht
(infosüsteemi täpsusega)
Arendusnõuete nimekiri
Andmeomaniku
ja
andmehalduri
poolt
koostatud
arendusnõuete loend. Tavaliselt on selle haldamiseks
kasutusel kontoritarkvara või näiteks Atlassian Jira.
Ärisõnastik ja andmekirjeldus
Mõistete ja andmeobjektide loend koos atribuutidega.
Tavaliselt on selle haldamiseks kasutusel kontoritarkvara,
Atlassian Confluence või sarnased Wiki lahendused. Võib
kasutada
ka
spetsiaalset
sõnastiku
tarkvara,
aga
funktsionaalsus on saadaval ka enamuses metaandmete
kirjeldamise tarkvarades.
Mõistete mudel
Mõistete
ja
nendevaheliste
seoste
visualiseerimine,
ärinõuetest parema ülevaate ja loetavuse saavutamiseks.
Üldjuhul on kasutusel spetsiaalne tarkvara: PowerDesigner,
ER/Studio, Sparx EA, Oracle SQL Developer Data Modeler, CA
Erwin, IBM - InfoSphere Data Architect .
Andmekvaliteedi reeglid ja
mõõdikud
Algoritm, mis kontrollib andmete struktuuri, vormingut ja
paigutust baasis ning võrdleb seda eelnevalt kirjeldatud
nõuetega:
a) kvaliteedireegli tehniline kirjeldus (tekst)
b) masinloetava valideerimise reeglid (SQL)
c) testide kirjeldamine (SQL)
d) süsteemi paigutamine (vastav programmeerimiskeel)
Andmehalduse tegevuskavad
Tavaliselt on selle haldamiseks kasutusel kontoritarkvara või
näiteks Atlassian Jira Planner (tavaliselt Epic’ute tasandil).
Mõistete mudeli loomine (2) Protsessi tulemusena (vt. Joonis 7) tekib organisatsioonis ärisõnastik, mille eest vastutab andmeomanik. Mõiste kirjeldamisel tuleb tema ülemmõiste ka organisatsiooni laiemat konteksti silmas pidades defineerida. Näiteks, kes on meie organisatsiooni teenuste klient, millistele tunnustele see peab vastama? Sõnastiku aluseks võib kasutada aga ka juba valmis valdkondlike märksõnastikke. Sellisel juhul ei ole mõisted tuletatud teenustest või äriprotsessidest, vaid tuleb nendega kokku viia. Mõistete vastavuste kirjeldamisel määratakse seosed teiste mõistetega. Sõnastikud võivad kasvada väga suureks ja seoseid tekkida palju, seetõttu visualiseeritakse see parema jälgitavuse nimel olemi- suhte diagrammina (ERD – entity relationship diagram). Kui mudelile andmeelemente ja atribuute mitte märkida, siis võib seda nimetada kontseptuaalseks mudeliks. Detailse protsesside analüüsi ja modelleerimise viivad läbi andmehaldurid ja -analüütikud. Mõistete mudeli loomine on detailselt kirjeldatud käesoleva projekti „Andmekirjelduse juhises“.
26
Joonis 7. Organisatsiooni mõistetest mudeli loomine ja haldamine
Väljund
Selgitus
Mõistete ja seoste
kontseptuaalne mudel
Mõistete ja nendevaheliste seoste visualiseerimine, parema
ülevaate ja loetavuse saavutamiseks. Üldjuhul on kasutusel
spetsiaalne tarkvara (näiteks: PowerDesigner, ER/Studio, Sparx
EA, Oracle SQL Developer Data Modeler, CA Erwin, IBM -
InfoSphere Data Architect ), käsitööna liiga töömahukas.
Arendusnõuete register
Andmehalduri
ja
Metaandmete
analüütiku
poolt
protsessijuhtide intervjuude käigus kogutud arendusnõuete
loend.
Mudeli
muudatused
saavad
toimuda
ainult
andmeomaniku poolt kinnitatud nõude alusel.
Sõnastiku haldus (3) Protsessi tulemusena (vt. Joonis 8) tekib asutusse ärisõnastik, mille loomise ja haldamise eest vastutab andmehalduse juht. Andmevaldkonna / kategooria mõisted ja ärireeglid defineerivad sõnastikku andmeomanikud koos andmehalduritega. Sõnastikku võrreldakse pidevalt organisatsiooni kehtivate protsesside ja teenustega, muudatuste puhul täiendatakse sõnastikku. Selle saavutamiseks peavad eksisteerima toimivad andmehalduse protsessid ja protsessijuhtide / teenuseomanike strateegiline huvi. Uued ja planeeritud IT arendused võiksid saada alguse alati kontseptuaalse mudeli nõuetest. Igale mõistega kirjeldatud andmeelemendile määrab andmeomanik andmekvaliteedi reegli, mis kirjeldab millistes piirides on tulevased andmed kvaliteetsed (näiteks määrab andmeomanik et, mingi andmeväli ei tohi teenuse osutamisel jääda kunagi tühjaks (kliendi aadress)). Spetsiifilised andmekvaliteedi
27
reeglite mõõdikud kirjeldab andmehaldur ja metaandmete analüütik aitab need viia infosüsteemidesse. Hästi oluline on ka andmehaldurite töö mõistete ühtlustamisel andmevaldkondade ja ka asutuste vahel, selleks käivad koos andmehaldurite töörühmad.
Joonis 8. Ärisõnastiku haldus
Väljund
Selgitus
Ärisõnastik
Kõik organisatsiooni tegevuses kasutatavad äriterminid koos
sisu selgituse ning seda kasutavate osapooltega
Mõistete ja protsesside seosed
Nimetatakse protsessid, kus kasutatakse sõnastikus kirjeldatud
mõisteid
Mõistete vahelised seosed
Näidatakse, kuidas sõnastikus toodud mõisted on omavahel
seotud
Mõistete seos arendusnõuetega Määratakse mõistete juurde arendusnõuded, milles need
sisalduvad
Mõiste seos andmekvaliteediga
Näidatakse mõistetele kohanduvad andmekvaliteedi reeglid
koos mõõdikuga
28
Arendusnõuete haldus (4) Protsessi tulemusena (vt. Joonis 9) tekib asutusse arendus vajaduste loend , mille eest vastutab andmehalduse juht. Sisuteenuse juhtide ootused, andmevajadused ja probleemid kipuvad mööda organisatsiooni e-mailides, Jiras ja analüüsi dokument ides laiali olema. Keegi ülevaadet ei oma ja pahatihti on nõuded ja soovid ka omavahel vastuolus. Olukorra lahendamiseks kirjeldavad äriprotsesside juhid oma vajadused kasutuslugudena ja saadavad need andmehaldurite töörühmale hindamiseks. Tuvastatakse nõude vastavus mõistete mudeliga, määratakse andme tele valdkond ja veendutakse, et a) kõik nõudes olevad mõisted on kirjeldatud, kui tekib uus mõiste (mingeid andmeid hakati koguma lisaks), siis vastav andmeomanik kinnitab uue mõiste, b) kui mõistet ei eksisteeri või see on valesti ki rjeldatud, saadetakse nõue tagasi, c) et poleks olemas juba sarnast nõuet, mis ootab arendust või on varasemalt juba tagasi lükatud. Arendusnõuded koondatakse andmehalduse juhi poolt arendusprojektidesse ja realiseeritakse ülesandena või suurema IT projektina. Aja jooksul tekivad asutusse sisuteenuseid toetavad ja sõnastike põhised andmepõhise juhtimise teenused (näiteks iseteeninduskeskkonnad Tableau, Power BI jne ). Selliste teenuste kaudu saavad paljud sisuteenuste juhtide arendusnõuded kiiresti lahendused ja tõstavad oluliselt organisatsiooni efektiivsust.
Joonis 9. Arendusnõuete haldamine
29
Väljund
Selgitus
Arendusnõuete register
Organisatsiooni
ärinõuete
detailne
kirjeldus
(seosed
sisuteenusega,
nõude
eesmärk,
seotud
osapooled,
funktsionaalsed nõuded jms).
Andmepõhiste teenuste ja
mõõdikute register
Andmepõhiste teenuste ja mõõdikute loetelu koos detailse sisu
kirjeldusega (ehk KPI).
Kvaliteedireeglite haldamine (5) Protsessi tulemusena (vt. Joonis 10) tekib organisatsioonis andmekvaliteedi reeglite nimekiri, mille eest vastutavad andmeomanikud. Nende kohustusteks on andmekvaliteedi reeglite äriline kirjeldamine, kinnitamine ja kommunikatsioon organisatsioonile. Andmehaldurid aitavad omanikel reeglite põhjal kvaliteeti mõõta, tuvastada põhjusi ja teevad ettepanekuid parema ja täpsema reegli kirjeldamiseks. Mõnikord on võimalik viia andmestikud omaniku poolt kehtestatud reeglitega vastavusse, parandades andmeid füüsiliselt. Seda tööd teevad mass- või üksikparandustena andmetega töötavad andmehaldurid. Üldjuhtudel tuleb kvaliteedireeglite paigaldamisse ja automatiseeritud mõõtmisesse kaasata IT töötajad.
30
Joonis 10. Andmekvaliteedireeglite haldamine
Väljund Selgitus Andmekvaliteedi reeglite register Loend tööprotsessi ja tulemit kirjeldavas keeles esitatud nõuetest organisatsiooni andmete kvaliteedile. Andmekvaliteedi reeglid peavad olema seotud mõistetega. Andmekvaliteedi mõõdik Ülevaade, millisel määral vastab andmete kvaliteet ootustele. [See peaks olema mõõdiku enda kirjeldus, näiteks kas kvantitatiivne või kvalitatiivne skaala ning see, mida mõõdetakse: ehk siduda ära kvaliteedi dimensioonidega]
31
Andmete korrigeerimise logid Andmehaldurite poolt andmete üksik- ja massparenduse korral peab süsteem salvestama logidena kõik muudatused. Samuti peab olema võimalik logide pealt eelnev seis taastada (ilma kogu andmestikku taastamata). Muudatusettepanekud Põhjustest lähtuvad ettepanekud, kas andmete parandamiseks või süsteemseteks parendustegevusteks
Andmekvaliteedi haldamine (6) Protsessi tulemusena (vt. Joonis 11) paraneb kindla andmestiku andmekvaliteet ja selle eest vastutab andmeomanik. Andmekvaliteedi haldamine on pidev protsess, kus uute andmete lisamisi ja muudatusi kontrollitakse jooksvalt ning kogu andmestiku sisu osas regulaarselt. Kontrollide tulemusena tekivad andmekvaliteedi raportid, millele andmeomanik on kohustatud koheselt reageerima. Omanik annab korralduse halduritele andmete käsitsi parandamiseks või loob tellimuse IKT osakonnale.
Joonis 11. Andmekvaliteedi haldamine
32
Väljund
Selgitus
Andmekvaliteedi reeglite register Organisatsiooni protsesse ja tulemeid mõjutavate nõuete loend
koos detailse kirjeldusega. Andmekvaliteedi reeglid peavad
olema seotud ärimõistetega.
Andmekvaliteedi raport
Eelnevalt
kirjeldatud
andmekvaliteedi
reeglite
pealt
koostatakse andmestiku kvaliteedi mõõtmise raportid. Vead
näitavad sisuüksustele, milliseid andmeid ei saa halva kvaliteedi
tõttu kasutada. Kvaliteedi raporteid on võimalik saada nii
andmetega seotud arendusnõuete kui mõistete lõikes.
Andmekvaliteedi vigade raport
Sisend andmekvaliteedi probleemide lahendamise protseduuri
alustamiseks.
Arendus/parandus ettepanekud
andmete korrastamiseks
Andmekvaliteedi haldamise käigus tuvastatakse kvaliteedi
probleemid
ning
vajadusel
tellitakse
arendus
vigade
kõrvaldamiseks.
Andmekorrastuse aruanded
Andmekvaliteedi haldamise käigus tuvastatakse probleemid
ning korrastamiseks koostatakse vastavatest vigadest raport.
Raport on sisendiks nii andmetöötlejatelele kui ka pärast
arenduste testimiseks.
Andmekvaliteedi mõõtmine (7)
Protsessi tulemusena (vt. Joonis 12) toimub korrapärane andmekvaliteedi mõõtmine ja tekib
mõõtetulemuste register ning selle eest vastutab andmehaldur. Haldur korraldab kõigi andmeomaniku
poolt kinnitatud reeglite rakendamise kindlaksmääratud andmestikele. Salvestab mõõtetulemused ja
esitab aruanded andmeomanikule ja andmehalduse juhile koos probleemide põhjuste analüüsiga.
Valitud andmekvaliteedi mõõdikud annavad otsest sisendit organisatsiooni strateegilistele
mõõdikutele. Andmehalduse juht esitab need kvaliteedi mõõtmise tulemused KPI-dena organisatsiooni
juhtkonnale ja DGO juhtrühmale.
33
Joonis 12. Andmekvaliteedi mõõtmine
Väljund
Selgitus
Andmekvaliteedi mõõdikud
Andmestikule
kvaliteedireeglite
rakendamisel
saadud
mõõtetulemuste loend. Koosneb paljudest metaandmetest (mis
reegel, aeg, koht, kes, tingimused, mahud, koormused jne).
Andmekvaliteedi raport
Eelnevalt
kirjeldatud
andmekvaliteedi
reeglite
pealt
koostatakse andmekvaliteedi mõõtmise raportid. Vead näitavad
andmeomanikele milliseid andmeid ei saa halva kvaliteedi tõttu
kasutada. Kvaliteediraporteid on võimalik saada nii andmetega
seotud arendusnõuete, mõistete kui ka andmeid kasutavate
aruannete lõikes.
Arendus/parandus ettepanekud
andmete korrastamiseks
Andmekvaliteedi haldamise käigus tuvastatakse kvaliteedi
probleemid
ning
vajadusel
tellitakse
arendus
vigade
kõrvaldamiseks.
KPI sisend
Organisatsioonile olulised andmekvaliteedi parandused on
organisatsiooni strateegias KPI-dena kirjeldatud.
34
Andmekvaliteedi probleemide lahendamine (8) Protsessi tulemusena (vt. Joonis 13) toimub andmekvaliteedi raporti alusel tegelik andmekvaliteedi parandamine, mille eest vastutab andmeo manik. Andmehaldurid ja analüütikud seadistavad infosüsteemidesse andmekva liteedi reegleid ja mõõdavad andmete vastavus t neile. DGO tuvastab ebakvaliteetsete andmete põhjused ja hindab probleemi mõju organisatsioonile . Andmeomanik on kohustatud alustama parendamise protsessi ja algatama vastavaid organisatsioonilisi või IKT projekte.
Joonis 13. Andmekvaliteedi probleemide lahendamine
35
Väljund Selgitus Andmete kvaliteedimõõdik Ülevaade, millises määras vastab andmekvaliteet organisatsiooni strateegias sätestatud ootustele. Ettepanekud andmekvaliteedi parendamiseks Juurpõhjustest lähtuvad ettepanekud, kas andmete parandamiseks või süsteemseteks parendustegevusteks.
Põhiandmete kirjeldamine ja haldus (9)
Organisatsiooni ühiskasutatavate, põhitegevus e tarbeks kriitiliste andmete tekitamise ja haldamise
eest vastutavad andmeomanikud (vt. Joonis 14) . Andmevarade kirjeldamise käigus selgub tihti, et
paljud mõisted ja nendega seonduvad andmed korduvad valdkondade üleselt või teenuste siseselt ja
on tihti dubleeritud, näiteks: klientide, lepingute, asukohtade, varade jne. seotud andmed.
Organisatsioonil on mõistlik koondada taolised andmed kokku ühtse ks põhiandmete ( master data)
andmestikuks ja luua võimalus põhiandmete ühiskasutamiseks. Ühises andmestikus on lihtsam
kindlustada andmete kvaliteet ja olla kindel, et kõik kasutavad õiget ja täpset informatsiooni. Seeläbi
tagatakse, et asutus ei väljasta kliendile vastuolulisi sõnumeid, ei saada kirju valedele aadressidele jne.
Ühiseks kasutamiseks määratud põhiandmetele määratakse eraldi omanikud, kas olemasolevate
andmeomanike seast või kui tegemist on väga suure põhiandmete hulgaga, võidakse määrata ka eraldi
andmeomanik.
36
Joonis 14. Põhiandmete kirjeldamine ja haldus
Väljund Selgitus Ühiskasutatavad põhiandmed Asutus määrab millised andmevarad on ühiskasutatavad ja korraldab töö ümber nii, et andmeid ei salvestata dubleerituna, vaid tarbitakse eraldiseisvast põhiandmete andmestikust. Kriitilisuse määramine Ühiskasutatavatele andmevaradele määratakse käideldavuse klass. Vastavalt sellel luuakse ühiskasutatavad andmestikud kas operatiivsetena (lähtesüsteemide tasandil) või analüütilistena (andmeaida või aruandluse tasandil). Põhiandmete haldamise ja kvaliteedi parendamise protsess. Igal põhiandmete objektil võib olla eraldi protsess. Protsessi eest vastutab määratud andmeomanik