64
enam andmekirjelduste ehk metaandmete edastamine koos andmetega. Organisatsiooni sees
võib andmekirjelduste edastamine olla vajalik näiteks andmeintegratsiooni, virtualiseerimise või
andmelao
keskkonda,
uute
andmeteenuste
loomisel,
veebiplatvormi
loomisel
andmejagamisteenuse osutamiseks või andmepõhise aruandluse jaoks automatiseeritud
andmete ja metaandmete edastamiseks.
Organisatsioonide vahel on andmekirjelduste vahetamine tihti vajalik sama valdkonna
asutuste seas. Samuti nõuavad andmekirjelduste edastamist õigusaktid. RIHA nõuab seda
andmekogude kohta avaliku sektori andmetest tervikülevaate haldamisel. See on vajalik ka riigi
ülesannete täitmisel, näiteks Statistikaametis riikliku statistika kogumisel ja Rahvusarhiivis
arhiiviväärtuslike andmete kogumisel riigi digitaalarhiivi. Asutused avalikustavad andmeid koos
nende kirjeldusega avaandmetena riigi avaandmete portaalis. Andmekirjelduse kasutajaks on
üha enam ka mõni teine tarkvara või kratt. See tõstab andmekirjelduse masinmõistetavuse
tähtsust, milles väga oluline on mõistete ühene identifitseeritavus läbi seda kasutatavate URIde,
nimeruumidele viitamine ja semantiline koostalitlusvõime valdkondlike taksonoomiate ja
ontoloogiate kasutamiseni välja.
Asutustevahelist või andmeteenuste kaudu andmete jagamist saab teha ka, kasutades
avaldatud
sõnastikke,
eelkõige
märksõnastikke.
Andmehalduse
raamistikus
viidatud
andmevahetuse kohta tehtavad kokkulepped ja nõuded ehk andmeteenuse spetsifikatsioonid,
kasutavad nii ärisõnastikke kui ka andmekirjeldusi. Andmete mõisteline kirjeldamine ehk
semantiline
koostalitlusvõime
andmete
vahel
toetab
andmeteenuseid
asutuste
ja
infosüsteemide vahel. Kuna andmekirjelduses kajastuvad ka sellised andmekvaliteedi
kriteeriumid nagu ajakohasus, saab neist osaliselt tuletada andmete usaldusväärsuse.
Andmevahetuse toetamiseks peab andmekirjeldus olema ajakohane ja piisav, et olla üheselt
mõistetav ka väljaspool valdkonnaspetsialistide kitsast ringi.
Igal andmekirjelduse lõppkasutajal on oma eripärad, vajadused ja nõuded. Enamasti
huvitab kirjelduste kasutajat andmestiku mingi alamhulga teatud osa kirjeldus. Eristada tulekski
andmekirjelduste n-ö pakkumist ehk teisisõnu andmekirjelduse kättesaadavaks tegemist mingis
portaalis, mis olla ka ise andmekataloog või muutes see leitavaks mingi üldisema
otsivahenditega. Kui esimene variant on mõeldud pigem tavakodanikule kasutamiseks, siis teine
on seotud valdkonna või teenusega ning pigem kasutamiseks töös või uuringus.
Iga andmekirjelduse edastamise juhtumi jaoks on vajalik:
•
teha andmekirjelduse lõppkasutaja vajaduste ja toetatud vormingute ning liideste
analüüs;
•
defineerida kogu andmekirjeldusesaajale sobilik alamosa ja esitada see väljavõttena,
sidudes see teenuse osutamiseks andmestiku vastava alamosaga või seadistada
vastav teenust osutav liides;
•
viia andmekirjelduse väljavõte saajale sobivasse struktuuri ja vormingusse (näiteks
XML teisenduse abil);
•
edastada andmekirjelduse väljavõte saaja poolt toetatud liidese ja/või tarkvara abil.
Lihtsamal juhul või ühekordsel kirjelduse edastamisel on need tegevused võimalik teostada
käsitsi, näiteks eksportides kogu andmekirjelduse tabelarvutustarkvarasse ning tehes seal
vajalikud väljavõtted ja teisendused. Andmekirjelduse edastamine on enamasti siiski regulaarne
või pidev, näiteks asutuse protsess uute andmekirjelduste edastamiseks andmelattu kord
nädalas või kirjelduste edastamine RIHAsse iga andmekirjelduses toimuva muutuse korral.
Sellistel juhtudel on asutusel mõistlik saajale sobilik kirjelduste alamosa, vajalikud vormingu
65 teisendused ning liidesed juurutada andmehalduse töövahendis n-ö edastusprofiili või - protseduurina, nt Statistikaametile hoonete andmekirjelduse väljavõtte tegemise ja edastamise profiil. Andmekirjelduse edastamise vajadused (liidesed, kirjelduse vormingud jms) võivad seetõttu oluliselt mõjutada organisatsiooni otsuseid andmekirjelduse töövahendi valikul.
3.8 Andmekirjeldus seotuna andmehalduse ja organisatsiooni tegevustega Selle peatüki alguses näitasime joonisel 16, kuidas andmehaldus ja andmekirjeldused on seotud organisatsiooni muude tegevustega. Peatume sellel lõpuks veel, et selgitada, kuidas andmekirjelduse objektide piiritlemisest kuni andmekirjelduste kasutamise ja edastamiseni ulatuv protsess on seotud organisatsiooni muude tegevustega. Esmalt on andmekirjeldus üks andmehalduse alategevus. Andmehaldus ise ei ole peale ühe erandi ühegi asutuse põhitegevus. Seega kuulub see tugifunktsioonide hulka ja teenuste korraldamise ja teabehalduse aluste määrus näeb andmehaldust omakorda enda alategevusena. Sellest oleks aga erakordselt väär teha järeldus, nagu oleks andmekirjelduse koostamine ja haldamine on alategevuse alategevus ning sellisena vähetähtis. Nagu oleme kogu juhises selgitanud, on metaandmed oluline organisatsiooni digitaalse toimimise komponent ning andmekirjeldus on metaandmete üks olulisim osa. Sellele saab toetuda digipööre ehk teenuste ja ülesannete reform, muutmaks organisatsiooni toimimist mitte lihtsalt tohutu hulga segamini olevate ja vähe usaldust äratavate andmete põhiseks, vaid andmepõhiseks nii, nagu sellest andmehalduse valdkonnas aru saadakse, ehk ka metaandmete põhiseks. Mõnes valdkonnas ongi võetud kasutusele lähenemine, et protsessid on juhitud metaandmetega. See pole küll sama mis kvaliteetsete andmekirjelduste koostamine, aga viimane on esimese osa. Teiseks on andmekirjeldused seotud andmekvaliteediga ja läbi ärireeglite ka protsessidega. Need omakorda on seotud kvaliteedijuhtimisega. Seekaudu on andmehaldus ja andmekirjeldused protsesside ja teenuste käsitluse osa. Andmetes dokumenteeritav ja andmekirjelduses väljenduv arusaam ühendatuna protsesside muutmise ja teenuste disainimisega seob andmed selgemini organisatsiooni ülesannetega ja võimaldab hinnata andmete väärtust. Kolmandaks nimetame seda, mida tuleb pidada põhivajaduseks, mida nimetatakse IT- terminites andmehügieeniks. See on ülevaade sellest, mis andmed ja andmestikud olemas on, ning milleta ei ole võimalik midagi halduse alla võtta. Andmekataloogi koostamist ja pidamist toetavad andmekirjelduse töövahendid ei täna integreeritud asutuse ülesannete ja dokumentatsiooni haldamist võimaldava üldise, asutuse funktsioonidel põhineva liigitusskeemiga. Andmehalduse ja infohalduse paremal seostamisel kogu organisatsiooni vajadusi silmas pidades tekib praeguste eri vaadete asemel tervikpilt. Neljandaks nimetame seost organisatsioonikultuuriga. Selle oluline osa on keel, mida asutus räägib. Selles on kitsa valdkondliku keele kõrval veel IT-keel, juhtimise keel jne. Nende keelte vahel on vaja pidevat tõlkimist ning. oluline instrument selles on sõnastikud. Sõnastikud ja erialakeel loovad kommunikatiivse silla töötajate vahel. Sellisena on andmekirjelduste koostamisel oluline kommunikatiivne väärus. Viiendaks nimetame seotust andmeteenustega, mõeldes selle all nii praeguseid x-tee teenuseid kui ka riigi infosüsteemi tehniliste protokollide ja arhitektuuri (mikroteenused)
66 realiseerimisel andmekirjelduse poolt pakutavat lisandväärtust nii teenuste loomisel kui ka teiste andmevahetusprotokollide kasutuselevõtul. Kuuendaks on andmekirjelduste olemasolu oluliseks toeks nii asutuste IT - kui äripoolele infosüsteemide hankimisel ja arendamisel . Andmekirjelduse olemasolul ei pea tegelema andmearheoloogiaga, et andmete tähendusest ja kvaliteedis t aru saada . Samuti on lihtsam disainida, arendada ja juurutada organisatsiooni uusi protsesse ja teenuseid. Palju lihtsam on ka andmete migreerimine.
Andmehaldus ja andmekirjelduste koostamine ja haldus on seotud paljude teiste organisatsiooni protsessidega ja selle korraldamiseks on vaja täita mitmeid rolle. Oluliseks vastust vajavaks küsimuseks iga organisatsiooni jaoks jääb, kui palju vajavad need rollid eraldiseisvaid teadmisi ja oskusi ning kui palju on tegu muu tööga kaasnevate oskustega. Praktika on näidanud, et andmekirjelduste koostamise kiirus, kvaliteet ja ühtlus on parem, kui seda teeb kitsam hulk inimesi, aga ka seda, et tegelike andmekasutajate kaasamine andmekirjelduste koostamisse paneb nad ka loodud kirjeldusi rohkem kasutama.
67 Terminid ja mõisted
termin mõiste määratlus või selgitus andmed informatsiooni taastõlgendatav esitus formaliseeritud kujul, mis sobib edastuseks, tõlgenduseks või töötluseks [ISO/IEC 2382] andmeelelement elementaarüksusena käsitletav nimega seos käsitlusvalla objektide ja neid esitavate sõnade vahel [ISO/IEC 2382-17] andmehaldur äriprotsesse esindav roll andmehalduse alal:
- andmete sisu, konteksti ja metaandmete eest vastutaja;
- kohustused sõltuvad kontekstist ja võivad osaliselt kattuda
andmekäitleja omadega
[https://akit.cyber.ee/term/2172-andmehaldur]
andmehaldus
juhtimis- ja kontrollitegevuste (planeerimine, seire ja kehtestamine)
rakendamine andmevaradega seotud tegevuste üle [DAMA DMBOK2]
andmekataloog
organisatsiooni andmevarasid hõlmav metaandmete register andmete
kiiremaks leidmiseks ja kasutamiseks
andmekirjeldus
andmeelemendi ning kõigi ta nime ja ta sõnu sisaldavate
andmestruktuuride formaliseeritud kirjeldus
[ISO/IEC 2382-17]
andmekirjelduse töövahend
tarkvaraline töövahend, mis lihtsustab ja automatiseerib
andmekirjelduse koostamist, hoidmist, kvaliteedi kontrolli ning
taaskasutust
andmekogu
riigi, kohaliku omavalitsuse või muu avalik-õigusliku isiku või avalikke
ülesandeid täitva eraõigusliku isiku infosüsteemis töödeldavate
korrastatud andmete kogum, mis asutatakse ja mida kasutatakse
seaduses, selle alusel antud õigusaktis või rahvusvahelises lepingus
sätestatud ülesannete täitmiseks
[AvTS §411]
andmekvaliteet näitab, mil määral andmekarakteristikud rahuldavad teadaolevaid või eeldatavaid vajadusi kasutamisel ettemääratud tingimustes
[ISO/IEC 25012] andmeobjekt andmeelement või määratletud andmeelemendikogum, mis on seotud üheainsa tähendust ja kompositsiooni määrava sildiga
[ISO/IEC 18013-2] vt ka https://akit.cyber.ee/term/5074-andmeolem-1-andmeuksus andmestik andmete hulk, mis on avaldatud ja mida hallatakse kindla isiku poolt ning millele saab anda juurdepääsu või seda alla laadida ühes või enamas vormingus
[DCAT] andmesõnastik andmete kirjeldus organisatsiooni tegevuse mõistetena (ärimõisted), mis hõlmab ka andmete kasutamiseks vajalikke metaandmeid [DAMA-DMBOK2] metaandmed andmed, mis määratlevad ja kirjeldavad teisi andmeid [ISO/IEC 11179-1] mõiste teadmisüksus, mille moodustab ühene tunnuste kombinatsioon [ISO 5127] märksõna termin või ette määratud terminite jada, mis on võetud märksõnastikust [ISO 25964-1]
68 märksõnastik ettekirjutatud terminite, märksõnade või koodide nimekiri, mille iga liige tähistab mõistet [ISO 25964-1] taksonoomia kategooriate ja alamkategooriate skeem, mida saab kasutada teadmusüksuste või informatsiooni sortimiseks või muul viisil organiseerimiseks [ISO 25964-1] termin, oskussõna sõna või fraas, millega mõistet tähistatakse [ISO 25964-1] tesaurus struktureeritud märksõnastik, milles iga mõiste kohta on terminid ning mis on organiseeritud nii, et mõistete vahelised seosed on välja toodud ja samuti on välja toodud eelisterminid ja nende sünonüümid [ISO 25964-1] ärimõiste organisatsiooni tegevust kirjeldav oskussõna ärisõnastik organisatsioonis kasutatava oskussõnavara ja nende sõnaseletuste loend, mis fikseerib organisatsiooni terminoloogia
69
Viited
Õigusaktid
•
Arhiiviseadus. RT I, 21.03.2011, 1
•
Avaliku teabe seadus. RT I 2000, 92, 597
•
Euroopa Parlamendi ja nõukogu määrus (EL) 2022/868, 30. mai 2022, Euroopa
andmehalduse kohta ning millega muudetakse määrust (EL) 2018/1724 (andmehalduse
määrus)
•
Euroopa Parlamendi ja nõukogu määrus ühtlustatud õigusnormide kohta, millega
reguleeritakse õiglast juurdepääsu andmetele ja andmete kasutamist (andmemäärus)
•
Euroopa Parlamendi ja nõukogu direktiivi (EL) 2019/1024 avaandmete ja avaliku sektori
valduses oleva teabe taaskasutamise kohta (ELT L 172, 26.06.2019, lk 56–83)
•
Riigi infosüsteemi haldussüsteem. Vabariigi Valitsuse 28.02.2008 määrus nr 58. RT I 2008,
12, 84.
•
Teenuste korraldamise ja teabehalduse alused. Vabariigi Valitsuse 25.05.2017 määrus nr 88.
RT I, 31.05.2017, 7.
Standardid
•
Data Documentation Initiative (DDI) (Lifecycle 3.3, 20.04.2020)
•
DCAT Application Profile for data portals in Europe (ver 2.1.0, 06.12.2021); DCAT
rakendusprofiil Euroopa andmeportaalidele (ver 2.1.0)
•
EVS-ISO 1087-1:2002 Terminoloogiatöö. Sõnastik. Osa 1: Teooria ja rakendus. Selle
uustöötlus ei ole Eesti standard: ISO 1087:2019 Terminology work and terminology science
— Vocabulary
•
EVS-ISO 2382 on inglise keelne uustöötlus: ISO/IEC 2382:2015 Information technology --
Vocabulary
•
EVS-ISO 5127:2004 Informatsioon ja dokumentatsioon. Sõnastik
•
EVS-ISO
15836-1:2019
Informatsioon
ja
dokumentatsioon.
Dublin
Core’i
metaandmeelemendid. Osa 1: Põhielemendid (kehtiv alates 15.05.2019). EVS-ISO 15836-
2:2023 Informatsioon ja dokumentatsioon. Dublin Core’i metaandmeelemendid. Osa 2: DCMI
atribuudid ja klassid (kehtiv alates 02.05.2023).
•
ISO 25964 Information and documentation — Thesauri and interoperability with other
vocabularies — Part 1: Thesauri for information retrieval (2011), Part 2: Interoperability with
other vocabularies (2013)
•
ISO/IEC 11179 ISO/IEC 11179 Information technology — Metadata registries (MDR) Part 1:
Framework (2015), Part 2: Classification (2005), Part 3: Registry metamodel and basic
attributes (2013),Part 4: Formulation of data definitions (2004),Part 5: Naming and
identification principles (2005), Part 6: Registration (2004)
•
SKOS (Simple Knowledge Organization System).
Raamatud ja artiklid
•
Erelt, Tiiu. Terminiõpetus (Tartu Ülikooli Kirjastus, 2007)
•
Floridi, Luciano. Data. In William A. Darity (ed.), International Encyclopedia of the Social
Sciences. ( Macmillan, 2008)
•
Gillenson, Mark L. Fundamentals of database management systems. (2nd ed., Wiley, 2013)
•
Kasak, Enn. Loogika alused (Tartu Ülikooli Kirjastus, 2014)
•
Kreuter. F. Improving Surveys with Paradata: Analytic Uses of Process Information (Wiley,
2013)
70 • Mereste, Uno. Oskuskeel ja seaduste keeleline rüü. Artikleid ja lühiuurimusi. (Eesti Keele Sihtasutus, 2000) • Riley. J. Understanding Metadata: What is Metadata, and What is it For?: A Primer (NISO, 2017) • Tavast, Arvi. Taukar, Marju. Mitmekeelne oskussuhtlus (Valgus, 2013). • Tiit, Ene-Margit. Tooding, Liina-Mai. Statistikaleksikon. (Tartu Ülikooli Kirjastus 2019) Juhised • Andmekirjelduse juhis Lisa 1: Andmekirjelduse standard. (Ver 2.0, Mai 2022). • Andmekirjelduse juhis Lisa 2: Sõnastike koostamine andmekirjeldustes. Praktiline juhis (Ver 0.3, Märts 2023) • Haav, Hele-Mai. Ontoloogiate loomise metoodika. (Ver. 4., 2011) • Haav, Hele-Mai. Nõuded RIHA ontoloogiatele. (Ver. 2.6., 2011) • Küngas, Peep. Semantilise kirjeldamise juhis (Ver 0.4., 2017) • RIHAKEse lõppkasutaja kasutusjuhend. (Ver 1.1.1, 17.01.2023)