AH_juhis_andmekirjeldus_v2.0.pdf

Type: Document | Status: ready

64 enam andmekirjelduste ehk metaandmete edastamine koos andmetega. Organisatsiooni sees võib andmekirjelduste edastamine olla vajalik näiteks andmeintegratsiooni, virtualiseerimise või andmelao keskkonda, uute andmeteenuste loomisel, veebiplatvormi loomisel andmejagamisteenuse osutamiseks või andmepõhise aruandluse jaoks automatiseeritud andmete ja metaandmete edastamiseks. Organisatsioonide vahel on andmekirjelduste vahetamine tihti vajalik sama valdkonna asutuste seas. Samuti nõuavad andmekirjelduste edastamist õigusaktid. RIHA nõuab seda andmekogude kohta avaliku sektori andmetest tervikülevaate haldamisel. See on vajalik ka riigi ülesannete täitmisel, näiteks Statistikaametis riikliku statistika kogumisel ja Rahvusarhiivis arhiiviväärtuslike andmete kogumisel riigi digitaalarhiivi. Asutused avalikustavad andmeid koos nende kirjeldusega avaandmetena riigi avaandmete portaalis. Andmekirjelduse kasutajaks on üha enam ka mõni teine tarkvara või kratt. See tõstab andmekirjelduse masinmõistetavuse tähtsust, milles väga oluline on mõistete ühene identifitseeritavus läbi seda kasutatavate URIde, nimeruumidele viitamine ja semantiline koostalitlusvõime valdkondlike taksonoomiate ja ontoloogiate kasutamiseni välja. Asutustevahelist või andmeteenuste kaudu andmete jagamist saab teha ka, kasutades avaldatud sõnastikke, eelkõige märksõnastikke. Andmehalduse raamistikus viidatud andmevahetuse kohta tehtavad kokkulepped ja nõuded ehk andmeteenuse spetsifikatsioonid, kasutavad nii ärisõnastikke kui ka andmekirjeldusi. Andmete mõisteline kirjeldamine ehk semantiline koostalitlusvõime andmete vahel toetab andmeteenuseid asutuste ja infosüsteemide vahel. Kuna andmekirjelduses kajastuvad ka sellised andmekvaliteedi kriteeriumid nagu ajakohasus, saab neist osaliselt tuletada andmete usaldusväärsuse. Andmevahetuse toetamiseks peab andmekirjeldus olema ajakohane ja piisav, et olla üheselt mõistetav ka väljaspool valdkonnaspetsialistide kitsast ringi.
Igal andmekirjelduse lõppkasutajal on oma eripärad, vajadused ja nõuded. Enamasti huvitab kirjelduste kasutajat andmestiku mingi alamhulga teatud osa kirjeldus. Eristada tulekski andmekirjelduste n-ö pakkumist ehk teisisõnu andmekirjelduse kättesaadavaks tegemist mingis portaalis, mis olla ka ise andmekataloog või muutes see leitavaks mingi üldisema otsivahenditega. Kui esimene variant on mõeldud pigem tavakodanikule kasutamiseks, siis teine on seotud valdkonna või teenusega ning pigem kasutamiseks töös või uuringus. Iga andmekirjelduse edastamise juhtumi jaoks on vajalik:
• teha andmekirjelduse lõppkasutaja vajaduste ja toetatud vormingute ning liideste analüüs; • defineerida kogu andmekirjeldusesaajale sobilik alamosa ja esitada see väljavõttena, sidudes see teenuse osutamiseks andmestiku vastava alamosaga või seadistada vastav teenust osutav liides; • viia andmekirjelduse väljavõte saajale sobivasse struktuuri ja vormingusse (näiteks XML teisenduse abil); • edastada andmekirjelduse väljavõte saaja poolt toetatud liidese ja/või tarkvara abil. Lihtsamal juhul või ühekordsel kirjelduse edastamisel on need tegevused võimalik teostada käsitsi, näiteks eksportides kogu andmekirjelduse tabelarvutustarkvarasse ning tehes seal vajalikud väljavõtted ja teisendused. Andmekirjelduse edastamine on enamasti siiski regulaarne või pidev, näiteks asutuse protsess uute andmekirjelduste edastamiseks andmelattu kord nädalas või kirjelduste edastamine RIHAsse iga andmekirjelduses toimuva muutuse korral. Sellistel juhtudel on asutusel mõistlik saajale sobilik kirjelduste alamosa, vajalikud vormingu

65 teisendused ning liidesed juurutada andmehalduse töövahendis n-ö edastusprofiili või - protseduurina, nt Statistikaametile hoonete andmekirjelduse väljavõtte tegemise ja edastamise profiil. Andmekirjelduse edastamise vajadused (liidesed, kirjelduse vormingud jms) võivad seetõttu oluliselt mõjutada organisatsiooni otsuseid andmekirjelduse töövahendi valikul.

3.8 Andmekirjeldus seotuna andmehalduse ja organisatsiooni tegevustega Selle peatüki alguses näitasime joonisel 16, kuidas andmehaldus ja andmekirjeldused on seotud organisatsiooni muude tegevustega. Peatume sellel lõpuks veel, et selgitada, kuidas andmekirjelduse objektide piiritlemisest kuni andmekirjelduste kasutamise ja edastamiseni ulatuv protsess on seotud organisatsiooni muude tegevustega. Esmalt on andmekirjeldus üks andmehalduse alategevus. Andmehaldus ise ei ole peale ühe erandi ühegi asutuse põhitegevus. Seega kuulub see tugifunktsioonide hulka ja teenuste korraldamise ja teabehalduse aluste määrus näeb andmehaldust omakorda enda alategevusena. Sellest oleks aga erakordselt väär teha järeldus, nagu oleks andmekirjelduse koostamine ja haldamine on alategevuse alategevus ning sellisena vähetähtis. Nagu oleme kogu juhises selgitanud, on metaandmed oluline organisatsiooni digitaalse toimimise komponent ning andmekirjeldus on metaandmete üks olulisim osa. Sellele saab toetuda digipööre ehk teenuste ja ülesannete reform, muutmaks organisatsiooni toimimist mitte lihtsalt tohutu hulga segamini olevate ja vähe usaldust äratavate andmete põhiseks, vaid andmepõhiseks nii, nagu sellest andmehalduse valdkonnas aru saadakse, ehk ka metaandmete põhiseks. Mõnes valdkonnas ongi võetud kasutusele lähenemine, et protsessid on juhitud metaandmetega. See pole küll sama mis kvaliteetsete andmekirjelduste koostamine, aga viimane on esimese osa. Teiseks on andmekirjeldused seotud andmekvaliteediga ja läbi ärireeglite ka protsessidega. Need omakorda on seotud kvaliteedijuhtimisega. Seekaudu on andmehaldus ja andmekirjeldused protsesside ja teenuste käsitluse osa. Andmetes dokumenteeritav ja andmekirjelduses väljenduv arusaam ühendatuna protsesside muutmise ja teenuste disainimisega seob andmed selgemini organisatsiooni ülesannetega ja võimaldab hinnata andmete väärtust. Kolmandaks nimetame seda, mida tuleb pidada põhivajaduseks, mida nimetatakse IT- terminites andmehügieeniks. See on ülevaade sellest, mis andmed ja andmestikud olemas on, ning milleta ei ole võimalik midagi halduse alla võtta. Andmekataloogi koostamist ja pidamist toetavad andmekirjelduse töövahendid ei täna integreeritud asutuse ülesannete ja dokumentatsiooni haldamist võimaldava üldise, asutuse funktsioonidel põhineva liigitusskeemiga. Andmehalduse ja infohalduse paremal seostamisel kogu organisatsiooni vajadusi silmas pidades tekib praeguste eri vaadete asemel tervikpilt. Neljandaks nimetame seost organisatsioonikultuuriga. Selle oluline osa on keel, mida asutus räägib. Selles on kitsa valdkondliku keele kõrval veel IT-keel, juhtimise keel jne. Nende keelte vahel on vaja pidevat tõlkimist ning. oluline instrument selles on sõnastikud. Sõnastikud ja erialakeel loovad kommunikatiivse silla töötajate vahel. Sellisena on andmekirjelduste koostamisel oluline kommunikatiivne väärus. Viiendaks nimetame seotust andmeteenustega, mõeldes selle all nii praeguseid x-tee teenuseid kui ka riigi infosüsteemi tehniliste protokollide ja arhitektuuri (mikroteenused)

66 realiseerimisel andmekirjelduse poolt pakutavat lisandväärtust nii teenuste loomisel kui ka teiste andmevahetusprotokollide kasutuselevõtul. Kuuendaks on andmekirjelduste olemasolu oluliseks toeks nii asutuste IT - kui äripoolele infosüsteemide hankimisel ja arendamisel . Andmekirjelduse olemasolul ei pea tegelema andmearheoloogiaga, et andmete tähendusest ja kvaliteedis t aru saada . Samuti on lihtsam disainida, arendada ja juurutada organisatsiooni uusi protsesse ja teenuseid. Palju lihtsam on ka andmete migreerimine.

Andmehaldus ja andmekirjelduste koostamine ja haldus on seotud paljude teiste organisatsiooni protsessidega ja selle korraldamiseks on vaja täita mitmeid rolle. Oluliseks vastust vajavaks küsimuseks iga organisatsiooni jaoks jääb, kui palju vajavad need rollid eraldiseisvaid teadmisi ja oskusi ning kui palju on tegu muu tööga kaasnevate oskustega. Praktika on näidanud, et andmekirjelduste koostamise kiirus, kvaliteet ja ühtlus on parem, kui seda teeb kitsam hulk inimesi, aga ka seda, et tegelike andmekasutajate kaasamine andmekirjelduste koostamisse paneb nad ka loodud kirjeldusi rohkem kasutama.

67 Terminid ja mõisted

termin mõiste määratlus või selgitus andmed informatsiooni taastõlgendatav esitus formaliseeritud kujul, mis sobib edastuseks, tõlgenduseks või töötluseks [ISO/IEC 2382] andmeelelement elementaarüksusena käsitletav nimega seos käsitlusvalla objektide ja neid esitavate sõnade vahel [ISO/IEC 2382-17] andmehaldur äriprotsesse esindav roll andmehalduse alal:

  • andmete sisu, konteksti ja metaandmete eest vastutaja;
  • kohustused sõltuvad kontekstist ja võivad osaliselt kattuda andmekäitleja omadega [https://akit.cyber.ee/term/2172-andmehaldur] andmehaldus juhtimis- ja kontrollitegevuste (planeerimine, seire ja kehtestamine) rakendamine andmevaradega seotud tegevuste üle [DAMA DMBOK2] andmekataloog organisatsiooni andmevarasid hõlmav metaandmete register andmete kiiremaks leidmiseks ja kasutamiseks andmekirjeldus andmeelemendi ning kõigi ta nime ja ta sõnu sisaldavate andmestruktuuride formaliseeritud kirjeldus [ISO/IEC 2382-17] andmekirjelduse töövahend tarkvaraline töövahend, mis lihtsustab ja automatiseerib andmekirjelduse koostamist, hoidmist, kvaliteedi kontrolli ning taaskasutust andmekogu riigi, kohaliku omavalitsuse või muu avalik-õigusliku isiku või avalikke ülesandeid täitva eraõigusliku isiku infosüsteemis töödeldavate korrastatud andmete kogum, mis asutatakse ja mida kasutatakse seaduses, selle alusel antud õigusaktis või rahvusvahelises lepingus sätestatud ülesannete täitmiseks
    [AvTS §411]
    andmekvaliteet näitab, mil määral andmekarakteristikud rahuldavad teadaolevaid või eeldatavaid vajadusi kasutamisel ettemääratud tingimustes
    [ISO/IEC 25012] andmeobjekt andmeelement või määratletud andmeelemendikogum, mis on seotud üheainsa tähendust ja kompositsiooni määrava sildiga
    [ISO/IEC 18013-2] vt ka https://akit.cyber.ee/term/5074-andmeolem-1-andmeuksus andmestik andmete hulk, mis on avaldatud ja mida hallatakse kindla isiku poolt ning millele saab anda juurdepääsu või seda alla laadida ühes või enamas vormingus
    [DCAT] andmesõnastik andmete kirjeldus organisatsiooni tegevuse mõistetena (ärimõisted), mis hõlmab ka andmete kasutamiseks vajalikke metaandmeid [DAMA-DMBOK2] metaandmed andmed, mis määratlevad ja kirjeldavad teisi andmeid [ISO/IEC 11179-1] mõiste teadmisüksus, mille moodustab ühene tunnuste kombinatsioon [ISO 5127] märksõna termin või ette määratud terminite jada, mis on võetud märksõnastikust [ISO 25964-1]

68 märksõnastik ettekirjutatud terminite, märksõnade või koodide nimekiri, mille iga liige tähistab mõistet [ISO 25964-1] taksonoomia kategooriate ja alamkategooriate skeem, mida saab kasutada teadmusüksuste või informatsiooni sortimiseks või muul viisil organiseerimiseks [ISO 25964-1] termin, oskussõna sõna või fraas, millega mõistet tähistatakse [ISO 25964-1] tesaurus struktureeritud märksõnastik, milles iga mõiste kohta on terminid ning mis on organiseeritud nii, et mõistete vahelised seosed on välja toodud ja samuti on välja toodud eelisterminid ja nende sünonüümid [ISO 25964-1] ärimõiste organisatsiooni tegevust kirjeldav oskussõna ärisõnastik organisatsioonis kasutatava oskussõnavara ja nende sõnaseletuste loend, mis fikseerib organisatsiooni terminoloogia

69 Viited Õigusaktid • Arhiiviseadus. RT I, 21.03.2011, 1 • Avaliku teabe seadus. RT I 2000, 92, 597 • Euroopa Parlamendi ja nõukogu määrus (EL) 2022/868, 30. mai 2022, Euroopa andmehalduse kohta ning millega muudetakse määrust (EL) 2018/1724 (andmehalduse määrus) • Euroopa Parlamendi ja nõukogu määrus ühtlustatud õigusnormide kohta, millega reguleeritakse õiglast juurdepääsu andmetele ja andmete kasutamist (andmemäärus) • Euroopa Parlamendi ja nõukogu direktiivi (EL) 2019/1024 avaandmete ja avaliku sektori valduses oleva teabe taaskasutamise kohta (ELT L 172, 26.06.2019, lk 56–83) • Riigi infosüsteemi haldussüsteem. Vabariigi Valitsuse 28.02.2008 määrus nr 58. RT I 2008, 12, 84. • Teenuste korraldamise ja teabehalduse alused. Vabariigi Valitsuse 25.05.2017 määrus nr 88. RT I, 31.05.2017, 7. Standardid • Data Documentation Initiative (DDI) (Lifecycle 3.3, 20.04.2020) • DCAT Application Profile for data portals in Europe (ver 2.1.0, 06.12.2021); DCAT rakendusprofiil Euroopa andmeportaalidele (ver 2.1.0) • EVS-ISO 1087-1:2002 Terminoloogiatöö. Sõnastik. Osa 1: Teooria ja rakendus. Selle uustöötlus ei ole Eesti standard: ISO 1087:2019 Terminology work and terminology science — Vocabulary • EVS-ISO 2382 on inglise keelne uustöötlus: ISO/IEC 2382:2015 Information technology -- Vocabulary • EVS-ISO 5127:2004 Informatsioon ja dokumentatsioon. Sõnastik • EVS-ISO 15836-1:2019 Informatsioon ja dokumentatsioon. Dublin Core’i metaandmeelemendid. Osa 1: Põhielemendid (kehtiv alates 15.05.2019). EVS-ISO 15836- 2:2023 Informatsioon ja dokumentatsioon. Dublin Core’i metaandmeelemendid. Osa 2: DCMI atribuudid ja klassid (kehtiv alates 02.05.2023). • ISO 25964 Information and documentation — Thesauri and interoperability with other vocabularies — Part 1: Thesauri for information retrieval (2011), Part 2: Interoperability with other vocabularies (2013) • ISO/IEC 11179 ISO/IEC 11179 Information technology — Metadata registries (MDR) Part 1: Framework (2015), Part 2: Classification (2005), Part 3: Registry metamodel and basic attributes (2013),Part 4: Formulation of data definitions (2004),Part 5: Naming and identification principles (2005), Part 6: Registration (2004) • SKOS (Simple Knowledge Organization System). Raamatud ja artiklid • Erelt, Tiiu. Terminiõpetus (Tartu Ülikooli Kirjastus, 2007) • Floridi, Luciano. Data. In William A. Darity (ed.), International Encyclopedia of the Social Sciences. ( Macmillan, 2008) • Gillenson, Mark L. Fundamentals of database management systems. (2nd ed., Wiley, 2013)
• Kasak, Enn. Loogika alused (Tartu Ülikooli Kirjastus, 2014) • Kreuter. F. Improving Surveys with Paradata: Analytic Uses of Process Information (Wiley, 2013)

70 • Mereste, Uno. Oskuskeel ja seaduste keeleline rüü. Artikleid ja lühiuurimusi. (Eesti Keele Sihtasutus, 2000) • Riley. J. Understanding Metadata: What is Metadata, and What is it For?: A Primer (NISO, 2017) • Tavast, Arvi. Taukar, Marju. Mitmekeelne oskussuhtlus (Valgus, 2013). • Tiit, Ene-Margit. Tooding, Liina-Mai. Statistikaleksikon. (Tartu Ülikooli Kirjastus 2019) Juhised • Andmekirjelduse juhis Lisa 1: Andmekirjelduse standard. (Ver 2.0, Mai 2022). • Andmekirjelduse juhis Lisa 2: Sõnastike koostamine andmekirjeldustes. Praktiline juhis (Ver 0.3, Märts 2023) • Haav, Hele-Mai. Ontoloogiate loomise metoodika. (Ver. 4., 2011) • Haav, Hele-Mai. Nõuded RIHA ontoloogiatele. (Ver. 2.6., 2011) • Küngas, Peep. Semantilise kirjeldamise juhis (Ver 0.4., 2017) • RIHAKEse lõppkasutaja kasutusjuhend. (Ver 1.1.1, 17.01.2023)

Page 9 of 9