A N D M E H A L DU S E J U H I S E D Andmekirjelduse juhis Lisa 2: Sõnastike koostamine andmekirjeldustes. Praktiline juhis Juuni 2024
Versioon 0.9
2 Dokumendi ajalugu
ver muutuse sisu
autor
kuupäev
0.1
Senise praktika alusel
Aune Suitsmart, Reana
Parve, Annika Uibopuu
0.2 Kommentaarid sisule ja struktuurile Veiko Berendsen, Kuldar Aas veebr 2023 0.3 Kommentaaride sisseviimine, kujundus Veiko Berendsen märts 2023
0.8 Saatmine juhtrühmale Veiko Berendsen 13.03.2023 0.9 Andmekirjelduse standardi versiooniga 3.0 vastavusse viimine Piret Heinsaar, Aune Suitsmart, Reana Parve 06.06.2024 1.0 Lõppversioon
Kommentaarid juhise kohta on oodatud: Statistikaamet ([email protected]), Majandus- ja Kommunikatsiooniministeerium ([email protected]).
3 Sisukord 1 Sissejuhatus ....................................................................................................... 4 1.1 Üldist ........................................................................................................................................... 4 1.2 Sõnastike kasutamine andmekirjelduste koostamisel ja andmekataloogis ......................... 5 2 Ärisõnastiku mõiste kirjeldamine ........................................................................ 6 2.1 Mis on ärisõnastik? .................................................................................................................... 6 2.2 Ärisõnastiku mõisted ja nendevahelised seosed .................................................................... 6 2.3 Ärimõistete sisuline kirjeldamine .............................................................................................. 8 2.4 Ärimõistete vormistamine ärisõnastikus ................................................................................. 9 3 Andmesõnastiku terminite kirjeldamine ............................................................ 12 3.1 Mis on andmesõnastik? ........................................................................................................... 12 3.2 Andmesõnastiku termini sisuline kirjeldamine ...................................................................... 12 3.3 Termini sõnastuse ühtlustamine, täiendamine ja täpsustamine .......................................... 13 3.4 Andmesõnastiku termini vormistamine ................................................................................. 13 4 Näited ............................................................................................................... 15 Ärimõistete sisulise kirjeldamise näited ............................................................................. 15 Andmesõnastiku termini sisulise kirjeldamise näited ................................................... 17 Kasutatud allikad ...................................................................................................... 19
4 1 Sissejuhatus 1.1 Üldist Sõnastike koostamise praktiline juhis on osaks andmehalduse juhistest. Andmehalduse juhised (joonis 1) on mõeldud asutustele andmehalduse sisseviimiseks ja ko rraldamiseks, samuti abistamaks andmehalduse sisuliste tegevustega.
Joonis 1: Andmehalduse juhised Juhis on koostatud, lähtudes asutuste vajadustest saada sisuline ülevaade nende hallatavatest andmestikest ning kirjeldada nendes olevad andmed terminite ja mõistetena . Sõnastikud on osaks andmekirjeldusest. Juhise aluseks on terminitöö põhimõtted1, terminoloogia ja sõnastike koostamise standardi d2 ning arusaam, et sõnastikud on praktilised sõnavara haldamise töövahendid, mis on üha enam kasutusel IT -poolse andmehalduse ja valdkonna ehk äripoole vaadete sidujana3. Järgneval joonisel (joonis 2) on näidatud, kuidas sõnavara korrastamine sõnastikesse on seotud andmehalduse korrastusliku vahendiga, milleks on andmekataloog.
Joonis 2: Sõnastikud andmekirjelduses
1 Tiiu Erelt, Terminiõpetus (Tartu, 2007).
2 EVS-ISO 1087-1:2002 Terminoloogiatöö. Sõnastik: Osa 1. Teooria ja rakendus = Terminology work. Vocabulary:
Part 1. Theory and application;
EVS-ISO 25964-1:2023 Informatsioon ja dokumentatsioon. Tesaurused ja nende koostalitusvõime teiste sõnastikega.
Osa 1: Infootsingu tesaurused;
EVS-ISO 25964-2:2023 Informatsioon ja dokumentatsioon. Tesaurused ja nende koostalitusvõime teiste sõnastikega.
Osa 2: Koostalitusvõime teiste sõnastikega
3 Saumya Chaki, Enterprise Information Management in Practice: Managing Data and Leveraging Profits in Today's
Complex Business Environment (APress, 2016), p. 115-127.
5 Samas on tegu praktilise juhisega, mis esitab konkreetsete elementide kirje ldamise ja vormistamise nõuded . Juhise on koostanud asutuste andmekogude s kasutatavate IT ja valdkonna terminoloogia korrastamise ja sõnastike koostamise praktika põhjal Statistikaameti töötajad. 1.2 Sõnastike kasutamine andmekirjelduste koostamisel ja andmekataloogis Nagu on esitatud joonisel 2 , on andmekirjelduste koostamisel tegemist kahe erine va sõnastikuga. Need sõnastikud on seotud omavahel ning ka üldiste või valdkonna märksõnastikega. Eesti andmehalduses kehtib nii Eesti kui rahvusvahelistest sta ndarditest lähtuv põhimõte , et andmed ja andmestikud on korrastatud ja kirjeldatud andmekataloogis . Andmekataloog on kindlat tüüpi liigitusskeem . Andmekataloog sisaldab erinevaid kirjeldatav aid objekte, millest olulisemad on andmestik ja andmeelement. Mõlemale koostatakse kirjeldus, mille üheks osaks on nende tähistamine kindlate terminitega . Andmestiku puhul on need terminid märksõnad, andmeelemendi puhul on need elemendi nimetused ning seosed teiste mõistete ja terminitega. Sõnastikud on mõistesüsteemid , aga nad on ka terminisüsteemid ehk terminoloogiad ehk osa oskussõnavarast (joonis 3).
Joonis 3: Sõnastikud kui terminite ja mõistete süsteemid Andmekirjelduste koostamisel on sõnastike sisuks mõisted ja terminid: andmesõnastiku puhul nimetatakse neid terminiteks ja ärisõnastiku s on mõisted. Rangelt võttes tuleks lähtuda terminoloogia korrastamisel joonisel 3 kujutatud süsteemist. Igapäevatöös mõistetakse seda nii, et andmeelemendi tähised sõnastatakse andmesõnastikus terminitena ning ärisõnastikus, mi s sisaldab ka mõistete ja terminite vahelisi seoseid, nimetatakse neid mõisteteks.
6 2 Ärisõnastiku mõiste kirjeldamine 2.1 Mis on ärisõnastik? Ärisõnastik on organisatsioonis või organisatsioonideüleselt kokku lepitud sõnavara ehk mõistete ja terminite kogum, milles asutus igapäevaselt räägib või mis on kasutusel õigusaktides ja asutuse dokumentatsioonis. Sõnastik esitab organisatsiooni tegevuste ja andmete kohta piisavalt täieliku sõnavara, sisaldades nii üldisemaid kui ka detailsemaid mõisteid. Ärisõnastikke võib asutusel olla üks või mitu; nendes sisalduvad mõisted-terminid võivad pärineda nii valdkonna oskussõnastikest kui ka üldisest märksõnastikust. 2.2 Ärisõnastiku mõisted ja nendevahelised seosed Ärisõnastiku mõisted võivad olla omavahel seostatud. Mõistetevahelisi suhteid iseloomustavad järgmised seosetüübid:
Joonis 4: Mõistetevahelised suhted ja ärisõnastik kui tesaurus
- hierarhiline suhe – üks mõiste on teisest kas laiem või kitsam, nii et kitsam mõiste
mahub täielikult laiemasse mõistesse. Näiteks laiem mõiste kütus on hierarhilises seoses
(kitsama) mõistega biokütus või raske kütteõli.
a. hierarhiasuhte kontrollimiseks saab teha all-and-some testi: auto on kitsam mõiste kui sõiduk¸ kuna kõik autod on sõidukid ja mõned sõidukid on autod; b. hierarhiasuhte määramisel saab toetuda definitsioonidele, kus üks mõiste defineeritakse teise kaudu, nt mõistete sõiduk, mootorsõiduk, auto ja sõiduauto määratlused liiklusseaduses näitavad nendevahelisi hierarhilisi suhteid. Olgu siin näiteks toodud vaid määratluste algused: sõiduauto on sõitjate vedamiseks ettenähtud auto, milles…; auto on sõitjate või veose veoks või sõidukite haakes vedamiseks või eritööde tegemiseks ettenähtud vähemalt neljarattaline mootorsõiduk, mille…; mootorsõiduk on mootori jõul liikuv sõiduk, välja arvatud … - assotsiatiivsuhe – väljendab seost semantiliselt või kontekstuaalselt (kasutuskonteksti kaudu) seotud mõistete vahel, mis ei ole omavahel hierarhilises suhtes. Näiteks mõiste vigastatu on seostatud mõistega liiklusõnnetus. a. assotsiatiivsuhtes on mõisted, mille tähendusulatused osaliselt kattuvad, nt paat ja laev; protsess või tegevus ja selle tegija või vahend, nt kuritegude uurimine ja
7
kriminaaluurija; tegevus ja selle sihtmärk või saaja, nt juhiloa taotlemine ja juhiluba;
objekt või materjal ja selle omadused, nt mürgistus ja mürkaine; põhjusliku
seosega mõisted, nt haigus ja patogeen; objekt või protsess ja selle
vastureaktsioon, nt põletik ja põletikuvastane aine; liittermin ja selle põhisõna (kui
nende vahel puudub hierarhiasuhe), nt mudellaev ja laev; 4
b. sageli on üks mõistetest vajalik teise määratlemisel või selgitamisel, nt mõiste
hoone köetav pind määratlus on hoone kõigi sisekliima tagamisega ruumide suletud
netopindade summa ning on assotsiatiivsuhtes mõistega sisekliima tagamisega
ruum;
c. seoste tegemisel on kasu, kui mõisted on ärisõnastikus määratletud. Näiteks
energiamärgise puhul võib ühel juhul määratlus olla seotud kodumasinate ja teisel
juhul hoopis hoonete vastava märgisega. Kui ärisõnastikus on mõiste
energiamärgis puhul selgitatud, et energiamärgis annab infot projekteeritava või
olemasoleva hoone projekteeritud energiavajaduse või tegeliku energiatarbimise
kohta, siis kehtib ärisõnastikus mõistete energiamärgis ja hoone vahel
assotsiatiivsuhe;
3. grupeeriv suhe on mõistete kontekstipõhiseks grupeerimiseks (1) temaatiliselt
(näiteks mõiste kindlustus grupeerib mõisted nagu kindlustusvõtja, kindlustusleping,
kindlustusperiood) või (2) vormi põhjal ( näiteks dokumendi vormist tuletatud mõiste
metsateatis, mis grupeerib metsateatise vormiga seotud mõisted kinnistu, puit,
metsaomanik jne);
4. sünonüümsuhe väljendab samatähenduslikkust (nt tervishoiuteenuse osutaja ,
tervishoiuteenuse pakkuja ja tervishoiuasutus).
Iga kirjeldatav andmeelement seotakse ühe andmesõnastiku terminiga. Iga andmesõnastiku
termin seotakse ühe või mitme ärisõnastiku mõistega.
Joonisel 5 ja 6 on toodud näi ted andmekirjelduse vormistamisest Excelis. Joonisel 5 on iga
andmesõnastiku termini (veerg C) kohta kirjeldatud üks või mitut mõistet (veerg B). Joonisel 6 on
ärisõnastiku mõistete (veerud B ja F) vahel määratud seosed (veerg D). Hierarhilise suhte puhul
kasutatakse seosetüüpe LAIEM või KITSAM, assotsiatiivsuhte puhul SEOTUD, grupeeriva suhte
puhul KUULUB GRUPPI või GRUPEERIV ning sünonüümsuhte puhul SÜNONÜÜM.
Joonis 5: Andmesõnastiku koostamise näidis Excelis
4 EVS-ISO 25964 -2:2023 Informatsioon ja dokumentatsioon. Tesaurused ja nende koostalitusvõime teiste sõnastikega. Osa 1: Infootsingu tesaurused
8
Joonis 6: Ärisõnastiku koostamise näidis Excelis
2.3 Ärimõistete sisuline kirjeldamine
Järgnevalt on esitatud sõnastikes olevate ärimõistete praktilise kirjeldamise soovitused.
•
Kirjeldama asudes võta aluseks andmekogu põhimäärus või muu andmekogu kehtestav
õigusakt.
Toetu
ametlikes
dokumentides
kasutatud
sõnavarale,
sh
legaaldefinitsioonidele. Kui andmekogu toimimiseks on koostatud juhiseid või
metoodikadokument, kasuta nendes esitatud sõnavara.
•
Ärisõnastiku mõisted tuletatakse andmesõnastiku terminitest, mis väljendavad
andmeelementide sisu. Mõiste moodustatakse andmesõnastiku termini sellest osast,
mis on kõige lähemal andmete kontekstile ja näitab, kelle või mille kohta on andmed.
Näiteks
andmesõnastiku
termini
kodulindude
arv
puhul
mõisteks
kodulind;
andmesõnastiku termini munejate kanade väljahautud tibude arv puhul kirjeldatakse
mõisteks tibu; andmesõnastiku termini diiselrongivaguni kasutatava kütuse liik puhul
kütus. Andmesõnastiku termin seotakse ärisõnastiku mõistega.
•
Kui andmesõnastiku termin sisaldab mitut olulist konteksti, kirjeldatakse ka need
mõisteteks. Eelnevate näidete puhul vastavalt muneja kana ja diiselrongivagun.
•
Kõik andmesõnastiku terminite alusel tuletatud mõisted lisatakse ärisõnastikku.
Ärisõnastikku lisatakse töö käigus ka teisi andmekogu andmete mõistmiseks olulisi
mõisteid. Mõistete vahel luuakse seosed. Mõistetevaheliste seoste tegemisel lähtutakse
mõistete sisust, mitte esinemisest samas andmesõnastiku terminis.
•
Eelnevate näidete puhul lisatakse ärisõnastikku nii mõiste kodulind kui ka selle laiem
mõiste lind; nii mõiste diiselrongivagun kui ka selle laiem mõiste raudteeveerem.
•
Kui andmesõnastiku termin sisaldab mitut üksteist täiendavat konteksti, siis lisatakse
ärisõnastikku kõik vastavad mõisted ning seotakse need andmesõnastiku terminiga.
Näiteks andmesõnastiku termin metsateatise, ekspertiisi või välitöö objekti omaniku
isikukood seotakse mõistetega metsateatise objekti omanik, ekspertiisi objekti omanik ja
välitöö objekti omanik.
•
Soovitame asukohaga seotud andmesõnastiku terminite puhul kasutada üldistavat
mõistet aadressiandmed, et ei peaks iga asukohadetaili eraldi mõisteks kirjeldama.
Ärisõnastiku mõiste aadressiandmed katab kõik asukohaga seotud andmed, nagu nt
registreerimis-, juriidilise, asukoha, toimumiskoha aadressi jm asukohta tähistavad
andmed, sh sihtnumbrid, koordinaadid. Nt andmesõnastiku termin õppeasutuse juriidiline
aadress – postiindeks on seotud mõistetega õppeasutus ja aadressiandmed.
•
Kontaktandmetega seotud andmesõnastiku terminite puhul soovitame kasutada
üldistavat mõistet kontaktandmed, et ei peaks iga detaili eraldi mõisteks kirjeldama.
Ärisõnastiku mõiste kontaktandmed hõlmab kõiki isiku või organisatsiooniga seotud
kontaktandmeid, mis ei ole aadressiandmed, nt nagu telefoninumber, e-posti aadress,
9 faksinumber, veebisaidi aadress, sotsiaalmeedia konto. Nt andmesõnastiku termin isiku e-posti aadress on seotud mõistetega isik ja kontaktandmed. • Tegevused, mis on seotud andmekogu kontekstis oluliste objektide/sündmuste/protsesside staatuse või olekuga, võib formuleerida ärisõnastiku mõisteteks (nt liikmeks astumine, liikmesuse peatamine, jäätmete käitlemine). • Tegevused, mis on seotud sündmuste dokumenteerimise või menetlemisega, ei moodusta üldreeglina ärisõnastiku mõisteid (nt dokumendi registreerimine, kinnitamine, allkirjastamine jmt). Näiteks andmesõnastiku termini dokumendi registreerimise aeg puhul ei moodustata ärimõistet dokumendi registreerimine, vaid dokument. • Üldjuhul ei moodustata ärisõnastiku mõisteid terminit iseloomustavatest üldistest kirjeldustest, tunnustest, omadustest ega ka mitte sellistest üldlevinud mõistetest nagu mass, liik, tüüp, vanus, arv, nimi, sugu, värvus, tunnus, ajad/kuupäevad/kellaajad jmt. 2.4 Ärimõistete vormistamine ärisõnastikus Ärisõnastiku ja andmesõnastiku mõistete ja terminite kirjelduselemendid põhinevad andmekirjelduse standardil5. Ärisõnastiku mõistekirje koosneb alltoodud kirjelduselementidest. Ärimõiste kirjelduselement TERMIN
• Ärimõistet tähistav termin sõnastatakse üldjuhul ainsuses.
• Termin kirjutatakse väikese algustähega, välja arvatud juhul, kui algustähereegel nõuab
suure algustähe kasutamist.
• Termin sõnastatakse eesti ja inglise keeles.
• Terminis võib kasutada üldtuntud või andmekogu oskuskeeles käibel olevaid akronüüme,
nt termin CTISi teavitus. Viimase näite puhul on soovitatav kirjeldada ärisõnastikus
ärimõistena ka infosüsteemi nimi Clinical Trials Information System (CTIS) ning siduda see
mõistega CTISi teavitus.
Ärimõiste kirjelduselement MÄÄRATLUS
• Kirjelduselement sisaldab kas mõiste määratlust ehk definitsiooni või mõiste sisu avavat
selgitust. Määratlus on lühike ja ühemõtteline mõistet kirjeldav ning kindlate
vormistusreeglite järgi koostatud lausung, milles esitatakse definitsiooni tavatunnused.
o
Määratluste tüübid leiab Eesti Keele Instituudi „EKI teatmiku“ veebilehelt Definitsiooni
tüübid.
o
Mõistete määratlustena tuleks eelistada õigusaktide legaaldefinitsioone, kui need on
olemas.
o
Määratluse puudumisel või selle mõistmise hõlbustamiseks võib lisada selgituse.
Selgitus võib sisaldada mõiste vabas vormis kirjeldust, täpsustavaid ja/või
täiendavaid kommentaare, kasutuskonteksti vm mõistet avavat lisateavet, mis
põhineb õigusaktidel või andmekogu dokumentatsioonil. Legaaldefinitsioonide
5 Andmekirjelduse juhis. Lisa 1: Andmekirjelduse standard. Ver 3.0 (Statistikaamet, 2024).
10 puudumisel võib kokkuleppel asutusega kasutada ka muudest terminiallikatest pärit määratlusi (näiteks üld- või oskuskeele sõnastikud, terminibaasid). o Määratlusi võib ka ise koostada , kasutades erinevaid terminiallikaid , nagu nt õigusaktid, andmekogu tehniline dokumentatsioon, juhised jms. Määratlust täiendavad ja selgitavad kommentaarid ning märkused võib lisada kirjelduselemendi MÄRK USED väljale. • Mõiste määratlus algab üldjuhul väikese algustähega ning on ilma lõpupunktita. Kui mõistet kirjeldav selgitus koosneb ühest või mitmest täislausest, siis kirjutatakse need suure algustähe ja punktiga lause lõpus:
mõiste määratlus / selgitus ratsutamishall statsionaarne ruum ratsaspordiga tegelemiseks ehitis inimtegevuse tulemusel loodud ja aluspinnasega ühendatud või sellele toetuv asi, mille kasutamise otstarve, eesmärk, kasutamise viis või kestvus võimaldab seda eristada teistest asjadest. Ehitised jagunevad hooneteks või rajatisteks. sein vertikaalne konstruktsioon, mis piirab või jagab ruumi ja täidab tavaliselt kande- või tugifunktsiooni kinnistu number Kinnistusraamatusse kantakse kõik kinnisasjad, kui seaduses ei ole sätestatud teisiti. Iga kinnistusraamatusse kantud kinnisasja kohta avatakse iseseisev registriosa ja sellele antakse eraldi number (kinnistu number). • Mõistet tähistavat terminit määratluse alguses üldjuhul ei korrata . Näiteks aluspinnasega kohtkindlalt ühendatud ja inimtegevuse tulemusena ehitatud terviklik asi (mitte ehitis on aluspinnasega kohtkindlalt ühendatud ja inimtegevuse tulemusena ehitatud terviklik asi). • Mõiste määratlus sõnastatakse eesti ja inglise keeles. Ühe mõistekirje eesti- ja ingliskeelsed määratlused peavad omavahel sisuliselt kattuma. • Lühendatud sõnad kirjutatakse lahti. Näiteks: nr – number, tuh – tuhat, ik – isikukood, tn – tänav, kp – kuupäev, a – aasta, mln – miljon, mld – miljard. • Üldlevinud akronüüme võib määratlustes kasutada. Näiteks: jt.
Ärimõiste kirjelduselement ALLIK AS
• Kirjelduselement allikas sisaldab Riigi Teatajale viidates linki õigusaktile . Õigusakti
paragrahvi, lõiget ja punkti ei täpsustata. Üldjuhul viidatakse kirjeldamise hetkel kehti va
õigusakti terviktekstile. Lisatakse viide avaldamismärkele. Näiteks: Rahvastikuregistri
seadus (RT I, 10.02.2023, 9)
• Lisaks õigusaktile võib mõiste allikas olla ka:
o Üldkeelesõnastik või oskussõnastik : näiteks Eesti märksõnastik (EMS) või mõni
osksusõnastik, nagu Mitmekeelne Demograafiasõnastik või Kosmoseterminoloogia.
Täpsem nimekiri on Eesti Keele Instituudi terminiallikate veebilehel. Allikaviiteks on
viide sõnastikule.
11
o Klassifikaator või klassifikaatori element: nt Statistikaameti klassifikaatorite portaalis
avaldatud klassifikaator või Haridus- ja koolitusvaldkondade liigitus ; samuti võib
allikaks olla mõni rahvusvaheline portaal, nagu RAMON (Reference And Management
Of Nomenclatures ) ja selles avaldatud standard, näiteks „PRODCOM List 2021 “.
Allikaviiteks on viide klassifikaatorile.
o Asutuse koduleht, andmekoguga seotud dokument või (kasutus)juhend. Allikaviiteks
on võimalikult täpne viide teabeallikale.
o Juhend, väljaanne vms, millele ei ole elektroonilist viidet. Allikaviiteks on allika pealkiri
ja ilmumisandmed.
o Kui mõiste määratluse on koostanud oma asutus, lisatakse allikaviitena asutuse nimi.
Ärimõiste kirjelduselement MÄRK USED
• Mõiste märkused on lühike mõistet avav laus e, lõik või pikem selgitus . Kõik täiendavad
kommentaarid mõiste määratluse, selgituse, koostamise või kasutamise kohta võib lisada
märkustesse. Märkused vormistatakse suure algustähega, lause lõpus on punkt.
• Mõiste märkused sõnastatakse ainult eesti keeles.
• Lühendatud sõnad kirjutatakse lahti. Näiteks: number, tänav, kuupäev, aasta, miljon, miljard.
• Märkustes võib kasutada üldtuntud või andmekogu oskuskeeles käibel olevaid akronüüme.
Näiteks: EPS-põld, MAH, EHAK, EMTAK, ÜRO.
Ärimõiste kirjelduselement ON EEL ISTERMI N
• Eelistermin on mõistet väljendav termin, mida eelistatakse selle sünonüümidele. Näiteks
tervishoiuteenuse osutaja, tervishoiuteenuse pakkuja ja tervishoiuasutus on sünonüümsed
terminid ja ärisõnastikus vastava seosetüübiga omavahel seotud. Kui tervishoiuasutus
märgitakse ärisõnastikus eelisterminiks, siis see tähendab, et asutus eelistab neist kolmest
kasutada just seda.
12
3 Andmesõnastiku terminite kirjeldamine
3.1 Mis on andmesõnastik?
Andmesõnastik on ühelt poolt terminite nimekiri ning teiselt poolt esitab terminitena
andmeelementide nimetused (pealkirjad). Andmeelement võib olla tähistatud selle sisu
väljendava inimloetava sõna või fraasiga, aga selleks võib olla ka akronüüm, lühend või muu sõne
või tähis, mis on masinloetav ega pole lisaselgituseta mõistetav. Andmesõnastiku terminid
seotakse vahetult andmee lemendiga.6 Iga kirjeldatav andmeelement seotakse ühe
andmesõnastiku terminiga.
Andmekirjelduse mõttes vähemtähtsateks andmeteks võib üldjuhul lugeda süsteemi logi,
andmebaasi kirjete loomise ja muutmise kuupäevi, failide räsisid ja muud tehnilist tugiinfot, mis
ei ole otseselt seotud organisatsiooni põhiülesannete täitmise käigus andmete töötlemise,
andmepõhise juhtimise või andmevahetuse eesmärkidega.7 Seesuguste andmeelementide kohta
ei ole vaja andmesõnastiku terminit moodustada. Klassifikaatorite ja koodiloenditega seotud
andmeelemendid tuleks kirjeldada.
Igale andmeelemendile vastava andmesõnastiku termini kohta kirjeldatakse üks või mitu
ärisõnastiku mõiste(t).
3.2 Andmesõnastiku termini sisuline kirjeldamine
Järgnevalt on esitatud andmesõnastikes olevate terminite praktilise kirjeldamise soovitused
koos ärimõistetega sidumisega.
• Kirjeldama asudes toetu andmekogu põhimääruses , metoodikadokumentides jm
ametlikes dokumentides kasutatud sõnavarale.
• Andmesõnastiku termin peaks olema andmeelemendi konteksti võimalikult täpselt avav,
vajaduse korral mitmest sõnast koosnev liittermin või terminifraas. N äiteks: müüdud
kütuse kogus , sportlasestipendiumi saaja ees - ja perekonnanimi , spordiobjekti
riietusruumide arv .
• Ajaga seotud terminid soovitame sõnastada võimalikult täpselt, et terminist selguks, kas
tegu on näiteks aasta, kuupäeva ja/või kellaajaga. Näiteks: orienteerumiskaardi esmase
kasutuselevõtu aasta , treenerikutse kehtivuse alguskuupäev , vanglasse saabumise
kuupäev ja kellaaeg .
• Andmesõnastiku terminid soovitame võimalikult detailselt lahti kirjutada, n äiteks: e-posti
aadress (mitte e-post), veebilehe aadress (mitte veebileht).
• Andmesõnastiku termin seotakse mõistega , mis on kõige lähemal andmete
kontekstile ja näitab, kelle või mille kohta on andmed. Kontekste võib olla mitu (vt ka
ärimõistete sisulise kirjeldamise alateemat).
6 Andmekirjelduse juhis. Lisa 1: Andmekirjelduse standard. Ver 3.0 (Statistikaamet, 2024) 7 Andmekirjelduse juhis. Ver 2.0 (Statistikaamet, 2023)
13
3.3 Termini sõnastuse ühtlustamine, täiendamine ja täpsustamine
Andmesõnastiku termini sõnastust ühtlustatakse alljärgnevatel juhtudel.
• Andmeelemendi kirjeldus ei ava konteksti, n äiteks andmeelement on kõrgus ning pole
täpsustatud, kelle/mille kõrgus.
• Andmesõnastiku terminit täiendatakse, kui dokumentatsioonist selgub termini sisu
täpsustav või täiendav kontekst . Näiteks: andmeelemendist esindusõiguse kehtivuse
algus moodustatakse andmesõnastiku termin spordiorganisatsiooni esindaja
esindusõiguse kehtivuse alguskuupäev .
• Andmekoosseisu kirjelduse või asutuse/andmekogu dokumentatsiooni põhjal võib kindlalt
järeldada, et andmeelemendi nimetus ei väljenda selle korrektset sisu . Näiteks:
andmeelement kõrgus tähistab hoopis keskmist kõrgust; konteksti keskmine kõrgus siiski
edasi ei anna, seega tuleb andmesõnastiku terminiks sel juhul kirjeldada puistu keskmine
kõrgus.
• Andmesõnastiku terminit võib vajaduse korral lühendada, kui:
o andmeelement sisaldab õigusaktist või vormist tulenevat konteksti ; näiteks
andmeelemendi ankeeti iseloomustav tunnus pangakonto number puhul piisab
terminist pangakonto number ; andmete päritolu vormi, milleks on ankeet,
andmesõnastiku terminis ei ole vaja täpsustada;
o andmeelement sisaldab lisatäpsustust andmete kohta ; näiteks andmeelemendi
kirjeldus on ettevõtte müügi andmed : müüdud kauba kogus . Sellisel juhul võib
kirjeldada andmesõnastiku termini lühemaks, piisab liitterminist müüdud kauba
kogus.
3.4 Andmesõnastiku termini vormistamine
Andmesõnastiku terminite kirjelduselemendid põhinevad andmekirjelduse standardil .8
Andmesõnastiku terminikirje koosneb alltoodud kirjelduselementidest.
Andmesõnastiku termini kirjelduselement TERMIN
• Termin kirjutatakse väikese algustähega, välja arvatud juhul, kui algustähereegel nõuab
suure algustähe kasutamist.
• Andmesõnastiku termin sõnastatakse ainult eesti keeles, seevastu ärimõisted nii eesti kui
inglise keeles.
• Andmesõnastiku termini kirjeldamisel välditakse kõrvallauseid, pikkades terminifraasides
võib selle erinevad osad eristada mõttekriipsuga.
• Üldjuhul terminis mõõtühikut ei kirjelda ta. Kui see on RIHA andmeobjekti kommentaaris
olemas, siis on soovitatav see sinna alles jätta. N äiteks kui RIHA andmeobjekt (sellele
vastab siinse andmekirjelduse juhise kontekstis andmeelement) on fossiilse kütuse
kasvuhoonegaaside (KHG) mahukus (gCO2ekv/MJ) , siis temaga seotud
8 Andmekirjelduse juhis. Lisa 1: Andmekirjelduse standard. Ver 3.0 (Statistikaamet, 2024).
14
andmesõnastiku termin on samuti fossiilse kütuse kasvuhoonegaaside (KHG) mahukus
(gCO2ekv/MJ) .
• Kirjavahemärkidest kasutatakse pikkades terminifraasides ainult mõttekriipsu ja vajaduse
korral ka koma; ei kasutata lauselõpumärke ega muid kirjavahemärke, nagu n äiteks
hüüumärk, küsimärk, kaldkriips, koolon, mõttepunktid jt (? . ! / : …). Ümarsulge soovitame
vältida, kuid see ei ole alati võimalik.
• Lühendatud sõnad kirjutatakse terminis üldjuhul lahti (n äiteks number, tänav, kuupäev,
aasta).
• Terminis võib kasutada üldtuntud või andmekogu oskuskeeles käibel olevaid akronüüme,
nt EPS-põld, MAH, ÜRO, EHAK, EMTAK . Akronüümide kasutamisel peaks alati lähtuma
asutuses käibel olevast oskussõnavarast. Soovitatav on akronüümid, mis ei ole üldtuntud,
ärisõnastikus või andmesõnastiku termini määratluses lahti kirjutada.
Andmesõnastiku termini kirjelduselement MÄÄRATLUS
• Termini määratlus algab väikese algustähega ning on ilma lõpupunktita . Kui terminit
kirjeldav selgitus koosneb täislause(te)st, siis kirjutatakse need suure algustähe ja punktiga
lause lõpus.
• Lühendatud sõnad kirjutatakse lahti (näiteks number, tänav, kuupäev, aasta, telefoninumber,
miljon, miljard).
• Üldlevinud akronüüme võib andmesõnastiku määratlustes kasutada (n äiteks KOV, EHAK,
ÜRO, EU, NATO).
• Enamasti ei võeta termini määratlust üldsõnastikust (nt EMS, Esterm), sest andmekogu
kontekstis võib andmete tähendus erineda üldlevinud määratlustest.
• Kui on olemas Eesti standard, milles termin on määratletud, tuleb eelistada seda
määratlust.
Andmesõnastiku termini kirjelduselement MÄRK USED
• Mõiste märkused kirjutatakse suure algustähe ja lauselõpupunktiga.
• Üldlevinud akronüüme võib andmesõnastiku märkustes kasutada, nt KOV, EHAK, ÜRO.
15 4 Näited
Ärimõistete sisulise kirjeldamise näited Näited 1–3. Mõiste moodustamine. Mõiste moodustatakse andmesõnastiku termini sellest osast, mis on kõige lähemal andmete kontekstile ja näitab, kelle või mille kohta on andmed. Näiteks pangaandmete puhul on andmesõnastiku terminite panga kood ja panga nimi mõisteks pank (tabel 1). Mõiste seotakse andmesõnastiku terminitega. Ärisõnastikku lisatakse ka mõisted pangatehing ja arveldus. Isikuandmete puhul on andmesõnastiku termini isiku e-maili aadress mõisteks isik ja kontaktandmed. Mõlemad mõisted seotakse andmesõnastiku terminiga (tabel 1). Välismaalase andmete puhul on andmesõnastiku termini välismaalase isikukood või muu identifitseeriv kood mõisteks välismaalane. Mõiste seotakse andmesõnastiku terminiga (tabel 1). Tabel 1. Ärisõnastiku mõisted ja andmesõnastiku terminid Näite jrk nr Andmesõnastiku terminiga seotud ärisõnastiku mõiste(d) Andmesõnastiku termin 1 pank taotluse kohta tehtud makseotsuse arvelduse pangatehinguga seotud panga kood taotluse kohta tehtud makseotsuse arvelduse pangatehinguga seotud panga nimi 2 isik; kontaktandmed isiku e-maili aadress 3 välismaalane välismaalase isikukood või muu identifitseeriv kood
Näited 4–8. Mõiste moodustatakse andmesõnastiku termini sellest osast, mis näitab, kelle või mille kohta on andmed (tabel 2). Tabel 2. Ärisõnastiku mõisted ja andmesõnastiku terminid Näite jrk nr Andmesõnastiku terminiga seotud ärisõnastiku mõiste(d) Andmesõnastiku termin 4 käibemaks arve käibemaksu summa 5 arve arve summa käibemaksuta 6 müügitulu ettevõtte müügitulu suurus 7 töövõime eksperdiarvamus töövõime hindamise kohta 8 eksperdiarvamus eksperdiarvamuse andmise kuupäev
Näited 9-11. Mõistetevahelised seosed – hierarhiline suhe. Mõistete vahel kehtib hierarhiline suhe, kui kitsam mõiste mahub täielikult laiemasse mõistesse. Laiema mõiste lisamisel soovitame kontrollida, kas töötab all-and-some test. Näiteks kõik mitterahalised kohustised on kohustised, mõned kohustised on mitterahalised kohutised. Seega kohustis on mitterahalise kohustise laiem mõiste (tabel 3).