AH_juhis_andmekirjeldus_s%C3%B5nastikud_0.9.1.pdf

Type: Document | Status: ready

A N D M E H A L DU S E J U H I S E D Andmekirjelduse juhis Lisa 2: Sõnastike koostamine andmekirjeldustes. Praktiline juhis Juuni 2024

Versioon 0.9

2 Dokumendi ajalugu

ver muutuse sisu autor kuupäev 0.1 Senise praktika alusel
Aune Suitsmart, Reana Parve, Annika Uibopuu

0.2 Kommentaarid sisule ja struktuurile Veiko Berendsen, Kuldar Aas veebr 2023 0.3 Kommentaaride sisseviimine, kujundus Veiko Berendsen märts 2023

0.8 Saatmine juhtrühmale Veiko Berendsen 13.03.2023 0.9 Andmekirjelduse standardi versiooniga 3.0 vastavusse viimine Piret Heinsaar, Aune Suitsmart, Reana Parve 06.06.2024 1.0 Lõppversioon

Kommentaarid juhise kohta on oodatud: Statistikaamet ([email protected]), Majandus- ja Kommunikatsiooniministeerium ([email protected]).

3 Sisukord 1 Sissejuhatus ....................................................................................................... 4 1.1 Üldist ........................................................................................................................................... 4 1.2 Sõnastike kasutamine andmekirjelduste koostamisel ja andmekataloogis ......................... 5 2 Ärisõnastiku mõiste kirjeldamine ........................................................................ 6 2.1 Mis on ärisõnastik? .................................................................................................................... 6 2.2 Ärisõnastiku mõisted ja nendevahelised seosed .................................................................... 6 2.3 Ärimõistete sisuline kirjeldamine .............................................................................................. 8 2.4 Ärimõistete vormistamine ärisõnastikus ................................................................................. 9 3 Andmesõnastiku terminite kirjeldamine ............................................................ 12 3.1 Mis on andmesõnastik? ........................................................................................................... 12 3.2 Andmesõnastiku termini sisuline kirjeldamine ...................................................................... 12 3.3 Termini sõnastuse ühtlustamine, täiendamine ja täpsustamine .......................................... 13 3.4 Andmesõnastiku termini vormistamine ................................................................................. 13 4 Näited ............................................................................................................... 15 Ärimõistete sisulise kirjeldamise näited ............................................................................. 15 Andmesõnastiku termini sisulise kirjeldamise näited ................................................... 17 Kasutatud allikad ...................................................................................................... 19

4 1 Sissejuhatus 1.1 Üldist Sõnastike koostamise praktiline juhis on osaks andmehalduse juhistest. Andmehalduse juhised (joonis 1) on mõeldud asutustele andmehalduse sisseviimiseks ja ko rraldamiseks, samuti abistamaks andmehalduse sisuliste tegevustega.

Joonis 1: Andmehalduse juhised Juhis on koostatud, lähtudes asutuste vajadustest saada sisuline ülevaade nende hallatavatest andmestikest ning kirjeldada nendes olevad andmed terminite ja mõistetena . Sõnastikud on osaks andmekirjeldusest. Juhise aluseks on terminitöö põhimõtted1, terminoloogia ja sõnastike koostamise standardi d2 ning arusaam, et sõnastikud on praktilised sõnavara haldamise töövahendid, mis on üha enam kasutusel IT -poolse andmehalduse ja valdkonna ehk äripoole vaadete sidujana3. Järgneval joonisel (joonis 2) on näidatud, kuidas sõnavara korrastamine sõnastikesse on seotud andmehalduse korrastusliku vahendiga, milleks on andmekataloog.

Joonis 2: Sõnastikud andmekirjelduses

1 Tiiu Erelt, Terminiõpetus (Tartu, 2007). 2 EVS-ISO 1087-1:2002 Terminoloogiatöö. Sõnastik: Osa 1. Teooria ja rakendus = Terminology work. Vocabulary:
Part 1. Theory and application; EVS-ISO 25964-1:2023 Informatsioon ja dokumentatsioon. Tesaurused ja nende koostalitusvõime teiste sõnastikega. Osa 1: Infootsingu tesaurused; EVS-ISO 25964-2:2023 Informatsioon ja dokumentatsioon. Tesaurused ja nende koostalitusvõime teiste sõnastikega. Osa 2: Koostalitusvõime teiste sõnastikega 3 Saumya Chaki, Enterprise Information Management in Practice: Managing Data and Leveraging Profits in Today's Complex Business Environment (APress, 2016), p. 115-127.

5 Samas on tegu praktilise juhisega, mis esitab konkreetsete elementide kirje ldamise ja vormistamise nõuded . Juhise on koostanud asutuste andmekogude s kasutatavate IT ja valdkonna terminoloogia korrastamise ja sõnastike koostamise praktika põhjal Statistikaameti töötajad. 1.2 Sõnastike kasutamine andmekirjelduste koostamisel ja andmekataloogis Nagu on esitatud joonisel 2 , on andmekirjelduste koostamisel tegemist kahe erine va sõnastikuga. Need sõnastikud on seotud omavahel ning ka üldiste või valdkonna märksõnastikega. Eesti andmehalduses kehtib nii Eesti kui rahvusvahelistest sta ndarditest lähtuv põhimõte , et andmed ja andmestikud on korrastatud ja kirjeldatud andmekataloogis . Andmekataloog on kindlat tüüpi liigitusskeem . Andmekataloog sisaldab erinevaid kirjeldatav aid objekte, millest olulisemad on andmestik ja andmeelement. Mõlemale koostatakse kirjeldus, mille üheks osaks on nende tähistamine kindlate terminitega . Andmestiku puhul on need terminid märksõnad, andmeelemendi puhul on need elemendi nimetused ning seosed teiste mõistete ja terminitega. Sõnastikud on mõistesüsteemid , aga nad on ka terminisüsteemid ehk terminoloogiad ehk osa oskussõnavarast (joonis 3).

Joonis 3: Sõnastikud kui terminite ja mõistete süsteemid Andmekirjelduste koostamisel on sõnastike sisuks mõisted ja terminid: andmesõnastiku puhul nimetatakse neid terminiteks ja ärisõnastiku s on mõisted. Rangelt võttes tuleks lähtuda terminoloogia korrastamisel joonisel 3 kujutatud süsteemist. Igapäevatöös mõistetakse seda nii, et andmeelemendi tähised sõnastatakse andmesõnastikus terminitena ning ärisõnastikus, mi s sisaldab ka mõistete ja terminite vahelisi seoseid, nimetatakse neid mõisteteks.

6 2 Ärisõnastiku mõiste kirjeldamine 2.1 Mis on ärisõnastik? Ärisõnastik on organisatsioonis või organisatsioonideüleselt kokku lepitud sõnavara ehk mõistete ja terminite kogum, milles asutus igapäevaselt räägib või mis on kasutusel õigusaktides ja asutuse dokumentatsioonis. Sõnastik esitab organisatsiooni tegevuste ja andmete kohta piisavalt täieliku sõnavara, sisaldades nii üldisemaid kui ka detailsemaid mõisteid. Ärisõnastikke võib asutusel olla üks või mitu; nendes sisalduvad mõisted-terminid võivad pärineda nii valdkonna oskussõnastikest kui ka üldisest märksõnastikust. 2.2 Ärisõnastiku mõisted ja nendevahelised seosed Ärisõnastiku mõisted võivad olla omavahel seostatud. Mõistetevahelisi suhteid iseloomustavad järgmised seosetüübid:

Joonis 4: Mõistetevahelised suhted ja ärisõnastik kui tesaurus

  1. hierarhiline suhe – üks mõiste on teisest kas laiem või kitsam, nii et kitsam mõiste mahub täielikult laiemasse mõistesse. Näiteks laiem mõiste kütus on hierarhilises seoses (kitsama) mõistega biokütus või raske kütteõli.
    a. hierarhiasuhte kontrollimiseks saab teha all-and-some testi: auto on kitsam mõiste kui sõiduk¸ kuna kõik autod on sõidukid ja mõned sõidukid on autod; b. hierarhiasuhte määramisel saab toetuda definitsioonidele, kus üks mõiste defineeritakse teise kaudu, nt mõistete sõiduk, mootorsõiduk, auto ja sõiduauto määratlused liiklusseaduses näitavad nendevahelisi hierarhilisi suhteid. Olgu siin näiteks toodud vaid määratluste algused: sõiduauto on sõitjate vedamiseks ettenähtud auto, milles…; auto on sõitjate või veose veoks või sõidukite haakes vedamiseks või eritööde tegemiseks ettenähtud vähemalt neljarattaline mootorsõiduk, mille…; mootorsõiduk on mootori jõul liikuv sõiduk, välja arvatud …
  2. assotsiatiivsuhe – väljendab seost semantiliselt või kontekstuaalselt (kasutuskonteksti kaudu) seotud mõistete vahel, mis ei ole omavahel hierarhilises suhtes. Näiteks mõiste vigastatu on seostatud mõistega liiklusõnnetus. a. assotsiatiivsuhtes on mõisted, mille tähendusulatused osaliselt kattuvad, nt paat ja laev; protsess või tegevus ja selle tegija või vahend, nt kuritegude uurimine ja

7 kriminaaluurija; tegevus ja selle sihtmärk või saaja, nt juhiloa taotlemine ja juhiluba; objekt või materjal ja selle omadused, nt mürgistus ja mürkaine; põhjusliku seosega mõisted, nt haigus ja patogeen; objekt või protsess ja selle vastureaktsioon, nt põletik ja põletikuvastane aine; liittermin ja selle põhisõna (kui nende vahel puudub hierarhiasuhe), nt mudellaev ja laev; 4
b. sageli on üks mõistetest vajalik teise määratlemisel või selgitamisel, nt mõiste hoone köetav pind määratlus on hoone kõigi sisekliima tagamisega ruumide suletud netopindade summa ning on assotsiatiivsuhtes mõistega sisekliima tagamisega ruum; c. seoste tegemisel on kasu, kui mõisted on ärisõnastikus määratletud. Näiteks energiamärgise puhul võib ühel juhul määratlus olla seotud kodumasinate ja teisel juhul hoopis hoonete vastava märgisega. Kui ärisõnastikus on mõiste energiamärgis puhul selgitatud, et energiamärgis annab infot projekteeritava või olemasoleva hoone projekteeritud energiavajaduse või tegeliku energiatarbimise kohta, siis kehtib ärisõnastikus mõistete energiamärgis ja hoone vahel assotsiatiivsuhe; 3. grupeeriv suhe on mõistete kontekstipõhiseks grupeerimiseks (1) temaatiliselt (näiteks mõiste kindlustus grupeerib mõisted nagu kindlustusvõtja, kindlustusleping, kindlustusperiood) või (2) vormi põhjal ( näiteks dokumendi vormist tuletatud mõiste metsateatis, mis grupeerib metsateatise vormiga seotud mõisted kinnistu, puit, metsaomanik jne); 4. sünonüümsuhe väljendab samatähenduslikkust (nt tervishoiuteenuse osutaja , tervishoiuteenuse pakkuja ja tervishoiuasutus). Iga kirjeldatav andmeelement seotakse ühe andmesõnastiku terminiga. Iga andmesõnastiku termin seotakse ühe või mitme ärisõnastiku mõistega. Joonisel 5 ja 6 on toodud näi ted andmekirjelduse vormistamisest Excelis. Joonisel 5 on iga andmesõnastiku termini (veerg C) kohta kirjeldatud üks või mitut mõistet (veerg B). Joonisel 6 on ärisõnastiku mõistete (veerud B ja F) vahel määratud seosed (veerg D). Hierarhilise suhte puhul kasutatakse seosetüüpe LAIEM või KITSAM, assotsiatiivsuhte puhul SEOTUD, grupeeriva suhte puhul KUULUB GRUPPI või GRUPEERIV ning sünonüümsuhte puhul SÜNONÜÜM.

Joonis 5: Andmesõnastiku koostamise näidis Excelis

4 EVS-ISO 25964 -2:2023 Informatsioon ja dokumentatsioon. Tesaurused ja nende koostalitusvõime teiste sõnastikega. Osa 1: Infootsingu tesaurused

8

Joonis 6: Ärisõnastiku koostamise näidis Excelis 2.3 Ärimõistete sisuline kirjeldamine Järgnevalt on esitatud sõnastikes olevate ärimõistete praktilise kirjeldamise soovitused. • Kirjeldama asudes võta aluseks andmekogu põhimäärus või muu andmekogu kehtestav õigusakt. Toetu ametlikes dokumentides kasutatud sõnavarale, sh legaaldefinitsioonidele. Kui andmekogu toimimiseks on koostatud juhiseid või metoodikadokument, kasuta nendes esitatud sõnavara. • Ärisõnastiku mõisted tuletatakse andmesõnastiku terminitest, mis väljendavad andmeelementide sisu. Mõiste moodustatakse andmesõnastiku termini sellest osast, mis on kõige lähemal andmete kontekstile ja näitab, kelle või mille kohta on andmed. Näiteks andmesõnastiku termini kodulindude arv puhul mõisteks kodulind; andmesõnastiku termini munejate kanade väljahautud tibude arv puhul kirjeldatakse mõisteks tibu; andmesõnastiku termini diiselrongivaguni kasutatava kütuse liik puhul kütus. Andmesõnastiku termin seotakse ärisõnastiku mõistega. • Kui andmesõnastiku termin sisaldab mitut olulist konteksti, kirjeldatakse ka need mõisteteks. Eelnevate näidete puhul vastavalt muneja kana ja diiselrongivagun. • Kõik andmesõnastiku terminite alusel tuletatud mõisted lisatakse ärisõnastikku. Ärisõnastikku lisatakse töö käigus ka teisi andmekogu andmete mõistmiseks olulisi mõisteid. Mõistete vahel luuakse seosed. Mõistetevaheliste seoste tegemisel lähtutakse mõistete sisust, mitte esinemisest samas andmesõnastiku terminis.
• Eelnevate näidete puhul lisatakse ärisõnastikku nii mõiste kodulind kui ka selle laiem mõiste lind; nii mõiste diiselrongivagun kui ka selle laiem mõiste raudteeveerem. • Kui andmesõnastiku termin sisaldab mitut üksteist täiendavat konteksti, siis lisatakse ärisõnastikku kõik vastavad mõisted ning seotakse need andmesõnastiku terminiga. Näiteks andmesõnastiku termin metsateatise, ekspertiisi või välitöö objekti omaniku isikukood seotakse mõistetega metsateatise objekti omanik, ekspertiisi objekti omanik ja välitöö objekti omanik. • Soovitame asukohaga seotud andmesõnastiku terminite puhul kasutada üldistavat mõistet aadressiandmed, et ei peaks iga asukohadetaili eraldi mõisteks kirjeldama. Ärisõnastiku mõiste aadressiandmed katab kõik asukohaga seotud andmed, nagu nt registreerimis-, juriidilise, asukoha, toimumiskoha aadressi jm asukohta tähistavad andmed, sh sihtnumbrid, koordinaadid. Nt andmesõnastiku termin õppeasutuse juriidiline aadress – postiindeks on seotud mõistetega õppeasutus ja aadressiandmed. • Kontaktandmetega seotud andmesõnastiku terminite puhul soovitame kasutada üldistavat mõistet kontaktandmed, et ei peaks iga detaili eraldi mõisteks kirjeldama. Ärisõnastiku mõiste kontaktandmed hõlmab kõiki isiku või organisatsiooniga seotud kontaktandmeid, mis ei ole aadressiandmed, nt nagu telefoninumber, e-posti aadress,

9 faksinumber, veebisaidi aadress, sotsiaalmeedia konto. Nt andmesõnastiku termin isiku e-posti aadress on seotud mõistetega isik ja kontaktandmed. • Tegevused, mis on seotud andmekogu kontekstis oluliste objektide/sündmuste/protsesside staatuse või olekuga, võib formuleerida ärisõnastiku mõisteteks (nt liikmeks astumine, liikmesuse peatamine, jäätmete käitlemine). • Tegevused, mis on seotud sündmuste dokumenteerimise või menetlemisega, ei moodusta üldreeglina ärisõnastiku mõisteid (nt dokumendi registreerimine, kinnitamine, allkirjastamine jmt). Näiteks andmesõnastiku termini dokumendi registreerimise aeg puhul ei moodustata ärimõistet dokumendi registreerimine, vaid dokument. • Üldjuhul ei moodustata ärisõnastiku mõisteid terminit iseloomustavatest üldistest kirjeldustest, tunnustest, omadustest ega ka mitte sellistest üldlevinud mõistetest nagu mass, liik, tüüp, vanus, arv, nimi, sugu, värvus, tunnus, ajad/kuupäevad/kellaajad jmt. 2.4 Ärimõistete vormistamine ärisõnastikus Ärisõnastiku ja andmesõnastiku mõistete ja terminite kirjelduselemendid põhinevad andmekirjelduse standardil5. Ärisõnastiku mõistekirje koosneb alltoodud kirjelduselementidest. Ärimõiste kirjelduselement TERMIN

• Ärimõistet tähistav termin sõnastatakse üldjuhul ainsuses. • Termin kirjutatakse väikese algustähega, välja arvatud juhul, kui algustähereegel nõuab suure algustähe kasutamist. • Termin sõnastatakse eesti ja inglise keeles.
• Terminis võib kasutada üldtuntud või andmekogu oskuskeeles käibel olevaid akronüüme, nt termin CTISi teavitus. Viimase näite puhul on soovitatav kirjeldada ärisõnastikus ärimõistena ka infosüsteemi nimi Clinical Trials Information System (CTIS) ning siduda see mõistega CTISi teavitus.

Ärimõiste kirjelduselement MÄÄRATLUS • Kirjelduselement sisaldab kas mõiste määratlust ehk definitsiooni või mõiste sisu avavat selgitust. Määratlus on lühike ja ühemõtteline mõistet kirjeldav ning kindlate vormistusreeglite järgi koostatud lausung, milles esitatakse definitsiooni tavatunnused.
o Määratluste tüübid leiab Eesti Keele Instituudi „EKI teatmiku“ veebilehelt Definitsiooni tüübid.
o Mõistete määratlustena tuleks eelistada õigusaktide legaaldefinitsioone, kui need on olemas. o Määratluse puudumisel või selle mõistmise hõlbustamiseks võib lisada selgituse. Selgitus võib sisaldada mõiste vabas vormis kirjeldust, täpsustavaid ja/või täiendavaid kommentaare, kasutuskonteksti vm mõistet avavat lisateavet, mis põhineb õigusaktidel või andmekogu dokumentatsioonil. Legaaldefinitsioonide

5 Andmekirjelduse juhis. Lisa 1: Andmekirjelduse standard. Ver 3.0 (Statistikaamet, 2024).

10 puudumisel võib kokkuleppel asutusega kasutada ka muudest terminiallikatest pärit määratlusi (näiteks üld- või oskuskeele sõnastikud, terminibaasid). o Määratlusi võib ka ise koostada , kasutades erinevaid terminiallikaid , nagu nt õigusaktid, andmekogu tehniline dokumentatsioon, juhised jms. Määratlust täiendavad ja selgitavad kommentaarid ning märkused võib lisada kirjelduselemendi MÄRK USED väljale. • Mõiste määratlus algab üldjuhul väikese algustähega ning on ilma lõpupunktita. Kui mõistet kirjeldav selgitus koosneb ühest või mitmest täislausest, siis kirjutatakse need suure algustähe ja punktiga lause lõpus:

mõiste määratlus / selgitus ratsutamishall statsionaarne ruum ratsaspordiga tegelemiseks ehitis inimtegevuse tulemusel loodud ja aluspinnasega ühendatud või sellele toetuv asi, mille kasutamise otstarve, eesmärk, kasutamise viis või kestvus võimaldab seda eristada teistest asjadest. Ehitised jagunevad hooneteks või rajatisteks. sein vertikaalne konstruktsioon, mis piirab või jagab ruumi ja täidab tavaliselt kande- või tugifunktsiooni kinnistu number Kinnistusraamatusse kantakse kõik kinnisasjad, kui seaduses ei ole sätestatud teisiti. Iga kinnistusraamatusse kantud kinnisasja kohta avatakse iseseisev registriosa ja sellele antakse eraldi number (kinnistu number). • Mõistet tähistavat terminit määratluse alguses üldjuhul ei korrata . Näiteks aluspinnasega kohtkindlalt ühendatud ja inimtegevuse tulemusena ehitatud terviklik asi (mitte ehitis on aluspinnasega kohtkindlalt ühendatud ja inimtegevuse tulemusena ehitatud terviklik asi). • Mõiste määratlus sõnastatakse eesti ja inglise keeles. Ühe mõistekirje eesti- ja ingliskeelsed määratlused peavad omavahel sisuliselt kattuma. • Lühendatud sõnad kirjutatakse lahti. Näiteks: nr – number, tuh – tuhat, ik – isikukood, tn – tänav, kp – kuupäev, a – aasta, mln – miljon, mld – miljard. • Üldlevinud akronüüme võib määratlustes kasutada. Näiteks: jt.

Ärimõiste kirjelduselement ALLIK AS
• Kirjelduselement allikas sisaldab Riigi Teatajale viidates linki õigusaktile . Õigusakti paragrahvi, lõiget ja punkti ei täpsustata. Üldjuhul viidatakse kirjeldamise hetkel kehti va õigusakti terviktekstile. Lisatakse viide avaldamismärkele. Näiteks: Rahvastikuregistri seadus (RT I, 10.02.2023, 9) • Lisaks õigusaktile võib mõiste allikas olla ka: o Üldkeelesõnastik või oskussõnastik : näiteks Eesti märksõnastik (EMS) või mõni osksusõnastik, nagu Mitmekeelne Demograafiasõnastik või Kosmoseterminoloogia. Täpsem nimekiri on Eesti Keele Instituudi terminiallikate veebilehel. Allikaviiteks on viide sõnastikule.

11 o Klassifikaator või klassifikaatori element: nt Statistikaameti klassifikaatorite portaalis avaldatud klassifikaator või Haridus- ja koolitusvaldkondade liigitus ; samuti võib allikaks olla mõni rahvusvaheline portaal, nagu RAMON (Reference And Management Of Nomenclatures ) ja selles avaldatud standard, näiteks „PRODCOM List 2021 “. Allikaviiteks on viide klassifikaatorile. o Asutuse koduleht, andmekoguga seotud dokument või (kasutus)juhend. Allikaviiteks on võimalikult täpne viide teabeallikale. o Juhend, väljaanne vms, millele ei ole elektroonilist viidet. Allikaviiteks on allika pealkiri ja ilmumisandmed. o Kui mõiste määratluse on koostanud oma asutus, lisatakse allikaviitena asutuse nimi. Ärimõiste kirjelduselement MÄRK USED
• Mõiste märkused on lühike mõistet avav laus e, lõik või pikem selgitus . Kõik täiendavad kommentaarid mõiste määratluse, selgituse, koostamise või kasutamise kohta võib lisada märkustesse. Märkused vormistatakse suure algustähega, lause lõpus on punkt. • Mõiste märkused sõnastatakse ainult eesti keeles. • Lühendatud sõnad kirjutatakse lahti. Näiteks: number, tänav, kuupäev, aasta, miljon, miljard. • Märkustes võib kasutada üldtuntud või andmekogu oskuskeeles käibel olevaid akronüüme. Näiteks: EPS-põld, MAH, EHAK, EMTAK, ÜRO. Ärimõiste kirjelduselement ON EEL ISTERMI N
• Eelistermin on mõistet väljendav termin, mida eelistatakse selle sünonüümidele. Näiteks tervishoiuteenuse osutaja, tervishoiuteenuse pakkuja ja tervishoiuasutus on sünonüümsed terminid ja ärisõnastikus vastava seosetüübiga omavahel seotud. Kui tervishoiuasutus märgitakse ärisõnastikus eelisterminiks, siis see tähendab, et asutus eelistab neist kolmest kasutada just seda.

12 3 Andmesõnastiku terminite kirjeldamine 3.1 Mis on andmesõnastik? Andmesõnastik on ühelt poolt terminite nimekiri ning teiselt poolt esitab terminitena andmeelementide nimetused (pealkirjad). Andmeelement võib olla tähistatud selle sisu väljendava inimloetava sõna või fraasiga, aga selleks võib olla ka akronüüm, lühend või muu sõne või tähis, mis on masinloetav ega pole lisaselgituseta mõistetav. Andmesõnastiku terminid seotakse vahetult andmee lemendiga.6 Iga kirjeldatav andmeelement seotakse ühe andmesõnastiku terminiga. Andmekirjelduse mõttes vähemtähtsateks andmeteks võib üldjuhul lugeda süsteemi logi, andmebaasi kirjete loomise ja muutmise kuupäevi, failide räsisid ja muud tehnilist tugiinfot, mis ei ole otseselt seotud organisatsiooni põhiülesannete täitmise käigus andmete töötlemise, andmepõhise juhtimise või andmevahetuse eesmärkidega.7 Seesuguste andmeelementide kohta ei ole vaja andmesõnastiku terminit moodustada. Klassifikaatorite ja koodiloenditega seotud andmeelemendid tuleks kirjeldada. Igale andmeelemendile vastava andmesõnastiku termini kohta kirjeldatakse üks või mitu ärisõnastiku mõiste(t). 3.2 Andmesõnastiku termini sisuline kirjeldamine Järgnevalt on esitatud andmesõnastikes olevate terminite praktilise kirjeldamise soovitused
koos ärimõistetega sidumisega. • Kirjeldama asudes toetu andmekogu põhimääruses , metoodikadokumentides jm ametlikes dokumentides kasutatud sõnavarale. • Andmesõnastiku termin peaks olema andmeelemendi konteksti võimalikult täpselt avav, vajaduse korral mitmest sõnast koosnev liittermin või terminifraas. N äiteks: müüdud kütuse kogus , sportlasestipendiumi saaja ees - ja perekonnanimi , spordiobjekti riietusruumide arv . • Ajaga seotud terminid soovitame sõnastada võimalikult täpselt, et terminist selguks, kas tegu on näiteks aasta, kuupäeva ja/või kellaajaga. Näiteks: orienteerumiskaardi esmase kasutuselevõtu aasta , treenerikutse kehtivuse alguskuupäev , vanglasse saabumise kuupäev ja kellaaeg . • Andmesõnastiku terminid soovitame võimalikult detailselt lahti kirjutada, n äiteks: e-posti aadress (mitte e-post), veebilehe aadress (mitte veebileht). • Andmesõnastiku termin seotakse mõistega , mis on kõige lähemal andmete kontekstile ja näitab, kelle või mille kohta on andmed. Kontekste võib olla mitu (vt ka ärimõistete sisulise kirjeldamise alateemat).

6 Andmekirjelduse juhis. Lisa 1: Andmekirjelduse standard. Ver 3.0 (Statistikaamet, 2024) 7 Andmekirjelduse juhis. Ver 2.0 (Statistikaamet, 2023)

13 3.3 Termini sõnastuse ühtlustamine, täiendamine ja täpsustamine Andmesõnastiku termini sõnastust ühtlustatakse alljärgnevatel juhtudel. • Andmeelemendi kirjeldus ei ava konteksti, n äiteks andmeelement on kõrgus ning pole täpsustatud, kelle/mille kõrgus. • Andmesõnastiku terminit täiendatakse, kui dokumentatsioonist selgub termini sisu täpsustav või täiendav kontekst . Näiteks: andmeelemendist esindusõiguse kehtivuse algus moodustatakse andmesõnastiku termin spordiorganisatsiooni esindaja
esindusõiguse kehtivuse alguskuupäev . • Andmekoosseisu kirjelduse või asutuse/andmekogu dokumentatsiooni põhjal võib kindlalt järeldada, et andmeelemendi nimetus ei väljenda selle korrektset sisu . Näiteks:
andmeelement kõrgus tähistab hoopis keskmist kõrgust; konteksti keskmine kõrgus siiski edasi ei anna, seega tuleb andmesõnastiku terminiks sel juhul kirjeldada puistu keskmine kõrgus. • Andmesõnastiku terminit võib vajaduse korral lühendada, kui: o andmeelement sisaldab õigusaktist või vormist tulenevat konteksti ; näiteks andmeelemendi ankeeti iseloomustav tunnus pangakonto number puhul piisab terminist pangakonto number ; andmete päritolu vormi, milleks on ankeet, andmesõnastiku terminis ei ole vaja täpsustada; o andmeelement sisaldab lisatäpsustust andmete kohta ; näiteks andmeelemendi kirjeldus on ettevõtte müügi andmed : müüdud kauba kogus . Sellisel juhul võib kirjeldada andmesõnastiku termini lühemaks, piisab liitterminist müüdud kauba kogus. 3.4 Andmesõnastiku termini vormistamine Andmesõnastiku terminite kirjelduselemendid põhinevad andmekirjelduse standardil .8
Andmesõnastiku terminikirje koosneb alltoodud kirjelduselementidest. Andmesõnastiku termini kirjelduselement TERMIN
• Termin kirjutatakse väikese algustähega, välja arvatud juhul, kui algustähereegel nõuab suure algustähe kasutamist. • Andmesõnastiku termin sõnastatakse ainult eesti keeles, seevastu ärimõisted nii eesti kui inglise keeles. • Andmesõnastiku termini kirjeldamisel välditakse kõrvallauseid, pikkades terminifraasides võib selle erinevad osad eristada mõttekriipsuga.
• Üldjuhul terminis mõõtühikut ei kirjelda ta. Kui see on RIHA andmeobjekti kommentaaris olemas, siis on soovitatav see sinna alles jätta. N äiteks kui RIHA andmeobjekt (sellele vastab siinse andmekirjelduse juhise kontekstis andmeelement) on fossiilse kütuse kasvuhoonegaaside (KHG) mahukus (gCO2ekv/MJ) , siis temaga seotud

8 Andmekirjelduse juhis. Lisa 1: Andmekirjelduse standard. Ver 3.0 (Statistikaamet, 2024).

14 andmesõnastiku termin on samuti fossiilse kütuse kasvuhoonegaaside (KHG) mahukus (gCO2ekv/MJ) .
• Kirjavahemärkidest kasutatakse pikkades terminifraasides ainult mõttekriipsu ja vajaduse korral ka koma; ei kasutata lauselõpumärke ega muid kirjavahemärke, nagu n äiteks hüüumärk, küsimärk, kaldkriips, koolon, mõttepunktid jt (? . ! / : …). Ümarsulge soovitame vältida, kuid see ei ole alati võimalik. • Lühendatud sõnad kirjutatakse terminis üldjuhul lahti (n äiteks number, tänav, kuupäev, aasta). • Terminis võib kasutada üldtuntud või andmekogu oskuskeeles käibel olevaid akronüüme, nt EPS-põld, MAH, ÜRO, EHAK, EMTAK . Akronüümide kasutamisel peaks alati lähtuma asutuses käibel olevast oskussõnavarast. Soovitatav on akronüümid, mis ei ole üldtuntud, ärisõnastikus või andmesõnastiku termini määratluses lahti kirjutada. Andmesõnastiku termini kirjelduselement MÄÄRATLUS
• Termini määratlus algab väikese algustähega ning on ilma lõpupunktita . Kui terminit kirjeldav selgitus koosneb täislause(te)st, siis kirjutatakse need suure algustähe ja punktiga lause lõpus. • Lühendatud sõnad kirjutatakse lahti (näiteks number, tänav, kuupäev, aasta, telefoninumber, miljon, miljard). • Üldlevinud akronüüme võib andmesõnastiku määratlustes kasutada (n äiteks KOV, EHAK, ÜRO, EU, NATO). • Enamasti ei võeta termini määratlust üldsõnastikust (nt EMS, Esterm), sest andmekogu kontekstis võib andmete tähendus erineda üldlevinud määratlustest. • Kui on olemas Eesti standard, milles termin on määratletud, tuleb eelistada seda määratlust.
Andmesõnastiku termini kirjelduselement MÄRK USED
• Mõiste märkused kirjutatakse suure algustähe ja lauselõpupunktiga. • Üldlevinud akronüüme võib andmesõnastiku märkustes kasutada, nt KOV, EHAK, ÜRO.

15 4 Näited

Ärimõistete sisulise kirjeldamise näited Näited 1–3. Mõiste moodustamine. Mõiste moodustatakse andmesõnastiku termini sellest osast, mis on kõige lähemal andmete kontekstile ja näitab, kelle või mille kohta on andmed. Näiteks pangaandmete puhul on andmesõnastiku terminite panga kood ja panga nimi mõisteks pank (tabel 1). Mõiste seotakse andmesõnastiku terminitega. Ärisõnastikku lisatakse ka mõisted pangatehing ja arveldus. Isikuandmete puhul on andmesõnastiku termini isiku e-maili aadress mõisteks isik ja kontaktandmed. Mõlemad mõisted seotakse andmesõnastiku terminiga (tabel 1). Välismaalase andmete puhul on andmesõnastiku termini välismaalase isikukood või muu identifitseeriv kood mõisteks välismaalane. Mõiste seotakse andmesõnastiku terminiga (tabel 1). Tabel 1. Ärisõnastiku mõisted ja andmesõnastiku terminid Näite jrk nr Andmesõnastiku terminiga seotud ärisõnastiku mõiste(d) Andmesõnastiku termin 1 pank taotluse kohta tehtud makseotsuse arvelduse pangatehinguga seotud panga kood taotluse kohta tehtud makseotsuse arvelduse pangatehinguga seotud panga nimi 2 isik; kontaktandmed isiku e-maili aadress 3 välismaalane välismaalase isikukood või muu identifitseeriv kood

Näited 4–8. Mõiste moodustatakse andmesõnastiku termini sellest osast, mis näitab, kelle või mille kohta on andmed (tabel 2). Tabel 2. Ärisõnastiku mõisted ja andmesõnastiku terminid Näite jrk nr Andmesõnastiku terminiga seotud ärisõnastiku mõiste(d) Andmesõnastiku termin 4 käibemaks arve käibemaksu summa 5 arve arve summa käibemaksuta 6 müügitulu ettevõtte müügitulu suurus 7 töövõime eksperdiarvamus töövõime hindamise kohta 8 eksperdiarvamus eksperdiarvamuse andmise kuupäev

Näited 9-11. Mõistetevahelised seosed – hierarhiline suhe. Mõistete vahel kehtib hierarhiline suhe, kui kitsam mõiste mahub täielikult laiemasse mõistesse. Laiema mõiste lisamisel soovitame kontrollida, kas töötab all-and-some test. Näiteks kõik mitterahalised kohustised on kohustised, mõned kohustised on mitterahalised kohutised. Seega kohustis on mitterahalise kohustise laiem mõiste (tabel 3).

Page 1 of 2