40 Mõiste on teadmusüksus. (ISO 25964)
MÕISTE Termin on sõna või fraas, mis mõistet kokkuleppeliselt väljendab ning viitab ka selle mõistega haaratud objektidele. (Kasak) Termin ehk oskussõna on mingi valdkonna üldmõiste sõnaline tähis. (ISO 1087) Termin ehk oskussõna on sõna või fraas, millega mõistet nimetatakse. (ISO 25964)
Joonisel 19 on ISO 1087 standardile toetuv käsitlus keele ja tegelikkuse seostest mõistete, terminite ja nende tähistega.
Joonis 19. Tegelikkuse ja keele seos mõiste ja terminiga (ISO 1087)
Standard esitab arusaama, kuidas tegelikkus, teadmus ja suuline või mõtlemisel kasutatav
keel on seotud kirjaliku keelega ning rangema terminoloogiaga. Tegelikkuse objektide
nimetamise
ja
tähistamise
kokkuleppe
rangus
või
varieeruvus
on
valdkonniti
ja
kasutuskontekstiti erinev.
TEGELIKKUS – objekt ja tunnused
Me tajume või tunnetame tegelikkust. Näiteks näeme puud ja metsa. Seda, et puu on puu
ja mets on mets, teame, sest keel on meie mõtlemise instrument. Tavakeeles ei ole mõisteline
mõtlemine täpne, mis tähendab, et erinevad inimesed võivad puuks või metsaks nimetada
erinevaid objekte. Kui tegu on üldteada nähtustega, siis see probleeme ei tekita, kuid kui on tegu
objektidega, mille sisu me väga täpselt ei tea, siis ainult nimetamisest nähtuse selgitamiseks ei
aita. Paljude kaupade puhul ei pruugi me teada, millega on tegemist, sest näiteks kreemvõib olla
nii kosmeetikatoode kui toidukaup.
Puud võib põõsast eristada teaduslikult või tavaarusaama järgi, kuid mõlemal juhul on
olemas teatavad tunnused, mis seda määravad. Selline liikide määramine on mitme
41
teadusharu keskne teema. Näiteks on puutaim põõsast väiksemgi ja hapram, aga ometi teame,
et kord saab sellest puu, aga põõsast ei kunagi. Sellised määravad tunnused on mõiste
piiritlemise jaoks olulised ning need esitatakse määratlustes.
TEADMUS – mõiste, tähis, termin, määratlus
Mõisted on teadmusüksused ja neid moodustab ühene tunnuste kombinatsioon. Kuulsast
süllogismist, et inimene on surelik, järeldub küll, et kõik inimesed on surelikud, aga mitte see, et
teisi surelikke liike pole. Järelikult ei ole surelikkus inimest määrav tunnus ehk poeetiliselt inimese
määratlus.
Erialakeeltes, mis taotlevad mõistete mahu täpset määratlemist tunnuste kombinatsioonist
lähtuvalt, on mõistete defineerimine oluline. Definitsioonid ehk määratlused võivad olla nii
valdkondlikud kui ka üldised. Erilised on veel legaaldefinitsioonid, mis sageli annavad määratluse
kindla õigusakti piires ehk tähenduses. Mõisteid saab tähistada sõnadega ja muude tähistega ,
näiteks vesi ja H 2O. Mõistete kokkuleppelist tähistamist sõnadega või ka muude tähistega
nimetatakse terminitega tähistamiseks. Termin pea b arvestama mõiste mahtu, mis tuleneb
tunnustest.
Et andmete kirjeldamiseks valitud sõnad ei oleks juhuslikud, vaid kokkuleppelised , samas
laialt, kuid ühtmoodi arusaadavad, tuleb sõnadena kasutada termineid. Andmekirjelduste
koostamisel on nii mõisted kui terminid kokkulepped, et just täpselt nii me seda asja nimetamegi.
See kokkulepe võib olla üldine keelealane kokkulepe, kus me ühes keeleruumis teame enam -
vähem täpselt mõne sõna tähendust. Näiteks on selline teada tähendus sõnadel sünd ja vesi. Sel
juhul ei tehta neid kokkuleppeid kirjeldades. Sageli t uleb aga kirjeldamisega koos teha
terminitööd ehk otsustada, milline on mõiste tähistamiseks kasutatav eelistermin.
Andmekirjeldustes puututakse kokku ka tähistamise probleemidega. Kui tegu on ühest sõnast
koosneva terminiga , siis on tähistamine selge, aga mõnel juhul on kasutusel lühendid või
akronüümid, mis võivad teisel juhul olla keelatud. Kui termin ei ole ühesõnaline ega isegi mitte
liigierisust väljendav liitsõna, võib see olla terminifraas, mis annab mõiste edasi kits amas või
laiemas kasutuskontekstis.
2.3.2 Andmekirjelduses kasutatavad sõnastikud Sõnastike kasutamine andmekirjelduses aitab kaasa kirjelduse ühetaolisusele ja arusaadavusele ning on eelduseks kirjelduse masin töödeldavusele, arvestades semantikat ja hõlbustab andmeteaduse meetodite rakendamis t. Seetõttu ongi selle s juhises käsitletud andmete mõistetavaks tegemist sõnastike abil. Sõnastik võib olla esitatud (1) lihtsa terminiloendina või koos sõnaseletustega, mis määratlevad need terminid mõne valdkonna jaoks; (2) taksonoomiana või tesaurusena, kus mõisted on liigitatud hierarhilistesse või sisu-mahu seostesse ja need võivad olla varustatud sõnaseletustega või määratlustega; (3) ontoloogiana, mis liigitab valdkonna teadmusüksused klassidesse ning esitab nendevahelised seosed ja nende omadused/tunnused masintöödeldaval kujul. Masintöödeldavate ontoloogiate koostamine või nende tuletamine sõnastike koostamist vahele jättes ei ole Eestis osutunud edukaks lähenemiseks semantilise koostalitlusvõime edendamisele. Praktiline sõnastike koostamise juhis on esitatud eraldi dokumendina lisas 2. Andmekirjelduse koostamisel ja haldamisel kasutatakse kolme tüüpi sõnastikke: • ärisõnastik (business glossary)
42 • andmesõnastik (data dictionary) • märksõnastik (controlled vocabulary), mis on kas üldine või valdkondlik Joonisel 20 on seletatud, mida andmekirjelduse kontekstis on mõistetud (1) andmesõnastiku, (2) ärisõnastiku ja (3) valdkonna märksõnastiku all.
Joonis 20. Andmekirjelduse ja ärimõistete sõnastike üldine mudel Valdkonna märksõnastik on märksõnade korrastatud loetelu, kus esitatakse valdkonna terminite ja nende seoste kirjeldused. Valdkonna märksõnastikud on kasutusel valdkonda hõlmavate teadmiste ja mõistete piiritlemiseks ning nende kokkuleppeliste seletuste esitamiseks. Valdkonna märksõnastikke kasutatakse ühe terminite allikana ä risõnastike loomisel ning andmestike kirjeldamisel. Andmestiku kirjeldamiseks kasutatakse valdkonna sõnastikust ja ärisõnastikust võetud märksõnu, mis seovad andmestiku organisatsiooni tegevuste ja teenustega. Eestis on olemas ka valdkondadeülene üldine märksõnastik (EMS). See on kõiki ainevaldkondi hõlmav tesauruse struktuuriga märksõnastik, mida seni on rakendatud peamiselt raamatute, artiklite ja muude teavikute eestikeelseks märksõnastamiseks ja infootsinguks. Kuna selle 61 000 terminit on jaotatud kuuekümneks valdkonnaks, sobib see kasutamiseks ka valdkondliku sõnastikuna või selle loomise alusena. EMS sisaldab ajamärksõnu ja kohanimesid, kuid ei sisalda isikute, asutuste ega organisatsioonide nimesid. EMS t oetab masinalt-masinale- päringuid MARCXML-vormingus. Valdkondlikud märksõnastikud võivad olla esitatud ka klassifikaatoritena, näiteks valitsemisfunktsioonide klassifikaator (VFK) või majanduse tegevusalade klassifikaator (EMTAK/NACE), õiguse valdkondi esitava taksonoomiana, näiteks EuroVoc või muu taolise valdkondliku jaotusena.
43 Valdkondade erialasõnavara sisaldavad sõnastikud ei pruugi olla otseselt märksõnastikud, vaid võivad olla terministandardid või mitmekeelsed tesaurused Oluline on see, et neis kokku lepitud terminid ja mõisted on ärisõnastikus kasutatavad. Ärisõnastik on organisatsioonis või organisatsioonideüleselt kokku lepitud sõnavara ehk mõistete ja terminite kogum, milles asutus igapäevaselt räägib või mis on kasutusel õigusaktides ja asutuse dokumentatsioonis. Sõnastik esitab organisatsiooni tegevuste ja andmete kohta piisavalt täieliku sõnavara, sisaldades nii üldistavaid kui ka detailsemaid mõisteid. Ärisõnastikke võib asutusel olla üks või mitu; nendes sisalduvad mõisted-terminid võivad pärineda nii valdkonna sõnastikest kui ka üldisest märksõnastik ust. Ärisõnastik määratleb ka organisatsiooni tegevusega seotud mõisted. Ärisõnastik on reeglina tesauruse struktuuriga sõnastik, mis võimaldab näidata mõistetevahelisi seoseid. Ärisõnastiku kaudu saavad andmestikes sisalduvad andmed endale konteksti ja andmeobjektid tähenduse. Ärisõnastiku mõistete kaudu on võimalik andmed ja nende kasutamine siduda organisatsiooni tööprotsesside ja teenustega. Ärisõnastiku koostab ja seda haldab organisatsiooni äripool ja selle kasutusala on üldjuhul laiem kui üksnes andmekirjelduse toetamine. Andmesõnastik on ühelt poolt terminite loetelu ning teiselt poolt esitab terminitena andmeelementide sisu. Andmeelement võib olla tähistatud selle sisu väljendava inimloetava sõna või fraasiga, aga selleks võib olla ka akronüüm, lühend või muu sõne või tähis, mis on masinloetav ega pole lisaselgituseta mõistetav. Andmesõnastiku terminid seotakse vahetult andmeelemendiga. Andmeelemendil on tähis ja üldjuhul ka kirjeldus, andmesõnastiku terminil on nimetus ja määratlus. Andmesõnastik on ka andmemudelis kasuta tavate andmeobjektide ja andmeelementide kirjelduste loetelu ja teisest küljest andmekirjelduse käigus tekkiv terminiloend. Andmesõnastik kirjeldab andmeid mõistetena vastavalt nende semantika le andmestikes. Andmesõnastik sisaldab ka andmete kasutamiseks vajalikke metaandmeid , näiteks konkreetse andmeelemendi andmetüüpi, lisaks võib sisaldada ka muid metaandmeid, nt juurdepääsupiiranguid. Andmesõnastiku koostamiseks vajalik sisu saadakse enamasti andmebaasi füüsilisest mudelist ja seotakse ärisõnastiku terminitega.
2.4 Tervikkirjeldus
Terviklik andmekirjeldus moodustub kolme kirjeld atava komponendi üheskoos või seostatuna
kirjeldamisel. Seosed on nii struktuursed kui ka mõistelis -terminoloogilised. Nendeks
komponentideks on joonisel 21 esitatud osad : (1) andmestiku kui terviku kirjeldus ehk
üldkirjeldus ja sellega kirjelduse sisu mõttes lähedane andmestruktuuri ehk andmeobjekti
kirjeldus; (2) andmeelemen di detail ne kirjeldus ning (3) äri sõnastiku ja andmesõnastiku
koostamine.
44
Joonis 21. Tervikliku andmekirjelduse komponendid Tervikliku andmekirjelduse koostamisel tuleb silmas pidada nii põhimõtteid ja praktilist vajadust, mida on kirjeldatud peatükis 2.1.1, kui ka korralduslikku külge, mida on kirjeldatud peatükis 3.1. Sellist asja nagu lõplikult valmis tervikkirjeldus ei ole olemas. Mingi osa kirjeldusest on tavaliselt töös. Ometi on mõned osad kirjelduses stabiilsemad kui teised. Stabiilsemad on andmestiku üldkirjeldused, samuti on suhteliselt stabiilne ka ärisõnastik. Kuna need mõlemad annavad üldise ülevaate tervest organisatsioonist, esimene andmestike tasandil, teine sõnavarana, siis moodustavad need selgroo, millele pidavalt muutuvad andmed saavad toetuda. Seega on andmestike üldkirjelduse koostamise ja haldamise vahend ehk andmekataloog tervikkirjelduse koostamisel ja haldamisel hädavajalik. Andmestiku kirjelduse aluseks olev rahvusvaheline standard „Andmekataloogi sõnastik“ („Data Catalog Vocabulary“, DCAT) toetab sellise kataloogi koostamist. Tervikkirjeldus koostatakse ka iga kirjeldatava objekti kohta. Kohustuslikud ja soovituslikud kirjelduselemendid on toodud andmekirjelduse standardis (Lisa 1). Sõnastikud on ühenduslülid andmete struktuursete osade ja andmeelemendi kirjeldamise vahel. Sõnastikevaheline infovahetus on esitatud joonisel 22, kus on välja toodud andmestiku ja andmeelemendi kirjelduste seosed sõnastikega. Andmesõnastik on andmestiku füüsilise mudeli (andmeelementide) ja ärisõnastiku ühenduslüli, sarnanedes loogilisele andmemudelile, ainult ilma mudelile omaste seosteta. Andmesõnastik sisaldab sarnaselt ärisõnastikuga termineid, mis osalt pärinevadki ärisõnastikust, kuid ärisõnastikus on ka laiemaid mõisteid tähistavad terminid. Ärisõnastikust või valdkonna märksõnastikust pärinevad ka andmestiku kirjeldamisel kasutatavad märksõnad.
45
Joonis 22. Sõnastikevahelise infovahetuse mudel andmekirjelduses
Andmete tervikkirjeldus toetab andmehaldust nii sisuliselt kui ka tehniliselt .
46 3 Andmekirjelduse koostamise korraldamine 3.1 Üldist Andmekirjelduse koostamine ei tohi olla ühekordne tegevus . O luline on, et asutuses o leks andmekirjelduse haldamine juurutatud kui järjepidev protsess, mille tunnusteks on selgelt määratletud rollid ja ülesanded ning mille korraldust ja eesmärgipärasust pidevalt mõõdetakse ja hinnatakse. Andmekirjeldused ei koosta ennast ise, vaid seda tuleb korraldada! Töökorralduslikus vaates on andmekirjelduste koostamine andmehalduse osa ning seotud ka organisatsiooni teiste tegevustega, infohalduse mõttes nii põhi - kui ka tugifunktsioonidega. Kui aga vaadata andmehaldust kui teenust, on andmekirjelduste koostamine ja haldamine osaks sellest teenusest või iseseisev teenus. Andmehalduse juhiste esimeses versioonis (2020) on eraldi andmehalduse raamistiku dokument, mis esitab nii riigi kui organisatsiooni tasandil rollidest ja protsessidest koosneva mudeli ning annab selle rakendamise põhimõtted. Selles on pööratud süstemaatil iselt tähelepanu andmehalduse korraldamisele. Viimase paari aasta jooksul on andmehalduse sisulised tegevused muutunud märksa konkreetsemaks ning just andmekirjelduste koostamine on olnud esmajärjekorras korraldatav töö. Konkretiseerunud on andmekirjelduse töövahendi soovitud funktsionaalsused ning võimalikud teenused – nii organisatsiooni sees kui ka väljapoole suunatud teenused, nagu andmete avaldamine avaandmetena. Joonisel 23 on esitatud andmehalduse kui organisatsiooni ühe tegevuse seos muude tegevustega, andmehalduse alategevused, sh andmekirjelduste ko ostamine ja haldus, ning andmehalduse seos muude tegevustega, kasutades selleks andmehalduse töövahendeid (infosüsteeme, rakendusi) ja pakutavaid teenuseid.
Joonis 23. Andmehalduse ja andmekirjelduste seos organisatsiooni muude tegevusega Andmekirjeldused ei koosta ennast ise, vaid seda tuleb korraldada! Andmekirjelduse haldamise korraldus on organisatsioonis hästi tööle saadud siis, kui:
47 • organisatsioon tunnetab ja tunnistab andmekirjelduse süsteemse haldamise tulemusena paranenud andmete kvaliteeti: • andmekirjeldus on kooskõlas valdkonna ja vastavate rahvusvaheliste standarditega ja toetab tõhusat andmevahetust; • andmekirjeldus on hallatud ning andmekirjeldused ja andmestikud andmekirjelduse töövahendi kaudu ülesleitavad ning neist on võimalik tuvastada andmete tähendus; • andmekirjelduse kvaliteeti jälgitakse ja parendatakse pidevalt; • andmekirjelduse muutmine ja täiendamine järgib kokkulepitud protsessi, mis on tervikliku andmehalduse raamistiku osa.
Selles peatükis vaatamegi lähemalt, millega peavad organisatsioonid arvestama andmekirjelduse koostamise ja hilisema haldamise korraldamisel. Täpsemalt vaatame kahte tegevuste tsüklit: 1) andmekirjelduse haldamise üldised tegevused ning 2) andmekirjelduse koostamise ja pideva täiendamise praktilised toimingud. Esimene neist tagab organisatsiooni valmiduse andmekirjelduse kestvaks parendamiseks ja taaskasutamiseks, teine keskendub kvaliteetse andmekirjelduse koostamisele. Lisaks peavad andmekirjeldused olema kasutatavad organisatsiooni igapäevatöös ja toetama seda ning neid peab saama edastada infosüsteemide vahel. Andmekirjelduse koostamise ja halduse tegevused on üldistatult esitatud joonisel 24. Sellel on andmekirjeldustega tehtav töö seotud andmehaldusega ja üldisemalt organisatsiooni tegevusega. Joonisel on täpsemalt näidatud korralduslikud tegevused, samal ajal kui andmekirjelduste koostamise ja haldamise igapäevane töö on esitatud üldiselt.
Joonis 24. Andmekirjelduse haldamise tegevused
Kirjeldatavate andmestike ja teiste varade (objektide) väljaselgitamine ja piiritlemine. 2. Organisatsiooni jaoks sobivate varem koostatud ja kasutusel olevate sõnastike kaardistamine. Nende hulgas on ka üldised märksõnastikud. 3. Organisatsiooni jaoks sobiva andmekirjelduse mudeli ja haldamise raamistiku määratlemine.
48 4. Rollide määratlemine andmekirjelduse koostamisel ja haldamisel. 5. Andmekirjelduse koostamine, mille hulgas on nii esmane koostamine kui ka hilisem täiendamine ja muutmine ning mi s hõlmab endas andmestike (objektide) üldist kirjeldamist, andmeelementide jms detailset kirjeldamist, sh sõnastike koostamist. Seda tehakse võimaluse korral andmekirjelduse töövahendiga. 6. Andmekirjelduse kasutamine töös ja selle toetamine ehk nende töötajate juhendamine, kes seda vajavad ning andmekirjelduse (metaandmete) edastamine ja avaldamine . Viimased tegevused on sageli osaliselt või täielikult automatiseeritud.
3.2 Andmekirjelduse objektide piiritlemine
Andmekirjelduse koostamise esimeseks eelduseks on asutuse andmetest ülevaate omamine.
Nagu on näidatud peatükis 2.2 „Andmed ja andmestikud “, on andmeobjektidena võimalik
määratleda ning seega ka halduse alla võtta erinevaid andmehulki Järgnevalt on selles juhise
versioonis järgitud algset arusaama, et andmestike piiritlemine käib koos andmete olulisuse ehk
väärtuse määratlemisega. Tuleb aga nentida, et praegu puudub süstemaatiline käsitlus andmete
väärtusest. Viimastel aastatel on traditsioonilise info- ja arhiivihalduse väärtuse käsitluse kõrvale
tulnud veel väärtuslike andmestike kontseptsioon. Esimest neist reguleeri b arhiivseadus.39
Väärtuslike andmestike käsitlus tuleneb Euroopa Liidu direktiivist avaandmete ja avaliku sektori
valduses oleva teabe taaskasutamise kohta 40 ning on esitatud avaliku teabe seaduses. 41 Selle
kohaselt on kehtestatud väärtuslike andmestike valdkonnad.42 Nagu näha, ei piiritle see õigusakt
mitte objekte, vaid valdkondi, kuid objektide piiritlemi st käsitleb avaliku teabe seadus. Objektiks
on andmekogu.
Asutuste töö s ongi seni kõige olulisemaks andmekogude kirjeldamine. Kuid kuna
andmekogu ise on õiguslik konstruktsioon, siis praktikas on vaja langetada piiritlevaid otsuseid.
Näiteks on igati õige piiritleda kirjeldatava objektina terve andmekogu või infosüsteem, kuid
samavõrd õige on ka piiritleda objektina mõni selle osa. Statistikaametis näiteks andmekogusid
ei ole, kuid on palju ja väärtuslikke andmestikke, mis on osalt arhiiviväärtuslikud. Seega
andmekogu kui objekti pole, kuid metaandmete süsteemi ja andmearhitektuuri skeemide abil
saadud ülevaade andmetest võimaldab, saada ülevaade ja luua piiritletud andmestike käsitlus,
mida siis hallata. Halduse jaoks saab kasutada ka andmekataloogi. Üldistatult on
andmekirjelduse objektide piiritlemise ga seotud tegevused ning andmestike sisu kirjeldamine
esitatud joonisel 25.
39 Arhiiviseadus § 2 Dokument ja arhivaal. Lõige 2) Arhivaal on dokument, millele avalik arhiiv on hindamise tulemusena andnud arhiiviväärtuse 40 Euroopa Parlamendi ja nõukogu direktiivi (EL) 2019/1024 avaandmete ja avaliku sektori valduses oleva teabe taaskasutamise kohta (ELT L 172, 26.06.2019, lk 56–83) 41 Avaliku teabe seadus § 41 Väärtuslikud andmestikud 42 Väärtuslike andmestike temaatiliste kategooriate nimekiri : 1. Georuumilised andmed, 2. Maa seire ja keskkond, 3. Meteoroloogiateave, 4. Statistika, 5. Äriühingud ja äriühingu omandisuhted, 6. Liikuvus (ELT L 172, 26.06.2019, lk 56–83)
49
Joonis 25. Andmekirjelduse objektide piiritlemise tegevused Andmekirjelduse täpsemaks piiritlemiseks kaardistatakse valitud andmekogus sisalduvad komponendid (andmebaasid, tabelid, andmeelemendid). Organisatsioonis on erineva olulisuse, taaskasutus- ja säilitusväärtusega andmeid. Ranget terminoloogiat kasutamata võib öelda, et need on eri kujul ja infosüsteemides. O sa on teabehalduse-, osa dokumen dihalduse ja osa eri infosüsteemides, mille alla tuleb siin mõiste relatsiooniliste andmebaasis peale loodud rakendusi. Andmete tähendust seletavas peatükis 2.2.1 näitasime, et andmed ei ole üheselt määratletavad. Ühelt poolt hallatakse põhitegevuse jaoks vajalikke andmeid, mi s on aluseks organisatsiooni toim imisele ning mille korralik haldamine tagab läbipaistvuse ja usaldusväärsuse. Teisalt leidub tihti ka veebilehti, sisemisi mitteametlikke dokumente või ürituste fotosid, mis on olulised info jagamise või organisatsioonikultuuri mõttes, kuid mitte andmete t aaskasutus- ja säilitusväärtuse laiemas vaates. Andmekirjelduse objektide piiritlemisel tuleb arvestada sellega, et teave, info ja andmed on läbi põimunud, ning lähtuda praktilistest eesmärkidest, millest tähtsaimad on info / andmete leitavus ja taaskasutatavus. Kõikide andmete haldamine, sealhulgas põhjalik kirjeldamine, ei ole organisatsiooni ressurssi silmas pidades alati mõistlik. Samuti on terve andmemassiivi haldamine üldjuhul üle jõu käiv ülesanne. Seetõttu on andmekirjeldamiseks valmistumise esimeses etapis oluline saada ülevaade sisuliselt kokku kuuluvatest andme test ehk teha selgeks, mis on and meobjektid ja andmestikud. Seejärel määrata, milliste andmete/ andmekogumite/andmehulkade/andmete kogumite kirjeldamine on organisatsiooni jaoks kõige olulisem. Konkreetsete a ndmete olulisus sõltub suurel määral iga neid haldava organisatsiooni tegevusvaldkonnast ja ülesannetest. Seega on olulisuse määramiseks raske välja tuua täpseid ja universaalseid reegleid. Küll on olemas mõningad üldised põhimõtted, millest saab juhinduda. • Andmete taaskasutus. Andmed on kasutamiseks ja taaskasutamiseks ning mida rohkem on andmete taaskasutusest huvitatud sisemisi või välimisi kliente, seda mõistlikum on neid andmeid põhjaliku andmekirjeldusega varustada. • Põhitegevused vs. tugitegevused. Üldjuhul on organisatsiooni põhitegevuse käigus tekkinud andmetel oluliselt suurem väärtus kui tugitegevuste käigus tekkinud andmetel. • Info hinnatav väärtus. See väljendub säilitustähtajas ning on omistatud tõestus - või infoväärtust arvesse võttes aastates või arhiiviväärtusena alatiselt. Tõestus - ja infoväärtus määratakse taaskasutusvajaduse põhjal ning seda tehakse organisatsiooni tegevuste ja nende tegevusete fikseerimise ehk dokumenteerimise analüüsi tulemusena. Olulisuse järgi grupeeritud andmed tuleb omakorda defineerida selgepiiriliste andmestikena. Kirjeldamiseks defineeritakse andmestik, mis on piisavalt suur, et selles sisalduv info oleks täielik ja terviklik, samas piisavalt väike, et andmekirjelduste haldamine oleks organisatsioonile kasulik ja andmehaldurile mõistliku aja jooksul jõukohane. Alati pole andmestiku piiritlemisel ühte ja ainsat õiget lahendust. Näiteks ehitisregistrit on võimalik