13
2 Metoodika aruandluskoormuse vähendamiseks Kirjeldame kahte meetodit – veerevat disaini ja kahe hetke disaini. Vaatleme nende rakendust antud töös koos modifikatsioonidega. Koos modifikatsioonidega on vaatluse all 4 meetodit. Aruandluses on huvipakkuvateks parameetriteks enamasti kogusummad. Seega keskendutakse töös kogusumma hindamisele. Vaatleme erinevaid käsitlusi vajavaid kogusummasid, mis nõua- vad või ei nõua unikaalsete isikute väljaselgitamist:
- isikute arv, mis ei tohi sisaldada korduseid;
- täidetud ametikohtade arv (lepinguline, tegelik ja ülekoormus);
- vanuse kogusumma, mida kasutatakse keskmise vanuse leidmiseks ja mis ei tohi sisalda
isikute korduseid.
2.1 Veereva disaini teoreetiline taust
Veerev valikudisain (i.k. rolling sampl ing) tähendab 𝑘 erineva (mittekattuva) perioodilise
valimi moodustamist, millest igaüks on tõenäosuslik valim üldkogumist osakaaluga 𝑓 =
1
𝐹 (𝐹
on perioodide arv), nii et 𝑘 perioodi kumuleerimisel saadakse kogu üldkogumi valim osakaalu-
ga 𝑓 =
𝑘
𝐹. Kui 𝑘 = 𝐹, saadakse kogu üldkogum [4].
Veerevat disaini on rakendatud loenduste korral, kus ka loendusaastate vahepeal on vaja
rahvastikunäitajaid hinnata [4]. Näiteks olgu loendustel 10 -aastane tsükkel. Eeldame, et
käesolevale aastale eelneva aasta 𝑖 (𝑖 = 0; 1; … ; 9) keskmine on 𝑦̅𝑖. Käesoleva aasta üldkeskmi- ne on 𝑦̅ = ∑ 𝑊9 𝑖=0 𝑖 𝑦̅𝑖, kus 𝑊𝑖 tähistab kaalu, mis on määratud kümnele aastale ja ∑ 𝑊9 𝑖=0 𝑖 = 1. Järgnevalt on võimalik koostada neli mudelit käesoleva aasta keskmise arvutamiseks [10]. Olgu vastavad keskmised: 𝑦̅𝑐, 𝑦̅𝑓, 𝑦̅𝑒 ja 𝑦̅𝑤.
- Loendusel (census) põhinev arvutamine: 𝑦̅𝑐 = 𝑦̅0, kus 𝑊0 = 1 ja ülejäänute 𝑖 > 0 korral 𝑊𝑖 = 0. See sarnane b praktikaga, kus kõik hinnangud baseeruvad samale aastale, millal toimus loendus.
- Viimasel (final) aastal põhinev arvutamine: 𝑦̅𝑓 = 𝑦̅9, kus 𝑊9 = 1 ja ülejäänud 𝑖 < 9 korral 𝑊𝑖 = 0. Seda saab kasutada üleriigiliste ja suurte piirkondade hinnangute puhul, kus aeg mõjutab hinnangute täpsust ja valimi maht on piisavalt suur. Se da saab kasutada näiteks epideemiate, aktsiahindade, tööpuuduse jm hindamisel, kus ebaregulaarsed kõikumised on iseloomulikumad kui stabiilsed muutused.
14
- Võrdsete kaaludega (e-equal) arvutamine: 𝑦̅𝑒 = ∑ 𝑊𝑖𝑦̅𝑖, kus 𝑊𝑖 = 0,1 iga 𝑖 korral. See sobib (suhteliselt) muutumatutes stabiilsetes olukordades. Sageli väidetakse, et sellist stabiilset mudelit on parem kasutada vananenud kümneaastaste loenduste asemel.
- Monotoonselt mittekahenevate kaaludega 𝑊𝑖 arvutamine: 𝑦̅𝑤 = ∑ 𝑊𝑖𝑦̅𝑖 (w-
weight), kus 𝑊0 ≤ 𝑊1 ≤ ⋯ ≤ 𝑊8 ≤ 𝑊9. Kasvukõvera t võib kindlaks määrata
mõni mudel, empiirilised andmed või nende kombinatsioon.
Keskmised 𝑦̅𝑓 ja 𝑦̅𝑒 on triviaalsed, aga nad on paremad kui 𝑦̅𝑐, sest kasutavad värskemaid andmeid. Samal ajal mingi monotonne kasvamine nagu 𝑊𝑖+1 = 𝑊𝑖 + 𝑘 (𝑘 > 0) või 𝑊𝑖+1 = 𝑐𝑊𝑖 (𝑐 > 1) võib olla parem kui 𝑊𝑖 = 0.1.
2.2 Veereva disaini rakendus antud töös Käesolevas magistritöös jagatakse üldkogum kaheks osaks, millest üks osa täidab aruandeid ühel ja teine teisel aastal. Seega perioodide arv 𝐹 = 2. Modifikatsioonina vaadeldakse võima- lust, kus teatud osa üldkogumist täidab aruandeid igal aastal. Üldkogumi jagamine ei ole juhus- lik, vaid toimub kindla algoritmi alusel, mida kirjeldatakse punktis 3.2. Eesmärk on saada kihti- desse võimalikult võrdsed töötajate arvud mõlemal aastal. Kihtideks on valitud TTO liigid
(haigla, perearstiabi, hambaravi jne). Arvestada tuleb siinjuures sellega, et üldkogum muutub igal aastal. Mõned tervishoiuteenuse osutajad lõpetavad tegevuse ja teised alustavad. Muutuse arvesse võtmist kirjeldatakse punktis 3.3. 2.2.1 Veerev disain 1 Selleks, et saada igal aastal hinnang ud üldkogumile, vaadatakse kahte aastat: vaadeldav ja eelnev. Mõlemal aastal on vaid osade objektide andmed, mis pannakse kokku üheks üldkogu- miks, mis koosneb kahest mittelõikuvast poolest. Olgu vaadeldava aasta pool 𝑈1 ja sellele eel- neva aasta pool 𝑈0. Tervishoiutöötajate arvu leidmiseks kasutame kahe kogusumma lineaar - kombinatsiooni. 𝑀̂ = 2(𝑤𝑜𝑡1,𝑑0−𝑢𝑛𝑖𝑘 + 𝑤1𝑡1,𝑑1−𝑢𝑛𝑖𝑘), (2.1) kus 𝑤0 on eelneva aasta kaal ja 𝑤1 vaadeldava aasta oma, 𝑤0 ≤ 𝑤1 ja 𝑤0 + 𝑤1 = 1. Kordaja 2 on proportsionaalsuse kordaja, sest sulgudes olev osa hindab kogusumma vaid poole üldkogumi jaoks. Esimese ja teise poole töötajate arvude kogusummad 𝑡1,𝑑0−𝑢𝑛𝑖𝑘 ja 𝑡1,𝑑1−𝑢𝑛𝑖𝑘 arvutatakse valemi (1.4) abil. Siin 𝑑0 ja 𝑑1 on osakogumeid defineerivad tingimused, kus 𝑑1 tähendab, et
15
antud isik esineb pool es 𝑈1 ja 𝑑0 tähendab, et isik esineb pooles 𝑈0, aga ei esine pooles 𝑈1.
Esimene indeks 1 kogusummades viitab sellele, et isikute arvu hindamisel on uuritav tunnus
𝑦 = 1.
Lisaks on meil vaadeldaval aastal küsitletud poolest teada selle tegelik isikute arv. Tähistame
selle 𝑀1. Siit saame hinnata, mitu isikut ei sattunud küsitletud poolde 𝑀̂0 = 𝑀̂ − 𝑀1. Nüüd saa-
me kasutada isikute arvu kaaludena teiste kogusummade arvutamisel:
𝑡̂𝑦 = 𝑀̂
𝑀̂0
𝑤0𝑡𝑦0 + 𝑀̂
𝑀1
𝑤1𝑡𝑦1, (2.2)
kus 𝑡𝑦0 on tunnuse 𝑦 kogusumma eelmises pooles ja 𝑡𝑦1 on tunnuse 𝑦 kogusumma vaadeldavas
pooles (valem (1.2)).
Vanuse kogusumma leitakse üle unikaalsete isikute. Seega selle hinnang avaldatakse valemiga
𝑡̂𝑣𝑎𝑛𝑢𝑠 = 𝑀̂
𝑀̂0
𝑤0𝑡𝑣𝑎𝑛𝑢𝑠0−𝑢𝑛𝑖𝑘 + 𝑀̂
𝑀1
𝑤1𝑡𝑣𝑎𝑛𝑢𝑠1−𝑢𝑛𝑖𝑘, (2.3)
kus 𝑡𝑣𝑎𝑛𝑢𝑠0−𝑢𝑛𝑖𝑘 ja 𝑡𝑣𝑎𝑛𝑢𝑠1−𝑢𝑛𝑖𝑘 on unikaalsete isikute vanuse kogusumma vastavalt eelmise ja
vaadeldava aasta pooles, mis arvutatakse valemiga (1.4).
2.2.2 Veerev disain 2
Eelmises peatükis rakendati veerevat disaini kogu üldkogumile. Järgnevalt vaatleme osalist
veerevat disaini, kus haiglad täidavad aruandeid iga-aastaselt, aga veerevat disaini rakendatakse
ülejäänud TTOdele ehk mittehaiglatele.
Haiglates töötavate unikaalsete tervishoiutöötajate arv 𝑀𝐻 leitakse osakogumi valemist (1.5),
kus osakogumit defineeriv tunnus d näitab, kas isik töötab haiglas. Haiglas mittetöötavate isiku-
te arvu 𝑀𝑀𝐻 leidmiseks lisatakse valemisse (2.1) tingimus, et antud isik ei tööta haiglas,
𝑀̂𝑀𝐻 = 2(𝑤𝑜𝑡1,𝑀𝐻−𝑑0−𝑢𝑛𝑖𝑘 + 𝑤1𝑡1,𝑀𝐻−𝑑1−𝑢𝑛𝑖𝑘), (2.4)
kus 𝑀𝐻 − 𝑑1 tähendab nende isikute osakogumit, kes esinevad pooles 𝑈1 ja ei tööta haiglas
ning 𝑑0 tähendab isikute osakogumit, kes esinevad pooles 𝑈0, aga ei esine pooles 𝑈1 ega tööta
haiglas.
Veereva disaini 2 korral on tervishoiutöötajate arvu hinnang,
𝑀̂ = 𝑀ℎ + 𝑀̂𝑀𝐻. (2.5)
Analoogiliselt leitakse ka koormuse kogusumma hinnang,
𝑡̂𝑦 = 𝑡𝑦𝐻 + 𝑡̂𝑦𝑀𝐻, (2.6)
16
kus 𝑡𝑦𝐻 on tunnuse 𝑦 kogusumma haiglates ja 𝑡̂𝑦𝑀𝐻 on tunnuse y kogusumma hinnang mitte- haiglates.
Viimane arvutatakse järgneva valemiga
𝑡̂𝑦𝑀𝐻 = 𝑀̂𝑀𝐻
𝑀̂0−𝑀𝐻
𝑤0𝑡𝑦𝑀𝐻−0 + 𝑀̂𝑀𝐻
𝑀1−𝑀𝐻
𝑤1𝑡𝑦𝑀𝐻−1, (2.7)
kus 𝑀1−𝑀𝐻 on mittehaiglates töötavate isikute arv vaadeldaval aastal ja 𝑀̂0−𝑀𝐻 = 𝑀̂𝑀𝐻 −
𝑀1−𝑀𝐻 on vastav hinnanguline arv eel neval aastal. Suurused 𝑡𝑦𝑀𝐻−1 ja 𝑡𝑦𝑀𝐻−0 on tunnuse 𝑦
kogusummad vastavalt vaadeldava ja sellele eelneva aasta pooles.
Vanuse kogusumma leitakse valemiga
𝑡̂𝑣𝑎𝑛𝑢𝑠 = 𝑡𝑣𝑎𝑛𝑢𝑠𝐻 + 𝑡̂𝑣𝑎𝑛𝑢𝑠𝑀𝐻, (2.8)
kus 𝑡𝑣𝑎𝑛𝑢𝑠𝐻 on haiglas töötavate unikaalsete isikute vanuse kogusumma ja 𝑡̂𝑣𝑎𝑛𝑢𝑠𝑀𝐻 on nende
unikaalsete isikute vanuse kogusumma hinnang, kes ei tööta haiglas.
2.3 Kahe hetke disaini teoreetiline taust
Kahe hetke disain ( Sampling on Two Occasions ) on kirjeldatud raamatus Model Assisted
Survey Sampling [5]. Kahe hetke disain on protsess, kus tõenäosuslikke valimeid võetakse
üldkogumist kahel erineval ajahetkel. Luba tud on valimite kattuvust. Kattuvas osas on samu
objekte küsitletud nii esimesel kui ka käesoleval hetkel. Eesmärk on käesoleva hetke kogu -
summa või keskmise hindamine. Kahe hetke valimid ei kata kogu üldkogumit. Töös kasutatud
tähistused on pärit allikast [5]:
𝑈 = {1, … , 𝑖, … , 𝑁} – üldkogum, kus 𝑁 on üldkogumi maht,
𝑧 – uuritav tunnus esimesel hetkel,
𝑦 – uuritav tunnus teisel hetkel,
𝑠𝑎 – esimese hetke valim,
𝑠𝑚 – kattuv (matched) valim, mis on võetud valimist 𝑠𝑎,
𝑠𝑢 – mittekattuv (unmatched) valim, mis on võetud täiendvalimist 𝑠𝑎
𝑐,
𝑠 = 𝑠𝑚 ∪ 𝑠𝑢 – teise hetke valim.
Olgu teise hetke väärtused 𝑦𝑘 sellised, et nad on hästi lähendatavad suurusega 𝑦𝑘
0 = 𝐾𝑧𝑘, kus
𝐾 on teatud konstant. 𝐾 leitakse varasemaid andmeid kasutades või antakse eksperdi poolt. Kat-
17
tuval valimil saame leida erinevuse 𝐷𝑘 = 𝑦𝑘 − 𝑦𝑘
0 , mille abil saame nihketa hinnang u teise
hetke kogusummale valimis 𝑠𝑎,
𝑡̂1 = 𝑡̂𝑦0𝑠𝑎 + 𝑡̂𝐷𝑠𝑚 , (2.9)
mis arvutatakse suuruse 𝑦𝑘
0 kogusumma hinnangu ja erinevuse 𝐷𝑘 kogusumma hinnangu abil.
Need hinnangud avaldatakse järgmiselt:
𝑡̂𝑦0𝑠𝑎 = ∑ 𝑦𝑘
0
π𝑎𝑘𝑠𝑎
,
𝑡̂𝐷𝑠𝑚 = ∑ 𝐷𝑘
π𝑎𝑘π𝑘│𝑠𝑎 𝑠𝑚
,
kus π𝑎𝑘 ja π𝑘│𝑠𝑎 on objekti k kaasamistõenäosused vastavalt valimitesse 𝑠𝑎, ja teisel hetkel vali-
misse 𝑠𝑚 tingimusel, et ollakse valimis 𝑠𝑎.
Teine nihketa hinnang praegusele kogusummale on 𝑦𝑘 kogusumma hinnang teisel hetkel, mis
saadakse mittekattuvast valimist,
𝑡̂2 = 𝑡̂𝑦𝑠𝑢 = ∑ 𝑦𝑘
π𝑎𝑘
𝑐 π𝑘|𝑠𝑎𝑐
𝑠𝑢
, (2.10)
kus π𝑎𝑘
𝑐 ja π𝑘|𝑠𝑎𝑐 on kaasamistõenäosused vastavalt esimese hetke täiendvalimisse 𝑠𝑎
𝑐, ja teisel
hetkel mittekattuvasse valimisse 𝑠𝑢 tingimusel, et ollakse esimese hetke täiendvalimis.
Kasutades nende lineaarset kombinatsiooni, saame uue nihketa hinnangu,
𝑡̂𝑦 = 𝑤1𝑡̂1 + 𝑤2𝑡̂2,
kus 𝑤1 ja 𝑤2 on mittenegatiivsed kaalud, nii et 𝑤1 + 𝑤2 = 1. Hinnangut 𝑡̂𝑦 nimetatakse liithin-
nanguks, kuna ta ühendab kattuva valimi ja mittekattuva valimi hinnangud.
2.4 Kahe hetke disaini rakendus antud töös
Käesolevas töös valiti kattuvaks osaks kõik haiglad, sest haiglates töötab suurem osa
tervishoiutöötajatest. Lisaks on teada, et haiglatel ei esine probleeme igal aastal andmeid esita-
da, kuna neil on selleks spetsiaalsed töötajad. Konstandi 𝐾 arvutamine haiglate põhjal võtab
arvesse iga-aastased muutused, aga ei võta arvesse väikeste TTOde muutusi . Mittekattuvad
osad esimesel ja teisel hetkel jagati 2 aasta vahel, kus tei se hetke valim on aasta, mille pära-
18
meetreid soovime leida ja esimese hetke valim on sellele eelnev aasta. Jagamine toimub samuti
nagu veereva disaini korral ja on välja kirjutatud peatükis 3.2.
Antud töös katavad esimese ja teise hetke valimid kogu üldkogumi. Tähistame
𝑈𝑎 – esimese hetke osa üldkogumist,
𝑈𝑚 – esimese ja teise hetke kattuv osa,
𝑈𝑢 – teise hetke mittekattuv osa üldkogumist. Eraldame nüüd esimese hetke mittekattuv a osa
𝑈𝑏 = 𝑈𝑎\ 𝑈𝑚.
Kogu üldkogumi saab esitada järgmiste lõikumatute osade ühendina 𝑈 = 𝑈𝑏 ∪ 𝑈𝑚 ∪ 𝑈𝑢. Edasi
vaatame kahte võimalust parameetrite hindamiseks.
2.4.1 Kahe hetke disain 1
Kirjutame välja teise hetke kogusumma:
𝑡𝑦 = ∑ 𝑦𝑘
𝑈
= ∑ 𝑦𝑘
𝑈𝑏
- ∑ 𝑦𝑘 𝑈𝑚
- ∑ 𝑦𝑘
𝑈𝑢
.
Siin on kaks viimast liidetavat teada ja on vaja hinnata ainult ∑ 𝑦𝑘𝑈𝑏 , mida saab teha 𝑦𝑘 0 ja 𝐾 abil. Antud hetke kogusumma hinnanguks on 𝑡̂𝑦 = ∑ 𝑦𝑘 0 𝑈𝑏 - ∑ 𝑦𝑘 𝑈𝑚
- ∑ 𝑦𝑘 𝑈𝑢 , (2.11) kus 𝑦𝑘 0 = 𝐾𝑧𝑘 ja 𝐾 hinnatakse kattuva osas võrrandist 𝑦𝑘 = 𝐾𝑧𝑘 järgmiselt: 𝑦𝑘 = 𝐾𝑧𝑘, ∀𝑘 ∈ 𝑈𝑚, ∑ 𝑦𝑘 𝑘∈𝑈𝑚 = ∑ 𝐾𝑧𝑘 = 𝐾 ∑ 𝑧𝑘, 𝑘∈𝑈𝑚𝑘∈𝑈𝑚
𝐾 =
∑ 𝑦𝑘𝑘∈𝑈𝑚
∑ 𝑧𝑘𝑘∈𝑈𝑚
.
Konstandi 𝐾 väärtused tunnustele, mis on vaadeldud nii töö raames kui ka mainitud lisas 2, on
välja toodud tabelis 4. Siin on kattuvaks osaks haiglate andmed. Tabelist nähtub, et paljude tun-
nuste korral on 𝐾 ühe lähedane. Tervishoiutöötajate arvu korral on 𝐾 alla 1,034, mis tähendab,
et haiglates töötavate isikute arv suureneb aastatega vähem kui 3,4%. Samuti suureneb aastatega
keskmine vanus, kuid mitte üle 3,5% . Tegelikult täidetud ametikoha puhul on 𝐾 ühele veel
lähedamal ja iga-aastane erinevus eelmisega ei ületa 2% ega lähe 2%-st madalamaks. Suuremad
19
aastased muutused on toimunud ülekoormusest tulenevate ametikohtade puhul, sest antud para-
meeter sõltub rohkem praegusest olukorrast kui eelmisest aastast.
Tabel 4. Kahe hetke disaini konstandi 𝐾 väärtus igale vaadeldud parameetrile aastati
Aasta
Tervishoiu-
töötajate arv
Täidetud ametikohad
tegeliku koormuse
põhjal
Täidetud ametikohad
tegeliku lepingulise
põhjal
Ülekoormusest
tulenevad
ametikohad
Keskmine
vanus
2014
1,0115
1,0223
1,0104
1,4001
1,0149
2015
1,0338
1,0076
0,9935
0,7577
1,0347
2016
1,0038
0,9818
0,9817
0,7472
1,0080
2017
1,0141
1,0057
1,0117
1,0371
1,0196
2018
1,0054
0,9950
1,0007
1,1140
1,0079
2.4.2 Kahe hetke disain 2
Rakendame peatükis 2.3 sisse toodud tähistusi
𝑈= 𝑈𝑎∪𝑈𝑎
𝑐 üldkogum teisel hetkel,
𝑈𝑎= 𝑈𝑏∪𝑈𝑚, kus 𝑈𝑚 on kattuv osa,
𝑈𝑎
𝑐= 𝑈𝑢 – mittekattuv osa.
Olgu
𝑁 – üldkogumi 𝑈 maht (ridade arv),
𝑁𝑎 – üldkogumi 𝑈𝑎 maht,
𝑁−𝑁𝑎 – üldkogumi 𝑈𝑎
𝑐 maht,
𝑁𝑚 – kattuva osa maht.
Kaasamistõenäosused on nüüd osakaalud:
π𝑎𝑘= 𝑁𝑎
𝑁; π𝑘│𝑠𝑎= π𝑘│𝑈𝑎 = 𝑁𝑚
𝑁𝑎
;
π𝑎𝑘
𝑐
= 𝑁−𝑁𝑎
𝑁
; π𝑘│𝑠𝑎𝑐 = π𝑘│𝑈𝑎𝑐 = 𝑁−𝑁𝑎
𝑁−𝑁𝑎
= 1.
Nüüd saame valemitest (2.9) ja (2.10) järgmised hinnangud:
𝑡̂1 = ∑
𝑦𝑘
0
𝑁𝑎𝑁
⁄
𝑈𝑎
- ∑𝑦𝑘−𝑦𝑘 0 𝑁𝑎 𝑁∙𝑁𝑚 𝑁𝑎 𝑈𝑚 =
20
= 𝑁 𝑁𝑎 ∑ 𝑦𝑘 0 𝑈𝑎
- 𝑁 𝑁𝑚 ∑(𝑦𝑘 − 𝑦𝑘 0 𝑈𝑚 ), 𝑡̂2 = ∑ 𝑦𝑘 𝑁−𝑁𝑎 𝑁 = 𝑈𝑢 𝑁 𝑁 − 𝑁𝑎 ∑ 𝑦𝑘. 𝑈𝑢
Arvestades, et 𝑈𝑎 = 𝑈𝑏 ∪ 𝑈𝑚 ja 𝑈𝑏, 𝑈𝑚 on lõikumatud ning 𝐾 = ∑ 𝑦𝑘𝑘∈𝑈𝑚 ∑ 𝑧𝑘𝑘∈𝑈𝑚 , saame 𝑡̂1 = 𝑁 𝑁𝑎 ∑ 𝐾 ∙ 𝑧𝑘 𝑈𝑎
- 𝑁 𝑁𝑚 ∑(𝑦𝑘 𝑈𝑚 − 𝐾 ∙ 𝑧𝑘) = = 𝑁 𝑁𝑎 ∑ 𝐾 ∙ 𝑧𝑘 𝑈𝑎 , millest 𝑡̂1 = 𝑁 𝑁𝑎 ∙ (∑ 𝐾𝑧𝑘 𝑈𝑏
∑ 𝑦𝑘𝑘∈𝑈𝑚 ∑ 𝑧𝑘𝑘∈𝑈𝑚 ∑ 𝑧𝑘 𝑈𝑚 ) = = 𝑁 𝑁𝑎 ∙ (∑ 𝐾𝑧𝑘 𝑈𝑏
- ∑ 𝑦𝑘 𝑘∈𝑈𝑚 ). Siin 𝑡̂1 on 𝑈𝑎 keskmine laiendatud üldkogumi 𝑈 peale ja 𝑡̂2 on 𝑈𝑢 keskmine laiendatud üld - kogumi peale. Liithinnang 𝑡̂𝑦 = 𝑤1𝑡̂1 + 𝑤2𝑡̂2 avaldub järgmiselt 𝑡̂𝑦 = 𝑤1 𝑁 𝑁𝑎 ∙ (∑ 𝐾𝑧𝑘 𝑈𝑏
- ∑ 𝑦𝑘 𝑘∈𝑈𝑚 ) + 𝑤2 𝑁 𝑁 − 𝑁𝑎 ∑ 𝑦𝑘. 𝑈𝑢 (2.12)
21
3 Ettevalmistus praktiliseks ülesandeks
Magistritöös on kasutatud tervishoiutöötajate andmed aastate 2013–2018 kohta. Neid kasutades
uurime, kui hästi väljapakutud meetodid lähendavad tegelikkust.
3.1 Kihtide moodustamine
Üldkogumi osadeks jagamisel kasutatakse kihte selleks , et tagada võimalikult sarnased osad
tervishoiuteenuse osutajate suhtes. Kuna aastate osad on struktuurilt sarnased, siis on ootus-
päraselt hinnangud aastate lõikes väiksema varieeruvusega. Üldkogum on TTOde suhtes jaga-
tud kihtideks järgmiselt: haiglad nende liikide järgi ja ülejäänud TTOd nende poolt osutavate
tervishoiuteenuste järgi. Siinjuures on ühendatud teenused „üldarst (va perearst)“ ja „muu“
nende väikese mahu pärast. Gruppi „muu“ kuuluvad mujal nimetamata asutused , mis omavad
tervishoiuteenuse osutamise tegevusluba, näiteks kaitsevägi ja koolitervishoid. Tervishoiu-
töötajate arv haigla liikide ja aastate lõikes on näha joonisel 1. Erihaiglad on sellised haiglad,
mis ei kuulu haiglavõrgu arengukava haiglate hulka ja kus tehtav töö on keskendunud mõnele
kitsamale erialale, nt sünnitusabi ja günekoloogia. Jooniselt on näha, et oluliselt rohkem tervis-
hoiutöötajaid on piirkondlikes, kesk- ja üldhaiglates. Ülejäänud haiglates on tervishoiutöötajate
arv alla tuhande.
Joonis 1. Tervishoiutöötajate arv haigla liikide ja aasta lõikes Mittehaiglad on jagatud TTO poolt osutavate teenuse liikide järgi. Joonisel 2 on näha, et erine- vate teenustega asutustes töötavate isikute arv ei ületa 2500.
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 2013 2014 2015 2016 2017 2018
22
Joonis 2.Tervishoiutöötajate arv TTO teenuse (v.a haiglad) ja aasta lõikes
3.2 Algoritm üldkogumi jagamiseks kaheks osaks
Aruandluse koormuse vähendamiseks jagati TTOde üldkogum kaheks osaks (kaheks pooleks).
Esimeses pooles olevatelt TTOdelt (asutustelt) küsiti aruandeid paaritutel aastatel (2013, 2015
jne) ja teises pooles olevatelt TTOdelt paarisaastatel (2014, 2016 jne). Jagamist rakendati igas
kihis eraldi.
Igas kihis olevatele asutustele arvutati TTO suurus ( näiteks tervishoiutöötajate arv), seejärel
järjestati TTOd selle põhjal.
Kihis ℎ rakendati järgmist jagamise algoritmi (algoritmi läbimisel on oluline järgida alltoodud
järjekorda):
0. Olgu kihis ℎ 𝑀ℎ asutust, mis on järjestatud TTO suuruse järgi. K ihi loend on
{1, 2, … , 𝑀ℎ}, kus TTO 𝑀ℎ on kihis suurim.
- Viimane asutus (suurim asutus) läheb 1. poolde.
- Kui ülejäänud asutuste töötajate kogusumma on väiksem kui viimase asutuse töötajate arv, siis kõik ülejäänud lähevad 2. pool de. Ja algoritm lõpeb. Vastasel juhul algoritm jätkub sammuga 3.
- Kui kihis on kuni 4 asutust, siis jagatakse asutused järgmiselt: esimene ja viimane lähevad 1. poolde ning ülejäänud 2. poolde. Ja algoritm lõpeb. Vastasel juhul algoritm jätkub sammuga 4. 0 500 1000 1500 2000 2500 3000 2013 2014 2015 2016 2017 2018
23
- Kui kihis on rohkem kui 4 asutust, siis esimene asutus läheb 1.poolde (nüüd esimene ja viimane on esimeses pooles, teised on jagamata).
- Teise poo lde lähevad tagantpoolt 𝑗 asutust (𝑀ℎ − 1), … , (𝑀ℎ − 𝑗), kus 𝑗 on suurim indeks, mille korral kehtib võrratus 𝑇öö𝑡𝑎𝑗𝑎𝑡𝑒𝐴𝑟𝑣1 + 𝑇öö𝑡𝑎𝑗𝑎𝑡𝑒𝐴𝑟𝑣𝑀ℎ ≥ ∑ 𝑇öö𝑡𝑎𝑗𝑎𝑡𝑒𝐴𝑟𝑣𝑀ℎ−𝑖 𝑗 𝑖=1 , kus 𝑇öö𝑡𝑎𝑗𝑎𝑡𝑒𝐴𝑟𝑣𝑖 on töötajate arv asutuses 𝑖.
- Teine asutus läheb 2. poolde.
- Asutus 3 ja (𝑀ℎ − (𝑗 − 1)) lähevad 1. poolde.
- Nüüd määrame asutustele indeksid 𝑁 ja 𝑘. Indeksi 𝑁 määramiseks vaatleme tagantpoolt asutusi, millele on juba pool määratud. Nendest tähistame indeksiga 𝑁 asutuse, mis on tagantpoolt viimane. Indeksi 𝑘 määramiseks vaatleme eespoolt asutusi, millele pole poolt määratud ning indeksiga 𝑘 tähistame nende hulgast esimese asutuse . Pärast 7. sammu 𝑁 = (𝑀ℎ − (𝑗 − 1)) ja 𝑘 = 4 .
- Nüüd 5. sammuga sarnaselt valitakse, kui paljud ülejäänud suurematest asutustest
lähevad teise poolde. Sinna lähevad asutused (𝑁 − 1), … , (𝑁 − 𝑗), kus 𝑗 on võimalikult
suur indeks mille korral kehtib (𝑁 − 𝑗) > 𝑘 ja
∑ 𝑇öö𝑡𝑎𝑗𝑎𝑡𝑒𝐴𝑟𝑣𝑖 𝑎𝑠𝑢𝑡𝑢𝑠 𝑖 𝑜𝑛 - 𝑝𝑜𝑜𝑙𝑒𝑠 ≥ ∑ 𝑇öö𝑡𝑎𝑗𝑎𝑡𝑒𝐴𝑟𝑣𝑖 𝑎𝑠𝑢𝑡𝑢𝑠 𝑖 𝑜𝑛
- 𝑝𝑜𝑜𝑙𝑒𝑠
- ∑ 𝑇öö𝑡𝑎𝑗𝑎𝑡𝑒𝐴𝑟𝑣𝑁−𝑖. 𝑗 𝑖=1
- Asutus 𝑘 läheb 2. poolde.
- Asutus 𝑘 + 1 ja (𝑁 − (𝑗 − 1)) lähevad 1. poolde.
- Algoritm korratakse puntist 8 kuni kõik asutused on jagatud.
Antud algoritm on realiseeritud tarkvaras R. Vastav kood on toodud Lisas 1.
3.3 Aastatega muutuv andmestik
Eespool kirjeldatud olukord sobib siis, kui üldkogum aastatega ei muutu. Praktikas aga toimu-
vad üldkogumis pidevad muutused. Aja jooksul tekivad uued TTOd ja mõned suletakse. Prakti-
kas kasutatakse nn tahapoole valikut (back samples), valides uued asutused mitte ainult praegu-
se, vaid ka eelneva valimi hulka [11].
Käesolevas magistritöös kasutati järgmist eeskirja uu te tervishoiuasutuste kaasamiseks vaadeldaval hetkel ja küsitlemisaasta määramiseks. Igal aastal kontrollitakse kõikide tervis- hoiuasutuste reaalset tegutsemist vaadeldaval aastal. Kui asutus tegutses, siis ta jääb üldkogu-
24
misse ja sellele varem määratud poolde. Kui asutus ei tegutsenud, siis uuendatud üldkogumist
asutus eemaldatakse, kuid enne määratakse kiht ja pool, kus asutus oli ning palju töötajad tal
oli eelmisel aastal. See aitab määrata uue asutuse asukohta pooltes.
Kui tulid juurde uued asutused, mida varem andmestikus polnud, siis nende kohta on teada
ainult kiht. Vaja on valida millisesse poolde nad lähevad. Olgu Uus uute asutuste arv, 𝐾1 ja 𝐾2
on vastavalt esimesest ja teisest poolest kustutatud asutuste arv ja 𝐾𝑇1 ja 𝐾𝑇2 on vastavalt esi-
mesest ja teisest poolest kustutatud asutuste suuruste kogusumma. Uute asutuste arv, mis lähe-
vad esimesse poolde (𝑈𝑢𝑠1) leitakse järgmiselt
𝑈𝑢𝑠1 = 𝑈𝑢𝑠 ∙ 1
2 ( 𝐾1
𝐾1 + 𝐾2 + 𝐾𝑇1
𝐾𝑇1 + 𝐾𝑇2 ).
Uute asutuste hulgast valitakse juhuslikult 𝑈𝑢𝑠1 asutust, mis lähevad 1. poolde ja ülejäänud
𝑈𝑢𝑠 − 𝑈𝑢𝑠1 asutust lähevad 2. poolde. Antud eeskirja rakendatakse igas kihis ja iga l aastal
eraldi.
3.4 Moodustatud valimite ülevaade
Rakendades peatükis 3.2 toodud algoritmi, on kõik asutused jagatud oma pooltesse, mida kirjel-
dab täpsemalt tabel 5. Käesolevas töös kasutati teadaolevaks baasiks (loendusandmeteks) 2013.
aasta andmeid. Eraldi vaadeldi kahte võimalust – kas jagada asutused töötajate või objektide
(isik-amet) arvu põhjal. Töötajad on unikaalsed, aga objektid on tabeli read, kus isik on kordu-
sega, kui ta on erineval ametikohal või erinevas asutuses. Mõlema jagamisviisi korral jäi asutus-
te arv kihtides samaks. Kihtides olevate asutuste arvud esimeses ja teises pooles on toodud tabe-
lis 5. Üldkokkuvõttes on esimeses pooles 665 ja teises 696 asutust. Võrreldes esimese ja teise
poole töötajate ning objektide arvusid tabelis 5, siis need on mõnevõrra erinevad. Aga kui
vaadata osakaalusid, siis nii esimese kui teise poole osakaal on ligikaudu 0,5. Näiteks on
erihaiglas esimese s pooles 215 ja teise s 225 töötajat, mis tähendab esimese poole osakaalu
215
215+225 ≈ 0,5 ja vastavalt ka teise poole osakaalu ≈ 0,5. Objekte on esimeses pooles 253 ja
teises 229, mistõttu esimese poole osakaal ja vastavalt ka teise poole oma on 0,5. Seega jagami-
se tulemus töötaja- ja objekti-põhiselt on sarnane.
Veereva disaini 2 ja kahe hetke disaini jaoks võeti kattuvaks osaks kõik haiglad (kihid 11 – 17),
pooled on antud juhul samad, mis hetked. Kattuval osal olevaid asutusi küsitletakse igal aastal.
Ülejäänud TTOd jagunesid nii nagu tabelis 5 alates kihist 20.
25
Tabel 5. Kihid kahe valimiga veereva disaini 1 korral
Kiht Kihi nimi
Kihi
maht
Esimeses
pooles
Teises
pooles
Esimese poole
asutuse töötajate
ja objektide arv
Teise poole
asutuse töötajate
ja objektide arv
11 Piirkondlik haigla
3
1
2
3533
3694
3451
3467
12 Keskhaigla
4
2
2
2665
2701
2223
2224
13 Üldhaigla
11
5
6
1760
1805
1452
1525
14 Taastusravihaigla
4
1
3
100
100
76
79
15 Õendushaigla
27
13
14
328
329
311
315
16 Erihaigla
10
5
5
251
253
228
229
17 Kohalik haigla
4
2
2
215
221
225
228
20 Perearstiabi
478
238
240
1103
1112
1101
1111
25 Eriarstiabi
238
117
121
814
822
815
823
30 Hambaravi
468
233
235
1117
1132
1116
1131
40 Kiirabi
5
2
3
360
363
324
325
50 Taastusravi
30
13
17
177
179
177
181
51 Diagnostika
15
3
12
83
83
83
83
53 Õendusabi
42
19
23
106
107
107
108
100 Ülejäänud (Muu ja
üldarst, v.a perearst)
22
11
11
177
177
164
165
Kokku 1361 665 696
13078
11994
Tabelis 6 näeme, kuidas kasutatud algoritmi tulemusel jaotusid TTOd pooleks maakonniti kahe erineva jagamise viisi korral. Väikesed muutused on toimunud sõltuvalt jagamisviisist. Näiteks Harjumaal jagunesid asutused samamoodi mõlema jagamisviisi korral, aga teiste maakondade puhul veidi erinevalt.