kadi_kilgi_msc_2022.pdf

Type: Document | Status: ready

Joonis 4: ROC-kõvera näide logistilise regressioon mudeli korral kujutatud kõver jõuaks üles vasakule nurka. Sellisel juhul oleks nii tundlikkus kui ka spetsiifilisus võrdsed ühega. Joonisel 4 kujutatud kõver ei suuda perfektselt klasse eristada, kuid on parem kui juhuslik klassifitseerimine. Lisaks ROC-kõverale kasutatakse lävendi leidmiseks ka teisi mõõdikuid, nt precision-recall kõverat. Lävendi valimine oleneb ülesandest ja sellest, kumb viga on kallim. 1.8.2 Valikumeetod Järgnev alapeatükk põhineb allikal Provost (2000), kui ei ole märgitud teisiti. Teine meetod on andmete töötlemine enne mudeldamist. Võimalus on klasside jao- tused võrdsustada ülevaliku (upsampling) ja alavaliku (downsampling) abil. Lisaks on võimalik lisada treeningandmetele kaalud, mida arvestatakse mudeli treenimisel. 25

Valimi muutmise eesmärk on tehislikult viia uuritavad klassid tasakaalu. Alava- liku korral jäetakse mingi hulk enamusklassi vaatluseid kõrvale. Ülevaliku korral paljundatakse olemasolevaid vähemusklassi vaatluseid. Nende meetodite miinus on see, et alavaliku korral kaotatakse mingi osa informatsiooni ja ülevaliku puhul ei lisata andmestikku uut informatsiooni. Vaatlustele lisatud kaale kasutavad erinevad meetodid erinevalt. Otsustusmet- sa korral, kasutades funtsiooni ranger, on võimalik määrata kaks parameetrit: class.weights ja case.weights. Esimese korral antakse klassidele kaalud, mida kasuta- takse vahetippude defineerimisel. Lisaks kasutatakse klassifitseerimismetsa treeni- misel kaale lehetipus prognoosi leidmisel ehk arvutatakse kaalutud enamus (weigh- ted majority vote). Klassidele saab lisada kaale klassifitseerimis- või tõenäosus- metsa treenimisel. Teine parameeter on vaatluste kaalud, mida kasutatakse bootst- rap-meetodiga valimite koostamisel. Suurema kaaluga vaatlused võetakse suurema tõenäosusega valimisse. (Wright, Wager ja Probst, 2021) 26

2 Andmed Järgnevas peatükis antakse ülevaade riskipatsientide valimi moodustamisest ning analüüsi jaoks kasutatud andmetest. Andmete töötlus teostatakse rakendustarkva- raga R ning kasutatakse paketti tidyverse (Wickham et al., 2019). 2.1 Riskipatsiendid Eesti Haigekassa ja Maailmapank viisid 2015. aastal läbi uuringu "Ravi terviklik käsitlus ja osapoolte koostöö Eesti tervishoiusüsteemis", mille käigus keskendu- ti krooniliste haigustega patsientidele ning nende haiguste ennetusele ja ravitee- konnale (Eesti Haigekassa ja Maailmapanga Grupp, 2015). Uuringu jätkuna viidi aastatel 2016–2017 Eestis läbi ravi juhtimise pilootprojekt (Maailmapanga Grupp, 2017). Uuringuga leiti, et statsionaarses aktiivravis on palju välditavaid juhtumeid ning toodi välja, et neid hospitaliseerimisi on võimalik vältida perearsti ennetavate tegevustega. Lisaks väideti, et üks oluline välditavate hospitaliseerimiste allikas on mitmete krooniliste haigustega patsiendid, kes ei käi piisavalt sageli arstlikul jälgi- misel, mistõttu nende krooniline haigus võib ägeneda ja viia haiglaravi vajaduseni. Selliseid patsiente nimetatakse riskipatsientideks. Antud töö eesmärk on luua riski- patsientidele hospitaliseerimise riski mudel. Soov on, et mudel prognoosiks eelmise aasta raviarvete andmete põhjal, kas patsiendil on risk järgmisel aastal väldita- vaks hospitaliseerimiseks. Leitava mudeliga soovitakse riskipatsiendid jagada krii- tilisteks ja vähem kriitilisteks juhtumiteks. Antud töö raames loetakse välditavaks hospitaliseerimiseks sellist haiglaravi juhtu, mis ei ole põhjustatud nakkushaigu- sest, kasvajast, rasedusest, sünnitusest ega sünnitusjärgsest perioodist, vigasdusest ega muust õnnetusest (RHK-10 koodide vahemikud A00–D89, O00–P96, S00–T98, samuti ei tohi hospitaliseerimisel olla välispõhjust, aga lubatud on ravimitest põh- justatud välispõhjused (RHK-10 koodide vahemikud Y40–Y84)). Käesoleva töö käigus mõeldakse hospitaliseerimise all eelnevalt kirjeldatud välditavaid hospitali- 27

seerimise juhtumeid. Antud analüüsiks kasutatakse valdavalt Eesti Haigekassa andmebaasis leiduvaid andmeid. Kasutades Maailmapanga raportis (Maailmapanga Grupp, 2017) too- dud riskipatsientide väljasõelumise algoritmi, moodustatakse riskipatsientide va- lim järgnevalt. Esmalt võetakse vaatluse alla kõik isikud, kellel esines perioodil 01.01.2017–31.12.2018 põhi- või kaasuva diagnoosina1 • hüpertensioon (I10–I15), • hüperlipideemia (E78) või • diabeet (E11–E14). Seejärel vaadeldakse perioodil 01.01.2015–01.01.2016 isikuid, kes ei sattunud eel- misse nimekirja, kuid kellel esines põhi- või kaasuva diagnoosina hüpertensioon, hü- perlipideemia või diabeet. Nendest võetakse vaatluse alla patsiendid, kellele perioo- dil 01.01.2017–31.12.2018 ei esitatud rohkem kui 4 perearstiarvet. See tähendab, et kõrvale jäetakse patsiendid, kes olid juba perearsti jälgimise all. Hetkel valimisse kuuluvatest isikutest jäetakse kõrvale need, kellel perioodil 01.07.– 31.12.2018 diagnoositi vähk (need patsiendid on tõenäoliselt juba arstliku jälgimise all). Lisaks jäetakse kõrvale patsiendid, kellel samal perioodil diagnoositi skisof- reenia, neerupuudulikkus ja kes käivad dialüüsil, kaasasündinud väärarendid või harvaesinevad haigused. Veel jäetakse kõrvale isikud, kellel sel perioodil diagnoosi- ti kaasuvana 7 või enam haigust järgnevatest: aneemia, kilpnäärme haigusseisund, rasvumus, krooniline südamepuudulikkus jt (vt lisa 1). Seejärel jäetakse vaatluse alla ainult need patsiendid, kellel esineb vähemalt üks diagnoos järgnevatest:

  1. peaaju transitoorse isheemia atakid ja selle sarnased sündroomid (G45), 1Diagnoosid ja nende koodid vastavad Rahvusvahelise Haiguste Klassifikatsiooni 10. versioonile (RHK-10). 28

  2. südame isheemiatõved (I20–I25),

  3. kodade virvendus ja laperdus (I48),

  4. kõrgvererõhkhaigused (I11.0, I13.0, I13.2) või muud südamehaigused (I50.0, I50.1, I50.9),

  5. alumiste hingamisteede kroonilised haigused (J40–J47), kuid ei esine rohkem kui kaks diagnoosi 1.–4. seast. Viimasena jäetakse kõrvale isikud, kellel esineb rohkem kui 1 vaimse häire diagnoosi (vt lisa 2). Lõplikkusse valimisse kaasatakse isikud, kes olid elus 31.12.2018 seisuga ning kes 2018. aasta alguse seisuga olid vanemad kui 25 eluaastat. Valimi moodustamise kriteeriumid on valitud põhimõttel, et riskipatsientide hulka jääks kroonilise haigusega patsien- did, kelle puhul ravisekkumine võib tuua tervisele kasu ning kellest teavitamine on perearstile seetõttu vajalik. 2.2 Tunnused Mudeli välja töötamiseks võetakse valimisse sattunud patsientide kohta andmed raviarvetelt ja retseptidelt, mis esitati 2018. aasta jooksul. Kasutatud andmed kir- jeldavad patsiendi terviseseisundit hetkeks 31.12.2018. Andmed hospitaliseerimiste kohta võetakse aastast 2019. Uuritav tunnus kirjeldab, kas aastal 2019 toimus hos- pitaliseerimist või mitte. Terviseseisundit kirjeldatakse erinevate tunnustega.

  6. Üldised andmed: Vanus, Sugu.

  7. Elukohta iseloomustavad tunnused: • kaugus_m – elukoha kaugus meetrites lähimast haiglast, • ElabYksi – binaarne tunnus, kas patsient elab üksi, • vaesus – suhtelise vaesuse määr elukoha maakonnas aastal 2018. 29

  8. Haiglas veedetud voodipäevade arv: • VoodipäeviOendusabi – raviarved teenusetüübiga 18 (Eesti Haigekassa, 2021, alapeatükk 1.5.5), • VoodipäeviTaastusravi – raviarved teenusetüübiga 15, • VoodipäeviIntensiivravi – raviarved teenustega (Riigikantselei ja Jus- tiitsministeerium, 2022a) 2070, 2071, 2072 või 2073, • VoodipäeviMuu – voodipäevade arv, mis ei ole seotud õendusabi, taas- tusravi ega intensiivraviga, • Voodipäevi – voodipäevade arv kokku.

  9. Operatsioonide arv raviarvetel: • Operatsioone – tervishoiuteenuste arv liigiga Operaatsioonid, • Operatsioon1kuni3h – NCSP2 koodiga ZXE10 (Tervise ja Heaolu Info- süsteemide Keskus, 2022) kirurgilise protseduuri kordade arv, • OperatsioonHingamiselunditel – kirurgiliste protseduuride kordade arv, mille NCSP kood algab tähega "G", , • OperatsioonErakorraline – NCSP koodiga ZXD00 kirurgilise protseduu- ri kordade arv.

  10. Esitatud raviarvete arv: • ValtimatuAbiArveid – raviarved, mis on märgitud vältimatuks, • ArveidTeenuseTyyp2 – statsionaarne abi, • ArveidTeenuseTyyp15 – statsionaarne taastusravi, • ArveidTeenuseTyyp16 – ambulatoorne taastusravi, • ArveidTeenuseTyyp18 – iseseisev stastionaarne õendusabi, 2NOMESCO kirurgiliste protseduuride klassifikatsioon. 30

• ArveidTeenuseTyyp20 – koduõenduse, • AmbArveidPerearst – perearsti poolt kirjutatud ambulatoorsed raviar- ved, • AmbArveidEriarst – eriarsti poolt kirjutatud ambulatoorsed raviarved, • EMOvisiit – erakorralise meditsiini raviarvete arv, • sots_seisund – raviarvete arv, millele on märgitud teenused 9142, 3026 või 3027 (vt lisa 3). 6. Raviteenuste arv arvetel kokku: • Raviteenus66100, Raviteenus66101, Raviteenus66102 jt (vt lisa 3). 7. Määratud diagnoosid põhi- või kaasuva haigusena: • Diagnoos krooniline südamepuudulikkus, Diagnoos astma, Diagnoos äre- vushäire jt (vt lisa 1) – binaarne tunnus, kas esineb diagnoos, • DiagnoosiGrArv – diagnooside arv kokku, 8. Väljakirjutatud retseptid: • RetsepteKokku – retseptide arv kokku, • RetseptideHindKokku – retseptide hind kokku, • OmaosalusKokku – omaosalus kokku, • ValjaOstetudRetsepte – retseptide arv staatusega "müüdud", • KirjutatudRetsepteA01, KirjutatudRetsepteA02, KirjutatudRetsepteA03 jt (vt lisa 4) – välja kirjutatud retseptide arv toimeaine ATC (2. taseme) koodi kaupa (Ravimiamet, 2022). 9. Patsiendi kindlustusliik (Eesti Haigekassa, 2022a): 31

• KindlustuseLiikTootu – binaarne tunnus, kas omab üht kindlustust loe- telust: töötu abiraha saav isik, töötuskindlustushüvitise saaja, töötu koolitus, töötu tööpraktika, tööharjutuses osaleja, töötu, • KindlustuseLiikVanaduspensionar – binaarne tunnus, kas omab üht kindlustust loetelust: vanaduspensonär, Eesti pensionär teises EL liik- mesriigis, välislepingu alusel kindlustatud pensionär, Vene Föderatsioo- ni sõjaväepensionär, EL pensionär, pensionär, • KindlustuseLiikSotsiaaltoetuseSaaja – binaarne tunnus, kas omab üht kindlustust loetelust: sotsiaaltoetust saav isik, toitjakaotuspensionär, • KindlustuseLiikToovometu – binaarne tunnus, kas omab üht kindlus- tust loetelust: töövõimetuspensionär, osalise või puuduva töövõimega isik, • KindlustuseLiikMuu – binaarne tunnus, kas omab kindlustust, mis ei kuulu eelnevate kindlustuste hulka. 10. PerearstiKvaliteediSkoorI_II – perearsti kvaliteedisüsteemi (Eesti Haigekas- sa, 2022b) alusel patsiendi perearstile määratud punktid aastal 2017. Tunnuse kaugus_m leidmiseks kasutatakse Maa-ameti Geoportaali (Maa-amet, 2021). Lähim haigla leitakse haiglate loetellu (Riigikantselei ja Justiitsministee- rium, 2022b) kuuluvate haiglate seast3. Suhtelise vaesuse määr põhineb Statisti- kaameti andmetel (Statistikaamet, 2022). Eesti Haigekassa loeb vältimatuks abiks tervishoiuteenust, mille edasilükkamine või andmata jätmine võib põhjustada abi- vajaja surma või püsiva tervisekahjustuse (Eesti Haigekassa, 2022c). 2.3 Andmete töötlus Huvipakkuvaid tunnuseid tuli kokku 213 ning riskipatsiente sattus valimisse 97 717. Esmalt otsitakse üles tunnused, mis on omavahel väga tugevalt korreleeritud. Sel- 3Välja arvatud SA Haapsalu Neuroloogiline Rehabilitatsioonikeskus. 32

gub, et tugevalt on seotud ArveidTeenuseTyyp15 ja VoodipaeviTaastusravi, Ar- veidTeenuseTyyp18 ja VoodipaeviOendusabi ning RetsepteKokku ja ValjaOstetud- Retsepte. Nende paaride korral moodustatakse uued tunnused:

  1. Arve_VPT tähistab arvete arvu voodipäeva kohta taastusravil,

  2. Arve_VP_OA tähistab arvete arvu voodipäeva kohta õendusabis. Tunnused leitakse voodipäevade arvu jagamisel arvete arvuga ning ümar- damisel täisarvuks.

  3. Valja Ostmata tähistab välja ostmata retseptide osakaalu. Tunnus leitakse: 1 −Valja Ostetud Retsepte Retsepte Kokku . Tunnuseid uurides selgub, et tunnust Raviteenus66138 ei esine ühelgi patsiendil ning seega jäetakse see kõrvale. Lisaks leidub tunnuseid, mida on vähe esindatud (vaatlusi alla 1 000). Sellised tunnused otsustatakse analüüsist välja jätta: Operat- sioon Hingamiselunditel, Kindlustuse Liik Sotsiaaltoetuse Saaja, Diagnoos ainete sõltuvus, Diagnoos alkoholi kuritarvitamine, Diagnoos kõne ja keele spetsiifilised arenguhäired, Diagnoos hüpotensioon, ja Diagnoos söömishäired. Veel jäeti kõrva- le kirjutatud retseptid toimeainetega V01, V03, V07, B02, B05, H01, H04, J02, J04, S02, M09, N01, R02, R05, R07 ja T01 ning raviteenused 66114, 66115, 66116, 66119, 66120, 66121, 66122, 66124, 66125, 66126, 66128, 66130, 66131, 66132, 66133, 66136, 66139 ja 9117. Vähe esindatud retseptide seast leitakse sarnase toimeainega grupid, mis liidetakse omavahel kokku, et tekitada uued tunnused:

  4. Kirjutatud Retsepte A tähistab retseptide arvu toimeainetega A01, A04, A05, A07, A08, A09, A12, A14 ja A16.

  5. Kirjutatud Retsepte D tähistab retseptide arvu toimeainetega D02, D03, D04, D05, D08, D10 ja D11.

  6. Kirjutatud Retsepte G tähistab retseptide arvu toimeainetega G01 ja G02. 33

  7. Kirjutatud Retsepte L tähistab retseptide arvu toimeainetega L01, L02, L03 ja L04.

  8. Kirjutatud Retsepte P tähistab retseptide arvu toimeainetega P01, P02 ja P03. Enamik tunnuseid andmetes on diskreetsed tunnused. Neid lähemalt uurides sel- gub, et enamik vaatlustest on väärtusega "0" ning teistest suuremate väärtustega tasemetel esineb üksikuid vaatluseid. Teistest erinevate tasemete korral otsustatak- se tunnuse väärtused lõigata tasemeni, mida kirjeldab üle 1 000 vaatluse. Tunnuste teisendamise käigus muudetakse mõned diskreetsed tunnused binaarseks. Näiteks tunnust Operatsioon 1 kuni 3h ei esine 97%-il vaatlustest. Väärtus "1" esineb 3 106 inimesel ning kõigest 287 isikul on väärtus suurem ühest. Seega tunnus Operatsioon 1 kuni 3h muudetakse binaarseks tunnuseks ehk kas patsiendile tehti vastav kirur- giline protseduur vaatlusperioodi jooksul või mitte. Tunnuste puhul, millel on rohkem kui kaks piisavalt kirjeldatud taset, koondatakse viimase kirjeldava tasemeni (vähemalt 1 000 vaatlust). Näiteks tunnuse Operat- sioone puhul on väärtusega "1" 8 716 vaatlust, väärtusega "2" 2 217 vaatlust ning rohkem kui kahe operatsiooniga 361 vaatlust. Teisendamise käigus koonda- takse rohkem kui kahe operatsiooniga vaatlused tasemele "2". Teisendatakse kõik tunnused, millel esineb vähe kirjeldatud suuri tasemeid (vt lisa 5). Mõned tunnused muudetakse ka kategooriliseks. Joonisel 5 võib näha, et tunnuse Kirjutatud Retsepte C03 korral kirjutatakse retsepti välja rohkem väärtustega "3", "6", "9", "12". Tunnuse jaotuse põhjal otsustatakse muuta tunnus kategooriliseks võttes üheks kategooriaks vahemiku 1 kuni 3, 4 kuni 6 jne. Sarnast käitumist nähak- se ka C01, C07, C08, C09, C10 toimeainetega retseptide puhul. Andmeid uurides jääb veel silma voodipäevade arvu kirjeldavad tunnused, millel on vähestel nullist erinev väärtus ning nullist suuremad väärtused ei ole täisarvud. Seetõttu otsusta- takse tunnused muuta kategooriliseks. Lisaks muudetakse kategooriliseks ka uued 34

Joonis 5: Tunnuse Kirjutatud Retsepte C03 nullist suuremate väärtuste jao- tus tunnused Arve_VPT ja Arve_VP_OA. (vt lisa 6) Pidevatest tunnustest korrigeeritakse tunnuste Retseptide Hind Kokku ja Omaosa- lus Kokku jaotuseid. Tunnuse Retseptide Hind Kokku korral jääb silma, et pooled vaatlustest on väärtusega kuni 263,84. Samal ajal maksimaalne võimalik väärtus on rohkem kui 70 000. Samuti nähakse sarnast käitumist ka tunnuse Omaosalus Kokku puhul, kus leidub üksikuid väga suuri vaatlusi. Mõlema tunnuse puhul koondatakse väga suured väärtused väiksema tasemeni. Tunnuse Retseptide Hind Kokku puhul lõigatakse tunnused tasemeni 3 000 ja tunnuse Omaosalus Kokku korral tasemeni 700. 2.4 Andmete kirjeldus Peale tunnuste töötlust jääb alles 146 kirjeldavat tunnust. Valimisse kuuluvatest 97 717 riskipatsiendist 39% mehed ning 61% naised. Riskipatsiendi keskmine va- nus on 69 eluaastat. Samal ajal valimisse sattunud naiste keskmine vanus on 71,7 35

eluaastat ja meestel65,4 eluaastat. Valimisse kuuluvatest isikutest75%-il on kind- lustuse liikVanaduspensionär. Tabel 3: Andmete kokkuvõte Sugu Hospitaliseerimine Juhtumeid Osakaal Keskmine aastal 2019 vanus Naine Ei 50 768 (52%) 71 ,3 Naine Jah 8 627 (9%) 73 ,9 Mees Ei 31 830 (33%) 64 ,8 Mees Jah 6 492 (6%) 67 ,9 Joonis 6: Kaugus lähimast haiglast Tabelist 3 võib näha, et nii naiste kui ka meeste puhul on hospitaliseeritute seas keskmine vanus kõrgem kui mittehospitaliseeritutel. Samuti jääb silma, et riskipat- sientidest meeste keskmine vanus on madalam kui naistel. Hospitaliseerimisi esineb 15%-il riskipatsientidest ning meeste hulgas on hospitaliseeritute osakaal suurem. Riskipatsientidest elab lähim 54 meetri kaugusel lähimast haiglast ning kõige kau- gem asub 70 kilomeetri kaugusel. Jooniselt 6 on näha, et ligikaudu pooled riski- 36 patsientidest elavad kuni 5 kilomeetri kaugusel. Riskipatsiendi elukoha keskmine kaugus lähimast haiglast on 10,3 kilomeetrit. Joonis 7: Hospitaliseeritute osakaal erineva diagnooside arvuga patsientide seas Joonisel 7 on toodud määratud huvipakkuvate diagnooside (vt lisa 1) arv kok- ku. Enamikule patsientidele on määratud 1 kuni 4 diagnoosi. Patsientidele, kellele on määratud 8 diagnoosi, on perioodil 01.01.2017–31.06.2018 diagnoositud vähk. Graafikult on näha, et diagnooside arvu kasvades suureneb ka hospitaliseeritute osakaal. Seitsme diagnoosi korral on hospitaliseeritute osakaal 28%. Kõige rohkem on riskipatsientidele vaatlusperioodil määratud diagnoosi krooniline südamepuudu- likkus (46%), südame isheemiatõved (30%) ja kodade virvendus ja laperdus (23%). Kõige vähem esineb somatoformseid häireid ja soole divertiikul- ehk sopististõbi. Retseptidest on kõige rohkem välja kirjutatud retsepte toimeaine kategooriaga C, mis tähistab kardiovaskulaarsüsteemi ravimeid. Vaatlusajal ei ole 2%-le riskipat- sientidest välja kirjutatud ühtegi retsepti. Vähemalt üks raviteenus on osutatud 87%-ile patsientidest. Riskipatsientide perearstid on 2017. aastal saanud keskmise 37