9
o Malnavas koledža (MK);
o LU Rīgas Medicīnas koledža (LU RMK);
o Daugavpils medicīnas koledža (DMK);
o Rīgas 1. medicīnas koledža (RMK1);
o J. Vītola Latvijas Mūzikas akadēmija (JVLMA);
o Latvijas Kultūras akadēmija (LKA);
o Latvijas Kultūras akadēmijas Latvijas Kultūras koledža (LKA LKK);
o Valsts Policijas koledža (VPK);
o RSU Sarkanā krusta medicīnas koledža (RSU SKMK);
o Rīgas Ekonomikas augstskola jeb Stokholmas Ekonomikas augstskola Rīgā (SSE Riga)
o Rīgas Starptautiskā ekonomikas un biznesa administrācijas augstskola (RISEBA).
CSP pieejami arī dati no Sociālās palīdzības administrēšanas informācijas sistēmas (SOPA) par personām,
kurām izmaksāti pašvaldību sociālie pabalsti. Informācija ir pieejama , sākot ar 2012. gadu (2012. gadā nav
datu par astoņām pašvaldībām), tāpēc SOPA dati tiek izmantoti iedzīvotāju skaita precizēšanai vecuma grupā
18–30 gadi un modeļa kvalitātes izvērtēšanai. No 2017. gada pieejami SOPA dati par pašvaldību ilgstošās
aprūpes iestādēs mītošajām personām un nakts patversmju pakalpojumus izmantojušām personām. No SOPA
sistēmas tiek saņemti arī dati par personām, kurām pašvaldības 2022. gada laikā piešķīru šas izziņu krīzes
situācijā saņemt ES pārtikas pakas (personām ar pagaidu tiesiskās aizsardzības statusu Latvijā). Šie dati tiek
izmantoti, lai pecīzāk noteiktu, vai minētās personas ir Latvijas patstāvīgie iedzīvotāji.
CSP pastāvīgi izvērtē papildu datu avotus, kas būtu noderīgi iedzīvotāju statistikas sagatavošanai, kā rezultātā
ir panāktas vienošanās par papildu administratīvo reģistru datu iegūšanu iedzīvotāju statistikas sagatavošanai:
• sākot ar 2015. gadu, iedzīvotāju skaita precizēšanai , reģistrētās dzīvesvietas noteikšanai tiek
izmantoti arī Ieslodzījuma vietu pārvaldes (IeVP) dati par ieslodzītajiem.
• sākot ar 2016. gadu, iedzīvotāju skaita precizēšanai , reģistrētās dzīvesvietas noteikšanai tiek
izmantoti arī VSAA dati par personām, kurām maksāts pabalsts vai pensija un kuras atrodas
sociālās aprūpes iestādē.
• sākot ar 2018. gadu, tiek izmantoti Labklājības ministrijas dati par valsts sociālās aprūpes iestādēs
mītošajām personām.
• sākot ar 2018. gadu, iedzīvotāju skaita precizēšanai CSP ir pieejama arī informācija par
studējošajiem Latvijas augstākās izglītības iestādēs (avots – IZM).
• sākot ar 2019. gadu, pieejami Izglītības un kvalitātes dienesta dati par mācību iestādēs
nereģistrētajiem bērniem.
10
•
sākot ar 2020. gadu, pieejami Uzturlīdzekļu garantiju fonda dati par personām, kuras iesniegušas
pieprasījumu par uzturlīdzekļu izmaksu, personām, kuras uzturam tiek izmaksāti uzturlīdzekļi, un
personām, kuru vietā tiek izmaksāti uzturlīdzekļi.
3.3.
CSP izveidotās datubāzes
Iedzīvotāju skaita novērtējumā izmanto arī vairākas CSP izveidotās datubāzes, kas nepieciešamas gan personu
atlasei, gan arī, lai kopsavilkumu dati būtu savstarpēji saskaņoti.
Atkarībā no tā, kurā iedzīvotāju skaita novērtējuma posmā šos datus izmanto, tos var iedalīt:
•
Precizētas iedzīvotāju datnes izveidei nepieciešamie dati (novērtējumam):
✓
dzimušo personu datubāze,
✓
mirušo personu datubāze,
✓
laulāto personu datubāze,
✓
personu, kuras mainījušas personas kodus, datubāze,
✓
institucionālo mājokļu datubāze,
✓
personas, kuras nav jāiekļauj iedzīvotāju reģistra rāmī.
•
Loģistiskās regresijas modelim nepieciešamie dati, kurus pirms izmantošanas atsevišķi sagatavo:
✓
novērtējumā izmantojamo augstskolu studentu dati par visiem gadiem – katru gadu atjauno
datus par laika posmu, sākot no 2011. gada,
✓
VSAA dati par pabalstu saņēmējiem kārtējā gadā,
✓
kārtējā gada iekšzemes migrācijas datubāze.
•
Jauniešu u.c. īpašo grupu datubāze:
✓ SOPA dati par pabalstu saņēmējiem vecumā no 18 līdz 30 gadiem kārtējā gadā,
✓ visu augstskolu (izņemot Alberta koledžu) pilna laika studenti novērtējuma brīdī,
✓ visu Latvijas PII un skolu (izņemot tālmācību – izglītības programmas) audzēkņi līdz 19 gadu
vecumam kārtējā mācību gadā,
✓ ieslodzījuma vietu, bērnu ilgstošas aprūpes iestāžu (bērnu namu), ārstniecības iestāžu un
pansionātu iemītnieki novērtējuma brīdī,
✓ bēgļi novērtējuma brīdī.
•
Personu, kurām ir Latvijas tiesiskās aizsardzības statuss uz 01.01.2023 un kuras jāiekļauj Latvijas
patstāvīgo iedzīvotāju skaitā, datubāze.
11
•
Dzīvesvietas noteikšanai nepieciešamie dati – Valsts zemes dienesta Valsts adrešu reģistra
informācijas sistēmas (VARIS) adresācijas objekta koda (turpmāk – adresācijas objekta kods) –
ATVK pārejas tabula.
Dzimušo datubāzē papildus CARIS datiem iekļauj:
•
ārzemēs dzimušus bērnus, kuru mātēm dzīvesvieta deklarēta Latvijā iepriekšējā gadā (sākumā vai
beigās) un kuri pēc iedzīvotāju skaita novērtēšanas metodes iekļauti Latvijas patstāvīgo iedzīvotāju
skaitā);
•
Latvijā dzimušus ārzemnieku bērnus, kuri dzimšanas apliecību ir saņēmuši nevis PMLP, bet vecāku
pilsonības valsts konsulārajā dienestā, tāpēc nav CARIS datos, bet pēc iedzīvotāju skaita
novērtēšanas metodes iekļauti Latvijas patstāvīgo iedzīvotāju skaitā.
Mirušo datubāzes pamatā ir CARIS dati. Personu pārlūkā precizē ziņas par personām, kuras nav CARIS
datubāzē, bet varētu būt mirušas.
Ja persona:
•
ir Latvijas pilsonis vai nepilsonis;
•
iepriekšējā gada sākumā bija iekļauta PMLP Fizisko personu reģistrā;
•
šā gada sākumā vairs nav iekļauta PMLP Fizisko personu reģistrā,
tad pārbauda, vai šī persona nav mirusi, īslaicīgi uzturoties ārzemēs.
Ja tiek konstatēts, ka persona iekļaujama mirušo datubāzē, precizē arī tās miršanas datumu.
Laulāto personu datubāzi izmanto, lai personām, kuras laulājušās vai šķīrušās gada beigās vai laulājušās
vai šķīrušās ārzemēs, piekārtotu korektu ģimenes stāvokļa statusu (kodu).
Personu, kuras mainījušas personas kodus, datubāzi izmanto, lai sasaistītu kopā informāciju, kas
reģistros par personu ir ar tās veco un jauno personas kodu.
Iekšzemes migrācijas datubāzi izmanto, jo, testējot modeli, ir apstiprinājies, ka dzīvesvietas deklarēšana
uz citu novadu palielina varbūtību, ka persona ir Latvijas iedzīvotājs.
Institucionālo mājokļu datubāzei ir divas daļas:
•
personas, kuras noteikti jāiekļauj novērtējumā – bēgļi, cietumnieki, sociālās aprūpes klienti
(apmēram 17 tūkstoši personu);
•
personas, kuras dzīvo institucionālajā mājoklī, bet atkarībā no aktivitātēm var nebūt novērtējumā –
dienesta viesnīcās, klosteros, nakts un sociālajās patversmēs dzīvojošie (apmēram 10 tūkstoši
personu).
Katrai no šīm daļām atbilst savi adresācijas objekta kodi, kas savstarpēji nepārklājas.
12
Iedzīvotāju skaita novērtēšanā neiekļauj:
• personas, kuras deklarētas bloķētajās lielajās adresēs (adresēs, kur deklarētas vairāk nekā 2 0
personas, piemēram, darbinieki deklarēti uzņēmumu adresē) . Katru adresi, kurā deklarētas 20 vai
vairāk personas un kas nav institucionālais mājoklis, izvērtē atsevišķi, pārbaudot tur deklarēto
personu pilsonīb u, darba viet u 2021. gada decembrī, kā arī uzņēmumu reģistrā pieejamo
informāciju par attiecīgo adresi . Pēc ekspertu novērojuma š ajās adresēs deklarētus Latvijas
valstspiederīgos atstāj iedzīvotāju reģistra rāmī, savukārt citu valstu pilsoņus neiekļauj.
• tiesisko statusu zaudējušās personas. PMLP iedzīvotāju sarakstā ir personas, par kurām PMLP ir
saņemtas ziņas, ka tās Latvijā nedzīvo, taču tas nav dokumentāli apstiprināts, bet šo informāciju
var redzēt PMLP Fizisko personu reģistra Personu datu pārlūka tiešsaistē. Ja iepriekšējā gadā
konstatēts, ka personai zudis tiesiskais statuss, tad pieņem, ka tā ir arī šogad. Izslēdz arī personas,
kurām dzīvesvietas deklarēšanas iemesli ir INL (izbrauc no Latvijas) un SAN (sakarā ar nāvi). Ja
personas vecums ir 75 vai vairāk gadu, bet iepriekšējā gada laikā tā neparādās VSAA, VID vai
NVD datos, tad, izmantojot papildu informāciju par bērnu un laulātās personas dzīves vietu
iepriekšējajā gadā, izvērtē, vai to iekļaut vai neiekļaut iedzīvotāju reģistra rāmī.
Jauniešu u.c. īpašo grupu datubāzi izmanto emigrācijas datu precizēšanai galvenokārt jauniešu vecuma
grupā iedzīvotāju skaita novērtēšanas otrajā posmā, koriģējot varbūtības atbilstoši migrācijas apjomiem. Daļa
no šajā datubāzē iekļautajām personām palielina iekļauto personu skaitu savā vecuma/ dzimuma grupā, bet
daļa neatkarīgi no novērtētās varbūtības tiek ieskaitītas pastāvīgo iedzīvotāju skaitā. Datubāzē ir iekļautas:
• personas 18–30 gadu vecumā, kas saņem pašvaldību SOPA pabalstus;
• visu Latvijas PII un vispārizglītojošo skolu (izņemot profesionālās skolas un tālmācību) audzēkņi
līdz 19 gadu vecumam;
• visu augstskolu (izņemot Alberta koledžu, jo šī koledža piedāvā studiju programmas apgūt
tālmācībā) pilna laika studenti;
• cietumu, bērnu namu, ārstniecības iestāžu un pansionātu iemītnieki;
• bēgļi.
Sk. 4.8. sadaļu.
Personu, kurām ir Latvijas tiesiskās aizsardzības statuss uz 01.01.2023 . un kuras jāiekļauj Latvijas
patstāvīgo iedzīvotāju skaitā , datubāze. Tiek iekļautas personas, kurām ir Latvijas tiesiskās aizsardzības
statuss uz 01.01.2023. un tām ir kāda no tālāk uzskaitītajām aktivitātēm:
• persona (bēgļi, cietumnieki, sociālās aprūpes klienti) uzturas institucionālajā mājoklī, kura jāiekļauj
novērtējumā;
• atbilstoši VID datiem persona ir nodarbināta 2023. gada janvārī;
13
•
persona saņēmusi pabalstu no pašvaldības vai pašvaldības krīzes izziņu 2022. gada oktobrī,
novembrī vai decembrī;
•
persona izmantojusi Rīgas satiksmes personalizēto e-biļeti 2023. gada janvārī;
•
persona reģistrēta pirmsskolas, vispārējās, profesionālās vai augstākās izglītības iestādē 2022. gada
31. decembrī;
•
persona reģistrētēta NVA 2023. gada janvārī;
•
persona izmantojusi ārstniecības pakalpojumus 2022. gada oktobrī, novembrī vai decembrī;
•
bērni līdz 18 gadu vecumam, kuru vecākiem ir kāda no iepriekš minētajām aktivitātēm.
Personas, kuras iekļautas šajā datubāzē tiek pievienotas patstāvīgo iedzīvotāju datubāzei pēc novērtējuma otrā
soļa pabeigšanas.
Adresācijas objekta koda – ATVK pārejas tabulu izmanto reģistrētās dzīvesvietas noteikšanā. Pēc
Valsts zemes dienesta informācijas tabulu aktualizē, iekļaujot ziņas par katra mājokļa dzīvokļa un mājas
adresācijas objekta kodu, ATVK kodu, maiņas iemeslu (robežu maiņa, kļūdas labojums reģistrā), un pazīmi,
ka tas ir institucionālais mājoklis.
Datubāzes adresācijas objekta kodu precizēšanai
Personām var piešķirt tikai tādu reģistrētās dzīvesvietas adresācijas objekta kodu, kas atbilstoši Valsts
zemes dienesta informācijai atbilst reālai dzīvesvietai. Tomēr, salīdzinot PMLP Fizisko personu reģistrā
norādītos adresācijas objekta kodus ar adrešu reģistrā norādītajiem kodiem, ir atrastas personas, kuras:
•
deklarētas dzīvoklī, bet faktiski dzīvo mājā, jo šī māja nav sadalīta dzīvokļos;
•
deklarētas mājā, bet faktiski dzīvo dzīvoklī, jo šajā mājā ir vairāki dzīvokļi;
•
kā dzīvesvietas adresācijas objekta kods norādīts ciema kods.
Lai koriģētu šīs neprecizitātes un nomainītu adresācijas objekta kodu uz visticamāko personas dzīvesvietas
kodu, sagatavo:
•
šādu personu un mājokļu datubāzes;
•
datubāzi ar mājokļu platībām.
3.4.
Migrācijas spoguļstatistika
Starptautiskās ilgtermiņa emigrācijas apjoms no mītnes valsts uz citu valsti sakrīt ar attiecīgās valsts
starptautiskās ilgtermiņa imigrācijas apjomu no mītnes valsts. Šo sakarību sauc par spoguļstatistiku, un tā tiek
izmantota starptautiskās ilgtermiņa emigrācijas novērtēšanai.
Novērtējot starptautisko ilgtermiņa emigrāciju, tiek izmantota saņemtā informācija no citām valstīm (Dānijas,
Somijas, Zviedrijas, Norvēģijas, Spānijas, Nīderlandes, Austrijas, Islandes, Vācijas) par imigrāciju no Latvijas.
Ne visas valstis gatavo datus par imigrantiem no Latvijas, jo Eiropas Parlamenta un Padomes Regulas par
Kopienas statistiku attiecībā uz migrāciju un starptautisko aizsardzību (11) 3. pants nosaka, ka valstis
14 informāciju par imigrantiem var sniegt pēc iepriekšējās pastāvīgās dzīvesvietas pa valstu grupām – ES dalībvalstis; Eiropas Brīvās tirdzniecības asociācijas valstis; kandidātvalstis; citas ārpuskopienas valstis. Lai novērtētu Latvijas iedzīvotāju emigrāciju uz Apvienoto Karalisti un Īriju, izmantota informācija par Apvienotajā Karalistē pirmo reizi piešķirto sociālās apdrošināšanas numuru skaitu ( National Insurance number) un informācija par Īrijā pirmo reizi piešķirto personalizēto sabiedrisko pakalpojumu numuru skaitu (Personal Public Service Number ). Jāatzīmē, ka minētie dati ir izmantoti tikai kopējās tendences novērtējumam, jo minētie numuri tiek piešķirti arī tiem Latvijas iedzīvotājiem, kuri uzturas Apvienot ajā Karalistē vai Īrijā mazāk par vienu gadu, kā arī persona var tikt reģistrēta vairākkārt, ja tā ziņojusi par aizbraukšanu no valsts un ieradusies tajā atkārtoti (skatīt 4.3. nodaļu). Apvienotās Karalistes un Īrijas nacionālo statistikas iestāžu eksperti ir norādījuši, ka nevar izmantot minētajās sistēmās reģistrēto skaitu kā imigrantu skaitu no Latvijas, to var izmantot tikai, lai novērtētu kopējās tendences. Kā iemesls tiek minēts, ka sistēmās tiek reģistrētas arī personas, kuras plānojušas uzturēties mazāk par gadu; ja persona iebrauc valstī atkārtoti, tai nav otrreiz jāreģistrējas sistēmā. Turklāt Īrijas sistēmā tiek reģistrētas tikai tās personas, kuras ir 15 un vairāk gadus vecas. Īrijas statistika s birojs katru gadu veic piešķirto personalizēto sabiedrisko pakalpojumu numuru analīzi, un tendence rāda, ka ar katru gadu pieaug to personu skaits, kuras ir saņēmušas sabiedrisko pakalpojumu numuru un ir nodarbinātas vai saņem sociālos pabalstus – tātad uzturas v alstī. Ja 2011. gadā tikai 37 % sabiedrisko pakalpojumu numurus saņēmušie ārvalstnieki bija nodarbināti, tad 2016. gadā šis rādītājs pieaudzis līdz 54,7 % (1). Tomēr Īrijas gadījumā dati par sabiedrisko pakalpojumu numurus saņēmuš ajiem ārzemniekiem tiek gatavoti pēc personu valstiskās piederības ne iepriekšējās dzīvesvietas valsts, kas līdz ar to ietver ne tikai personas, kas ieradušās no Latvijas, bet arī, piemēram, no Apvienotās Karalistes un ir Latvijas pilsoņi. 3.5. CSP veikti personu izlases apsekojumi Sagatavotā iedzīvotāju skaita novērtējuma precizitātes izvērtēšanai izmantoti vairāku CSP veikto izlases apsekojumu dati, kuros respondentiem ir personas kodi: • darbaspēka apsekojums (DSA), sākot ar 2011. gadu; • apsekojums „Statistika par ienākumiem un dzīves apstākļiem” (SILC), sākot ar 2011. gadu; • Eiropas Veselības un sociālās iekļaušanas apsekojums par 2012. gada 1. septembri (EHIS); • Eiropas Iedzīvotāju veselības apsekojum s 2014. gada beigās–2015. gada sākumā un 2019. gada beigās–2020. gada sākumā (EIVA); • Datoru un interneta lietošanas apsekojums (IKT) 2017.–2020., 2021. gadā; • Pieaugušo izglītības apsekojums (PIA) 2016. un 2022. gadā; • Latvijas iedzīvotāju mobilitāte (MOBA) 2017. gadā; • Ārējās migrācijas apsekojums (ĀMA) 2017. un 2018. gadā;
15
• Zinātņu doktoru tālākās karjeras apsekojums (ZD) 2019. gada beigās;
• Ar dzimumu saistīts vardarbības apsekojums (VA) 2021. gadā.
Gatavojoties 2021. gada tautas skaitīšanai, 2015. gadā CSP veica tautas mikroskaitīšanu (TMS). TMS dati tika
izmantoti, lai novērtētu kopīgo starptautiskās imigrācijas apjomu Latvijā 2015. gada laikā un lai vērtētu
iedzīvotāju statistikas precizitāti.
2017.–2018. gadā Ārējās migrācijas apsekojums veikts 20 000 Latvijas mājsaimniecīb u, aptaujājot
iedzīvotājus divas reizes (2017. gada un 2018. nogalē ), lai noskaidrotu, k urš dzīvoja šajās mājsaimniecībās
2016., 2017. un 2018. gadā. Katrā apsekojuma reizē atbildes saņemtas no vairāk nekā 35 tūkstošiem personu,
aptuveni 7 % mājsaimniecību iemītnieki izmantojuši iespēju atbildēt internetā.
4. Modeļi un pieņēmumi
4.1. Loģistiskās regresijas modelis
Loģistiskās regresijas modelis (turpmāk – modelis) balstās uz pieņēmumu, ka varbūtība 𝑝𝑖, ka Latvijas Fizisko
personu reģistrā reģistrēta persona ar indeksu 𝑖 (𝑖 mainās no 1 līdz 𝑁) ir Latvijas pastāvīgais iedzīvotājs, ir
formā:
𝑝𝑖 = 𝐸(𝑦𝑖|𝑥𝑖) = 1
1 + 𝑒−(𝛽0+∑ 𝛽𝑘𝑥𝑖𝑘𝐾
𝑘 +𝜀𝑖),
kur atkarīgais mainīgais apzīmēts ar 𝑦𝑖 , ir sadalīts binomiāli,
𝑦𝑖 = { 1, ja 𝑖 − tā persona faktiski dzīvo Latvijā,
0, ja 𝑖 − tā persona faktiski dzīvo ārzemēs.
Savukārt 𝑥𝑖𝑘 ir personas 𝑖 binārie palīgmainīgie, indeksēti ar indeksu 𝑘 (no 1 līdz 𝐾), kas pieņem vērtības:
𝑥𝑖𝑘 = { 1, ja 𝑖 − tai persona piemīt k − tā binārā mainīgā pazīme,
0, ja 𝑖 − tai personai nepiemīt k − tā binārā mainīgā pazīme.
Piemēram, ja 𝑘-tais binārais mainīgais ir informācija par to, vai persona 𝑖 saņem vecuma pensiju, tad 𝑥𝑖𝑘 = 1
visām personām i, kuras saņem vecuma pensiju, un 0 pārējām personām.
Izmantojot administratīvo reģistru datus, par katru Latvijas Fizisko personu reģistrā reģistrēto personu tika
izveidoti 206 binārie mainīgie, kā, piemēram, iedzīvotāja dzimums, vecuma grupas, indikatori, ka iedzīvotājs
saņēmis darba samaksu, sociālos pabalstus, ka iedzīvotājs ir mācījies u. c. (skatīt 5. tabulu 2. pielikumā).
Lai iegūtu modeļa koeficientu 𝛽𝑘 novērtējumus 𝛽̂𝑘, tika izmantoti 2011. gada tautas skaitīšanā iegūtie dati par
iedzīvotāju faktisko dzīvesvietas statusu, kā arī administratīvo reģistru informācija par 2010. gadu, 2011. gada
- janvāri vai 2011. gada 1. martu. Modeļa izstrādes gaitā tika apskatīti vairāki iespējamie modeļa varianti , kas atšķīrās ar izskaidrojošo jeb neatkarīgo mainīgo izvēli un konstruēšanu. Tika veidoti un modelī iekļauti dažādi atvasinātie mainīgie no CSP
16 pieejamajiem administratīvo reģistru datiem. Piemēram, no personu vecuma tika izveidoti bināri mainīgie, kas raksturo personas piederību vienai no desmit gadu vecuma grupām (0 –9, 10–19, … 90–99, 100+ ) vai piecu gadu vecuma grupām (0–4, 5–9, …, 95–99, 100+). Tika veikta skaidrojošo mainīgo standartizācija formā: 𝑥̃𝑖𝑘 = 𝑥𝑖𝑘 − 𝑥̅𝑘 𝜎𝑘 , kur 𝑥𝑖𝑘 – i-tās personas k-tā mainīgā vērtība, 𝑥̅𝑘 – k-tā mainīgā vidējā vērtība, 𝜎𝑘 – k-tā mainīgā standartnovirze. Modeļa varianti tika salīdzināti pēc to prognozēšanas spējas (predictive power). Modeļa prognozēšanas spēja tika mērīta ar pseido Nāgelkerkes determinācijas koeficienta palīdzību, kas ir aprēķināms kā: R2 = 1 − (𝐿(𝑀𝐼𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡) 𝐿(𝑀𝐹𝑢𝑙𝑙) ) 2/𝑁 1 − 𝐿(𝑀𝐼𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡)2/𝑁 , kur 𝑀𝐼𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡 ir modelis bez neatkarīgajiem mainīgajiem un 𝑀𝐹𝑢𝑙𝑙 ir modelis ar izvēlētajiem neatkarīgajiem mainīgajiem, un 𝐿 – paticamības funkcija. Nāgelkerkes determinācijas koeficienta maksimālā vērtība ir viens. Modeļa mainīgo koeficienti tika analizēti pēc to statistiskā nozīmīguma (𝑆𝑖𝑔). Sākotnēji modelis tika veidots, izmantojot tikai PMLP datus. Labākais izstrādātais modelis no PMLP datiem izskaidroja tikai 13 % modeļa atkarīgā mainīgā dispersij as (pēc pseido Nāgelkerkes determinācijas koeficienta), tādēļ modelī tika iekļauti papildu neatkarīgie mainīgie, kas veidoti, izmantojot CSP pieejamos administratīvo reģistru datus. Lai noteiktu papildu administratīvo reģistru datu ietekmi uz modeļa prognozēšanas spēju, dati modelī tika iekļauti secīgi (skatīt 1. tabulu).
17
- tabula. Loģistiskās regresijas modeļu salīdzinājums Nr. Loģistiskās regresijas modelī iekļautie administratīvo reģistru dati −𝟐𝑳𝑳 Nāgelkerkes 𝑹𝟐 1 PMLP 1 047 445 0,13 2 PMLP; VID 823 391 0,35 3 PMLP; VID; LAD; LDC; NVA 763 518 0,41 4 PMLP; VID; LAD; LDC; NVA; VSAA 674 877 0,49 5 PMLP; VID; LAD; LDC; NVA; VSAA; IZM; LU; RTU; informācija par vecākiem4 594 059 0,56 6 PMLP; VID; LAD; LDC; NVA; VSAA; IZM; LU; RTU; informācija par vecākiem; NVD 527 458 0,61 7 PMLP; VID; LAD; LDC; NVA; VSAA; IZM; LU; RTU; informācija par vecākiem; NVD; CSDD; TSI / RPIVA / BSA / RTA / LiepU 508 462 0,61 8 PMLP; VID; LAD; LDC; NVA; VSAA; IZM; LU; RTU; informācija par vecākiem; NVD; CSDD; TSI / RPIVA / BSA / RTA / LiepU / RCK / RTK / MK / LURMK / DMK / RMK1 / JVLMA / LKA / LKA LKK / VPK / SKMK / SSE Riga 506 414 0,61
- solī modelis spēja izskaidrot 61 % no atkarīgā mainīgā dispersijas (pēc pseido Nāgelkerkes determinācijas koeficienta). Modeļa atbilstība datiem tika papildu novērtēta, aprēķinot negatīvo divkāršo logaritmēto ticamību (-2 log likelihood (−2𝐿𝐿)) formā: −2𝐿𝐿= −2 ∑ {𝑦𝑖𝑙𝑛[ 𝑝̂𝑖 𝑦𝑖] + (1 −𝑦𝑖)𝑙𝑛[ 1−𝑝̂𝑖 1− 𝑦𝑖]} 𝑛 𝑖=1 , Statistikā −2𝐿𝐿 ir indikators, kas raksturo modeļa neatbilstību datiem (a badness-of-fit indicator). Jo lielāka ir −2𝐿𝐿 vērtība, jo sliktāk modelis atbilst datiem. Pirmajā tabulā ir apskatāmas pseido Nāgelkerkes determinācijas koeficientu un −2𝐿𝐿 vērtību izmaiņas atkarībā no modelī izmantotās papildinformācijas apjoma. Netika novēroti gadījumi, ka abas statistikas dotu pretrunīgu modeļu salīdzinājumu (ja modelim 𝐴 ir lielāks Nāgelkerkes determinācijas koeficients, salīdzinot ar modeli 𝐵, tad visos apskatītajos gadījumos −2𝐿𝐿 vērtība modelim 𝐴 bija mazāka par −2𝐿𝐿 vērtību modelim 𝐵). Visi izstrādātie modeļi tika papildu vērtēti, veicot modeļa rezultātu demogrāfisko analīzi. Sākotnēji modeļa izstrāde tika veikta ar statistisko aprēķinu programmas IBM SPSS Statistics iebūvēto loģistiskās regresijas algoritmu (2). Modeli attīstot, programmas kods tika pārrakstīts statistiskās programmēšanas valodā R (7). Izstrādātā modeļa neatkarīgie mainīgie un to koeficientu novērtējumi ir aplūkojami 2. pielikuma 5. tabulā.
4 Informācija par vecākiem ir deviņi modeļa mainīgie, kas satur informāciju par personas vecākiem. Šie mainīgie tiek aprēķināti tikai personām vecumā no 0 līdz 25 gadiem. Pārējām personām šo mainīgo vērtības ir 0. Šo deviņu mainīgo datu avotus skatīt 2. pielikuma 5. tabulā “Loģistiskās regresijas modeļa atkarīgie mainīgie un modeļa koeficientu novērtējumi”. Šo mainīgo aprakstā ir ietverta frāze “tikai personām vecumā 0–25”.