Tartu Ülikool Loodus- ja täppisteaduste v aldkond Matemaatika ja statistika instituut Mai Britt Meriloo Wilhelm Lexis ja tema panus rahvastikustatistikasse Matemaatiline statistika Bakalaureusetöö (9 EAP) Juhendaja: PhD Krista Fischer Tartu 2025 "WILHELM LEXIS JA TEMA P ANUS RAHV ASTIKUST A TISTIKASSE" Bakalaureusetöö Autor Mai Britt Meriloo Lühikokkuvõte Rahvastikuprotsesside uurimiseks kasutatakse kolme näitaja: vanuse, perioo- di ja sünnikohordi mõjusid. Tänavu möödub 150 aastat sellest, kui saksa statistik Wilhelm Lexis avaldas versiooni diagrammist, mis võimaldab nende kolme teguri koosmõjusid visualiseerida. Selle abil saab analüüsida erinevate demograafiliste sündmuste, seal hulgas sündide, surmade kulgu ajas. Käes- oleva bakalaureusetöö eesmärk on tutvustada Lexise diagrammi ja hinnata Lexise diagrammi andmetele rakendatavat vanus-periood-kohort mudelit, et kolme teguri mõju suremusriskile. Praktilises osas viiakse läbi analüüs Tartu Ülikooli Eesti geenivaramu andmebaasi põhjal loodud sünteetilisel andmes- tikul. CERCS teaduseriala: P160Statistika,programmeerimine,finants-jakind- lustusmatemaatika. Märksõnad: Wilhelm Lexis, Lexise diagramm, vanus-periood-kohort mudel, elulemusanalüüs, rahvastikusündmused, demograafilised protsessid. "WILHELM LEXIS AND HIS CONTRIBUTION TO POPULA TION ST A TISTICS" Bachelor thesis Author Mai Britt Meriloo Abstract In order to study demographic processes, three temporal components are 1 used: the effects of age, period, and birth cohort. This year marks the 150th anniversary since German statistician Wilhelm Lexis published his version of the diagram that visualizes these three effects. This makes it possible to analyze the progression of various demographic events over time, including births and deaths. The aim of this thesis is to introduce the Lexis diagram and the age-period-cohort model applied to data from the Lexis diagram data to assess the effects of these three factors on mortality risk. In the practical part, an analysis is conducted using a synthetic dataset created based on the data of Estonian Genome Project at the University of Tartu. CERCS research specialisation: P160 Statistics, operations research, programming, financial and actuarial mathematics. Key Words: Wilhelm Lexis, Lexis diagram, age-period-cohort model, sur- vival analysis, population events, demographic processes. 2
Sisukord Sissejuhatus 4 1 Wilhelm Lexis 5 1.1 Wilhelm Lexis Tartu Ülikoolis . . . . . . . . . . . . . . . . . . . . . 8 2 Lexise diagramm 12 2.1 Lexise diagrammi kujunemisest . . . . . . . . . . . . . . . . . . . . 12 2.2 Lexise diagramm tänapäeval . . . . . . . . . . . . . . . . . . . . . . 16 3 Suremusriski hindamine Lexise diagrammi abil 18 3.1 Elulemusanalüüsi põhimõisted . . . . . . . . . . . . . . . . . . . . . 18 3.2 Statistiline mudel riskile . . . . . . . . . . . . . . . . . . . . . . . . 19 3.3 Vanus-periood-kohort mudel . . . . . . . . . . . . . . . . . . . . . . 21 4 Analüüs testandmetega 24 Kokkuvõte 32 Kasutatud kirjandus 33 Lisa 1. Andmete analüüsimiseks kasutatud R-i kood 36 Lisa 2. Wilhelm Lexise isikutoimiku translitereeritud dokumendid 43 3
Sissejuhatus Tänavu möödub 150 aastat sellest, kui saksa demograaf Wilhelm Lexis avaldas teose „Einleitung in die Theorie der Bevölkerungsstatistik,“ kus ta esmakordselt tutvustas oma versiooni rahvastikuprotsesside graafilise analüüsimise vahendist: Lexise diagrammist. Wilhelm Lexis oli 19. sajandi interdistsiplinaarne teadlane, kes on andnud märki- misväärse panuse erinevates uurimissuundades ja olnud karjääri jooksul tugevasti seotud akadeemiaga, seal hulgas Tartu Ülikooliga. Sel sajandil arutlesid teadla- sed statistika kui teadusharu staatuse üle ja otsisid viise rahvastikusündmuste pa- remaks kujutamiseks. Lexis oli üks esimestest demograafidest, kes ühendas kolm ajadimensiooni: vanus, kalendriaeg ja kohort ühele koordinaadistikule nende koos- mõjude kirjeldamiseks. Lexise diagrammi aitas populariseerida Roland Pressat’, kes 20. sajandil lihtsustas diagrammi algset versiooni (De Gans ja van Poppel, 2000). Lexise diagrammi põhjal struktureeritud andmestik võimaldab analüüsida and- meid jälgimisuuringutena ja rakendada elulemusanalüüsi, et hinnata suremust või muude rahvastikusündmuste toimumise riski ajas. Andmestikule saab rakendada ka vanus-periood-kohort mudelit, et mõõta kolme näitaja mõju sündmustele. Mu- del võimaldab hinnata, kuidas näiteks vananemine (vanuse mõju), meditsiini areng (ajaperioodi mõju) ja erinevate põlvkondade inimesi ümbritsev keskonna mõju nen- de varajastes eluetappides (kohordi mõju) demograafilisi protsesse mõjutavad. See- ga on Wilhelm Lexise väljapakutud diagramm oluline graafiline tööriist, mille abil saab analüüsida olulisi demograafilisi näitajaid ja protsesse. Autor soovib tänada juhendajat Krista Fischerit, Rahvusarhiivi ja Tartu Ülikooli muuseumi nõuannete ja meeldiva koostöö eest. 4
1 Wilhelm Lexis Wilhelm Lexis (täisnimega Wilhelm Hector Richard Albrecht Lexis) sündis 17. juulil 1837. aastal Lääne-Saksamaal Eschweileris, arstist isa Ernst Joseph Lexis ja tema naise Gertrud Stasseni perre (Hulíková Tesárková ja Kurtinová, 2014). Aastal 1855 lõpetas ta Kölnis gümnaasiumi nimega Friedrich-Wilhelm-Gymnasium (Wilhelm Lexise isikutoimik, 1874). Lexis astus 1855. aastal Bonni Ülikooli õigusteaduskonda, kuid aasta pärast läks üle matemaatika-ja loodusteaduste õppimisele. Aastal 1859 kaitses Lexis doktoritöö “De generalibus motus legibus” (ee „Üldiste dünaamikaseaduste kohta”). (Wilhelm Lexise isikutoimik, 1874) Lexis töötas mõnda aega Bonni gümnaasiumis matemaatikaõpetajana ning Bunseni keemialaboris Heidenburgis (Hertz, i.a). Aastal 1861 kolis Wilhelm Lexis täiendõppele Pariisi, kus ta uuris Prantsusmaa majandustingimusi. 1870. aastal avaldas ta oma esimese teadustöö Prantsusmaa ekspordipoliitika teemal: „Die französischen Ausfuhrprämien im Zusammenhange mit der Tarifgeschichte und Handelsentwicklung Frankreichs seit der Restauration: volkswirthschaftliche Studien” (ee "Prantsusmaa eksporditoetused koos tariifiaja- loo ja Prantsusmaa kaubanduse arenguga pärast restauratsiooni: majandusuurin- gud.") Poliitmajanduse uurimisele lähenes Lexis teaduslik-statistilisise meetodi- ga, mistõttu jättis see väärtusliku panuse Prantsusmaa finantsajalukku. (Wilhelm Lexise isikutoimik, 1874) Aastal 1870 puhkenud Prantsuse-Preisi sõja tõttu naasis Lexis Saksamaale, 30 ki- lomeetri kaugusele Strasbourg’ist, Haguenau’sse. Seal alustas ta tööd Alsace’i kesk- valitsuse ajalehe Straßburger Zeitung toimetuses. 1872. aastal sai Lexis vastavatud Strasbourg’i ülikooli poliitteaduse kaasprofessoriks, kus ta andis loenguid nii raha- ja pangasüsteemidest kui ka statistika vallas. (Wilhelm Lexise isikutoimik, 1874) Strasbourg’is võttis Lexis osa tudengite liikumisaktsioonist Verein für Sozialpolitik 5
Joonis 1: Wilhelm Lexis. Allikas: Wikipedia (ee Sotsiaalpoliitika ühing, majandusliit) (Hertz, i.a). Strasbourg’is suunas Lexis tähelepanu rahvastikuküsimustele. Seal alustas ta oma esimese demograafilise teadustöö kirjutamist. Teos „Einleitung in die Theorie der Bevölkerungsstatistik” (ee „Sissejuhatus rahvastikustatistikasse”) valmis 1875. aas- tal Tartus. See on esimene publikatsioon, milles Lexis avaldas oma versiooni ka- hemõõtmelisest diagrammist ehk Lexise diagrammist. (De Gans ja van Poppel, 2000) Tartus töötas Wilhelm Lexis geograafia, etnograafia ja statistika õppejõuna aasta- tel 1874 − 1876. Aastal 1878. toimus Pariisis rahvusvaheline demograafiakongress, kus Wilhelm Lexis esitas ettekandes „Zur Theorie der Massenerscheinungen in der 6 Menschlichen Gesellschaft” (ee „Massinähtuste teooriast ühiskonnas”) oma teooriat “loomulikust elust”. Lexis väitis, et inimeste vanuse põhjal on surma võimalik lii- gitada kolme rühma: “loomulik surm”, imikute surm ja täiskasvanute enneagne suremine. Lexise käsitlus tugines belgia matemaatiku Lambert Adolphe Jacques Quetelet’i ideele. (De Gans ja van Poppel, 2000) Peale Tartu aastaid naasis Lexis Saksamaale, Freiburg im Breisgau’ Ülikooli poliit- ökonoomia õppetooli. 1884. aastast kuni surmani töötas Wilhelm statistika õppe- toolis: esmalt Breslau Ülikoolis (praegune Wroclaw Lääne-Poolas) ja 1887. aastast Göttingeni Ülikoolis. (Hertz, i.a) Oma hilisemas karjääris keskendus Lexis haridussüsteemi ja majandusega seotud küsimustele (De Gans ja van Poppel, 2000). Aastast 1891 oli Lexis majandus- ja statistikateemalise teadusajakirja Jahrbuch für Nationalökonomie und Statistik peatoimetaja, milles ta ise samuti teadusartikleid avaldas. Wilhelm Lexis andis panuse ka Saksamaa esimese majandus- ja sotsiaalteaduste entsüklopeediasse, kir- jutades sinna finantsalaseid teadustekste. (Hertz, i.a) Lexis oli abielus Pauline Emilie Lindenbergiga ja neil oli kolm last (Hulíková Tesár- ková ja Kurtinová, 2014). Wilhelm Lexis oli roomakatoliiklane. Tema kolleeg Gustav Schmoller kirjeldas te- da tagasihoidliku ja ennastsalgava, kuid väga haritud, täpse ja kohusetundliku õpetlasena. (Wilhelm Lexise isikutoimik, 1874) Lexis sai oma panuse eest Prantsuse-Preisi sõjas Preisi II klassi raudristi, saksa kõrgeima vaprusemärgi ja Saksamaa 1870/71 aasta sõja mälestusmedali (Wilhelm Lexise isikutoimik, 1874). Wilhelm Lexis suri 1914. aasta 24. augustil Göttingenis (Hertz, i.a). Kuigi Lexis on kõige rohkem tuntud oma panuse eest demograafiasse, on ta väl- ja arendanud ka meetodi aegridade stabiilsuse hindamiseks. Aastal 1879 esitles ta publikatsioonis „Zur Theorie der Stabilität statistischer Reihen” (ee „Statistilis- te aegridade stabiilsuse teooria”) dispersiooni koefitsenti (Lexis Q), mille abil sai 7
kindlaks teha, kas rahvastikuprotsesside kulg tuleneb juhuslikest kõikumistest või allub seaduspärasustele. (De Gans ja van Poppel, 2000) 1.1 Wilhelm Lexis Tartu Ülikoolis 1802. aastal avati praegune Tartu Ülikool saksakeelse Vene riigiülikooli Kaiserliche Universität zu Dorpat nime all. 1820. aastal eraldati statistikast ja geograafiast ajalugu eraldiseisvaks õppetooliks (Tartu Ülikooli Ajaloo instituut, 2022). Wilhelm Lexise seotus Tartuga sai alguse 29. aprillil 1874. aastal, kui ülikooli ajaloo- ja filosoofiateaduskond esitas 37-aastase Lexise ainsa kandidaadina geog- raafia, etnograafia ja statistika professuurile. Lexis oli ülikooli sõnul üks väheseid Saksamaa ülikoolide statistikuid, kes oli tõestanud enda vastavust erialale. (Wil- helm Lexise isikutoimik, 1874) Tema kandidatuuri aluseks võib pidada 423-leheküljelist teadustööd, mis käsitles eksporditoetuste ja kaubanduse arengut: „Die französischen Ausfuhrprämien im Zusammenhange mit der Tarifgeschichte und Handelsentwicklung Frankreichs seit der Restauration” (ee „Prantsusmaa eksporditoetused koos tariifiajaloo ja Prant- susmaa kaubanduse arenguga pärast restauratsiooni: majandusuuringud”). Ülikool nentis, et uuring oli põhjalik ajaloolis-kriitiline ülevaade Prantsusmaa ekspordi- süsteemi kujunemisest ning kaubanduse arengust Prantsusmaal. Lisaks rakendas Lexis uuringus oskuslikult statistilist metoodikat poliitmajanduse uurimiseks. Sel- lega tõestas ta ennast andeka ja pädeva teadlasena statistika ja poliitmajanduse ajaloo vallas. (Wilhelm Lexise isikutoimik, 1874) Lexisest rohkema info saamiseks pöördus Tartu Ülikooli teaduskond Strasbourg’i Ülikooli poole, kus Lexis tollal töötas. Professor Gustav Schmoller kirjeldas Lexist kui täpset, kohusetundlikku ja laia silmaringiga teadlast ja kinnitas tema kom- petentsust valdkonnas. Lisaks mainiti kanditatuuri toetuseks peagi ilmuvat teost „die Theorie der Bevölkerungsstatistik.” Lexis määrati Vene haridusministri käsk- kirjaga Keiserliku Tartu Ülikooli geograafia, etnograafia ja statistika professoriks 8
ametlikult 28. septembril 1874. (Wilhelm Lexise isikutoimik, 1874) Aastal 1876 taotles Wilhelm Lexis suvekuudeks puhkust, et sõita Pariisi ja koguda allikaid tulevase statistilise teadustöö jaoks. Sama aasta augustis esitas ta tagasias- tumispalve ning ta vabastati professori ametikohalt 20. augustil 1876. (Wilhelm Lexise isikutoimik, 1876) Pärast Tartu Ülikoolist lahkumist siirdus Lexis tagasi Saksamaale ning asus tööle poliitökonoomia õppetooli Freiburg im Breisgau’ Üli- koolis. „Einleitung in die Theorie der Bevölkerungsstatistik” valmis 1875. aastal Tartus ja see publitseeriti kirjastaja Karl J. Trübner poolt Strasbourg’is (Lexis, 1875). Lisaks Lexisele kuulusid 19. sajandil Keiserliku Tartu Ülikooli professorite ridadesse veel mitmed tuntud teadurid: embrüoloogia rajaja Karl Ernst von Baer, füüsikali- se keemia alusepanija Wilhelm Ostwald, vere hüübimise fermentatiivse teooria ja vereülekande aluste väljatöötaja Alexander Schmidt ja teised (Tamul, i.a.) 9
Joonis 2: Ametisse määramise dokument 29. mai 1874. Allikas: Wilhelm Lexi- se isikutoimik, 1874. 10
Joonis 3: Wilhelm Lexise teose "Einleitung in die Theorie der Bevölkerung- statistik"(1875) tiitelleht. 11
2 Lexise diagramm 2.1 Lexise diagrammi kujunemisest Euroopas hakati 19. sajandil arutlema statistika teadusliku staatuse üle: üks leer, seal hulgas Wilhelm Lexis, pidas statistikat uurimismeetodiks, kuid mitte eraldi- seisvaks teadussuunaks. Teine grupp teadlasi nägi selles vaid massvaatluse kirjel- dust tabelkujul. Kolmas leer teadlasi kirjeldas statistikat kui statistilise meetodi doktriini. (De Gans ja van Poppel, 2000) Aastatel 1860–1910 toimus üleminek, mille käigus kasvas statistikast välja eraldi uurimisvaldkond: demograafia. Demograafid hakkasid otsima viise, kuidas suremus- kordajaid paremini arvutada ja rahvastikuprotsesse graafiliselt kujutada. (De Gans ja van Poppel, 2000) Esmalt kasutati rahvastikuandmete visualiseerimiseks horisosontaalset telge, mis kujutas kalendriaega. Iga indiviidi kohta oli teljel punkt, mis tähistas sündi ning punkt, mis tähistas surma. Elu pikkust kirjeldas kahe punkti vahele jääv intervall. Vaatluste arvu kasvades muutus selline graafik loetamatuks. (Vandeschrick, 1992) Zeuner (1869) oli üks esimesi, kes keskendus erinevate kohortide elude visualiseeri- misele. Graafiliste esituste baasil tuletas ta elulemusfunktsiooni V (x) = Z t2 t1 f (x, t) dt, mis väljendab ajavahemikus[t1, t2] sündinud indiviidide inimeste arvu, kes elavad vanuseni x. Funktsioonf (t, x) tähistas ellujääjate jaotust sünniaja ja vanuse järgi; f (t, 0) oli sünnikõver ningx → f (x, t) suremuskõver. Selle mudeli baasil töötas ta välja kolmemõõtmelise koordinaatsüsteemi, kus kaks horisontaalset telge tähistasid vanust ja sünniaega ning vertikaaltelg rahvastiku suurust (ellujäänud indiviidide arvu). (Keiding, 2011) Enne Lexise diagrammi avaldamist panustasid selle kujunemisse veel kaks sak- 12 sa demograaf-statistikut: Georg Friedrich Knapp (1842 − 1926) ja Karl Martin Ludwig Becker (1823 − 1896). Knapp oli esimene, kes uuris individuaalseid elu- aegade pikkusi. Diagrammil (joonis 4) tähistas horisontaaltelg kalendriaega, elu kujutati horisontaaljoonena, mille alguspunkt tähistas sünniaega ning lõpp-punkt surma. Elujooned asetsesid vertikaalselt üksteise kohal. Kuigi Knappi lähenemi- ne muutus elujooned nähtavamaks, siis polnud seesugune elujoonte järjestamine süsteemne ning indiviidide kasvades muutis diagramm samuti raskesti loetavaks. Kohordi suurus sõltus indiviidide arvust, seega ei olnud need selgelt eristatavad ja samuti oli vanust keeruline välja lugeda. (Vandeschrick, 1992) Joonis 4: Knappi esitatud versioon Lexise diagrammist. Allikas: Vandeschrick 1992, lk 1243. Becker oli esimene, kes kolm näitajat: kohort (sünnikohort), periood (kalendriaeg) ja vanus, ühendas. Vanus kasvas45−kraadise nurga all: suurenes ühe ühiku võrra iga ajas liigutud ühiku kohta. Kahe elujoone vaheline kaugus tähistas nende va- nusevahet: vanus = periood − kohort. Elu kulgeb horisontaalselt sünnist surmani. Vertikaalne joon (prisochrone) tähistas kalendripäeva ning vertikaalne “riba” ühte aastat. Beckeri väljapakutud diagramm (joonis 5) võimaldas sündmusi täpselt pai- gutada nende toimumise ja sünnikohordi või aja ja vanuse alusel. Seega olid kõik kolm mõjurit graafiliselt jälgitavad. (Vandeschrick, 1992) 13 Joonis 5: Beckeri 1874. aastal esitatud versioon. Allikas: Keiding 2011, lk 409. Lexis asetas oma versioonis (joonis 6) vanuse vertikaalteljele ning horisontaaltelg tähistas sünniaega. Indiviidi elujoon kulges vertikaalselt ja kasvas vanusega. Ka- lendriaeg ei olnud telgedel tähistatud, vaid jooksis implitsiitselt 135−kraadise nur- ga all vasakult paremale üles. Sellise paigutus võimaldas määrata indiviidi sün- niaastat ja vanust sündmuse toimumise ajal. Lexise eesmärk ei olnud indiviidide elujoonte ega rahvastiku uurimine; ta ei kasutanud otseselt elujooni nagu Becker või Knapp. Selle asemel keskendus ta kalendriaja, vanuse ja sünnikuupäeva –pea- miste demograafiliste näitajate graafilisele esitamisele. Beckeri ja Lexise versioonis tähistas elujoon täpset eluea pikkust. Erinevalt Beckeri versioonist ei võimalda- nud Lexise diagramm teha vahet kalendriajal Lexise versioonis oli keeruline jälgida sündmuste kulgu aastate lõikes. Lexis ei keskendunud rahvastikuprotsesside aren- gule vaid kolme demograafilise teguri visualisiseerimisele. (Vandeschrick, 1992) 14