Magistrit%C3%B6%C3%B6%20Tuuli%20J%C3%BCrgenson.pdf.pdf

Type: Document | Status: ready

3803–3820. doi: 10.1002/sim.2098 Timmers, P. R., Wilson, J. F., Joshi, P. K., ja Deelen, J. (2020). Multivariate genomic scan implicates novel loci and haem metabolism in human ageing. Nature Communications, 11(1), 1–10. doi: 10.1038/s41467-020-17312-3 van der Net, J. B., Janssens, A. C. J., Eijkemans, M. J., Kastelein, J. J., Sijbrands, E. J., ja Steyerberg, E. W. (2008). Cox proportional hazards models have more statistical power than logistic regression models in cross-sectional genetic association studies. European Journal of Human Genetics, 16(9), 1111–1116. doi: 10.1038/ejhg.2008.59 Viechtbauer, W. (2010). Conducting meta-analyses in R with the metafor package. Journal of Statistical Software, 36(3), 1–48. doi: 10.18637/jss.v036.i03 Zemunik, T., ja Borask, V. (2011). Genetics of Type 1 Diabetes. In Type 1 diabetes - pathoge nesis, genetics and immunotherapy (pp. 529–548). InTech. doi: 10.5772/21880 Zhou, W., Nielsen, J. B., Fritsche, L. G., Dey, R., Gabrielsen, M. E., Wolford, B. N., LeFaive, J., VandeHaar, P., Gagliano, S. A., Gifford, A., Bastarache, L. A., Wei, W. Q., Denny, J. C., Lin, M., Hveem, K., Kang, H. M., Abecasis, G. R., Willer, C. J., ja Lee, S. (2018). Ef ficiently controlling for case-control imbalance and sample relatedness in large-scale genetic association studies. Nature Genetics, 50(9), 1335–1341. doi: 10.1038/s41588-018-0184-y 65 Lisad Lisa 1. Schoenfeldi jäägid Nagu nimigi ütleb, on Coxi võrdeliste riskide mudeli tähtsaks eelduseks see, et

riskimäärade suhe püsib ajas muutumatuna. Selle eelduse kontrollimiseks on võimalik kasutada Schoenfeldi jääke (Schoenfeld, 1982). Need erinevad klassikalistest jääkidest selle poolest, et igale vaatluse le arvutatakse mitu jääki – üks jääk iga argumenttunnuse kohta. Olgu meil n indiviidi põhjal hinnatud p argumenttunnusega Coxi mudel hi(t) = h0(t) exp(βTxi). Siis i-ndale (i = 1, . . . , n) indiviidile vastab p-mõõtmeline Schoenfeldi jääkide vektor kujul ( P l∈Rixl exp(βˆ Txl) ) sˆi = δi xi − P , l∈Riex p(βˆTxl ) kus δi on sündmuse toimumise indikaator, xi on i-nda indiviidi argumenttunnuste vektor ja Ri on hetkele ti vastav riskigrupp. Definitsioonist näeme, et Schoenfeldi jääk i-nda indiviidi j-nda (j = 1, . . . , p) argumenttunnuse xji jaoks on erinevus selle argumenttunnuse tegeliku väärtuse ja riskigrupi Ri kaalutud keskmise vahel, kus l-nda (l ∈ Ri) indiviidi kaaluks on exp(βˆTxl) P k∈Riexp( βˆTxk). Samuti paneme tähele, et tsenseeritud vaatluste jäägid on alati nullid, seega sageli loetakse tsenseeritud vaatluste Schoenfeldi jäägid lihtsalt puuduvateks väärtusteks. On näidatud, et praktikas on parem kasutada kaalutud Schoenfeldi jääke. Nende vektor on defi neeritud tavaliste Schoenfeldi jääkide kaudu järgmiselt: s∗ i = dvar(β ˆ)sˆi, 66

kus d on toimunud sündmuste arv ja var(β ˆ ) on hinnatud parameetrite β ˆ kovariatsioonimaatriks. On näidatud, et j-ndale argumenttunnusele vastava kaalutud Schoenfeldi jäägi korral kehtib E(s∗ ji) + βˆj ≈ βj (ti), kus βˆj on j-nda argumenttunnuse parameetri hinnang ja βj (ti) on j-nda argumenttunnuse ajas muutuva kordaja väärtus i-nda indiviidi sündmuse toimumise ajal (Grambsch ja Therneau, 1994). Tänu sellele on võimalik j-nda argumenttunnuse võrdeliste riskide eeldust kontrollida graafi kult, kuhu on kantud väärtused s∗ ji + βˆjja vaadeldud sündmuste toimumise ajad. Kui graafiku punktid paiknevad horisontaalselt, siis on j-nda argumenttunnuse kordaja ajas konstantne ja võrdeliste riskide eeldus selle tunnuse korral kehtib. Statistiline test, mis võimaldab kontrolli da võrdeliste riskide eelduse täidetust, testibki sellele graafikule sobitatud sirge tõusu erinevust nullist, R-is saab selle testi teha survival paketi funktsiooniga cox.zph. Lisa 2. Riski- ja üleelamisfunktsiooni hindamine See peatükk põhineb allikal (Collett, 2015: 107-116). Olgu meil vaatluse all n subjekti, kellest r-il toimus sündmus, ja ülejäänud n − r on paremalt tsenseeritud. Kui meil on hinnatud Coxi võrdeliste riskide mudel hi(t) = h0(t) exp(βTxi) ehk on olemas hinnang β ˆ, siis saab hinnata ka vastavad riski- ja üleelamisfunktsioonid. Riski funktsiooni hinnang i-ndale indiviidile avaldub kujul

hˆi(t) = hˆ0(t) exp(βˆTxi), (6) kus hˆ0(t) on hinnang baasriskifunktsioonile. Vaatame esmalt, kuidas leitakse hinnang hˆ0(t). 67 Olgu sündmuste toimumiste ajad järjestatud: t(1) 6 . . . 6 t(r). Tähistagu iga j = 1, . . . , r korral dj hetkel t(j)toimuvate sündmuste arvu, nj hetkel t(j) riskigrupis R(j) olevate indiviidide arvu ning olgu D(j) nende indiviidide hulk, kellel toimus sündmus hetkel t(j). Kalbfleisch ja Prentice (1973) tuletasid suurima tõepära meetodil baasriskifunktsiooni hinnan guks astmefunktsiooni: hˆ0(t) = 1 − αˆj t(j+1) − t(j), t(j) 6 t < t(j+1), j = 1, . . . , r −1, ja hˆ0(t) = 0, kui t < t(1), ning kus iga j = 1, . . . , r korral on αˆjlahend võrrandile X l∈D(j) exp(βˆTxl) 1 − αˆexp(β ˆTxl) j =X l∈R(j) exp(βˆTxl). (7) Suurust αˆj saab tõlgendada kui hinnangut tõenäosusele, et indiviid elab üle ajavahemiku hetkest t(j) kuni hetkeni t(j+1). Selle baasriskifunktsiooni hinnangu tuletamisel on tehtud eeldus, et järjestikuste sündmuste toimumiste aegade vahel on riskimäär konstantne. Kui kõik sündmuste toimumiste ajad on erinevad, siis koosneb iga j = 1, . . . , r korral D(j) ainult ühest vaatlusest ja võrrand (7) lahendub analüütiliselt: ( 1 −exp(βˆTx(j) ) )exp(−βˆTx(j)) αˆj = P , l∈R(j)exp(βˆT xl)

kus x(j) on selle indiviidi seletavate tunnuse vektor, kellel toimus sündmus hetkel t(j). Muudel juhtudel ehk võrdsete mittetsenseeritud aegade esinemisel tuleb võrrandi (7) lahendamiseks kasutada iteratiivseid meetodeid. Baas-üleelamisfunktsiooni hinnang avaldub αˆj kaudu järgmise astmefunktsioonina: Sˆ0(t) = Yk j=1 ja Sˆ0(t) = 1, kui t < t(1). αˆj, t(k) 6 t < t(k+ 1), k = 1, . . . , r − 1, 68 Märgime ka, et juhul kui seletavad tunnused puuduvad ja meil on andmed ainult vaatlusaegade kohta, siis võrrand (7) lihtsustub kujule dj/(1 −αˆj ) = nj, millest αˆj = 1 −

dj /nj ja vastav baasriskifunktsiooni hinnang hetkel t(j) on siis dj /nj ningüleelamisfunktsiooni hinnang on Y kj=1 1− dj nj , mis on tuntud Kaplan-Meieri hinnang üleelamisfunktsioonile. Kumulatiivse riskifunktsiooni ja üleelamisfunktsiooni omavahelise seose (2) kaudu saame ku mulatiivse baasriskifunktsiooni hinnanguks H ˆ0 (t) =−logS ˆ0 (t) =− X k j=1 jaH ˆ0 (t) = 0, kui t < t(1) . log ˆαj , t(k) 6t < t(k+1) , k= 1, . . . , r −1, Nüüd,kusbaasfunktsioonidehinnangudonolemas,saameleidavastavadhinnangud ka igale indiviidile. Integreerides võrduse (6) mõlemaid pooli, saame i-nda indiviidi kumulatiivse riski funktsiooni hinnanguks H ˆi (t) =H ˆ0 (t) exp(β ˆ T xi ), ja kasutades kumulatiivse riskifunktsiooni ning üleelamisfunktsiooni vahelist seost (1), saame, et hinnangi-nda indiviidi üleelamisfunktsioonileon S ˆi (t) = nS ˆ0 (t) oexp(β ˆ T xi ) , kust(k) 6t < t(k+1) , k= 1, . . . , r −1. Kui andmetes esineb võrdseid sündmuste toimumiste aegu, siis võrrandi (7) iteratiivse lahen damise asemel saab kasutada ka järgmist lähendamist: võrrandi (7) vasaku poole saab ümber 69kirjutada kujul X l∈ D(j) exp(β ˆ T xl ) 1− αˆ exp(βˆ T xl )j

Xl∈ D(j) ≈ X l∈ D(j)

Xl∈ D(j) exp(β ˆ T xl ) 1− exp(exp(β ˆ T xl ) log ˆαj ) ≈ exp(β ˆ T xl ) 1−(1 + exp(β ˆ T xl ) log ˆαj ) = 1−log ˆαj

=− dj log ˆαj , ja seega võrrandi (7) asemel lahendame log ˜αj

X − djl∈ R(j) millest ( exp(β ˆ T xl ),) α˜j = exp P−dj . l∈ R(j) exp(β ˆ T xl ) Seega baas-üleelamisfunktsiooni ja kumulatiivse baasriskifunktsiooni hinnangud saab iga t(k) 6 t < t(k+1), k = 1, . . . , r −1 jaoks kirja panna kujul vastavalt ) ja S˜0(t) = Yk j=1 α˜j =Yk j=1 exp ( −dj l∈R(j)exp(βˆ Txl) P H˜0(t) = −log S˜0(t) = Xk j=1 P dj l∈R(j)exp(βˆTxl). (8) Viimast hinnangut nimetatakse ka Breslow’ või Nelson-Aaleni hinnanguks kumulatiivsele baas riskifunktsioonile. 70 Lisa 3. Haigestumisandmete simuleerimine library(dplyr)

N - valimi suurus

MAF - harvema alleeli sagedus

HR - riskimäärade suhe

a, b - haigestumise vanuse Weibulli jaotuse baasparameetrid

sim _andmed = data.frame(g = rbinom(n = N, size = 2, prob = MAF)) %>% # genotüüp 0:AA,1:AB,2:BB mutate(sünniaeg = runif(n = n(), min = 1920, max = 1980), elukestus = rweibull(n = n(), shape = 9, scale = 90), # elukestus T ~ W(9, 90) b _g = b * ((exp(log(HR) * g)) ** (-1/a)), # genotüübist sõltuv skaalaparameeter b _g ,→haigestumise vanusele haigestumise _ vanus = rweibull(n = n(), shape = a, scale = b _g), # haigestumise vanus ,→H _ g ~ W(a, b _g) vaatlusvanus = pmin(haigestumise _vanus, elukestus), # vaatlusvanus on minimaalne ,→haigestumise vanusest ja elukestusest on _ juht = haigestumise _vanus == vaatlusvanus) # haigus on neil, kes haigestusid enne ,→surma

2. ja 3. stsenaariumi jaoks genereerime liitumisaja ja võtame arvesse katkestusaja sim

_ andmed2 = sim _andmed %>% mutate(liitumisvanus = runif(n(), 2000, 2020) - sünniaeg, vaatlusvanus = pmin(haigestumise _vanus, elukestus, 2050 - sünniaeg), # vaatlusvanus ,→on minimaalne haigestumise vanusest, elukestusest, ja vanusest katkestusajal on _ juht = haigestumise _vanus == vaatlusvanus) %>% # haigus on neil, kes haigestusid ,→enne surma ja katkestusaega filter(elukestus >= liitumisvanus) # jätame alles vaid need, kes elasid vähemalt liitumiseni 71 Lihtlitsents lõputöö reprodutseerimiseks ja üldsusele kättesaadavaks tegemiseks Mina, Tuuli Jürgenson, 1. annan Tartu Ülikoolile tasuta loa (lihtlitsentsi) minu loodud teose „Retrospektiivsete ja prospektiivsete andmete kombineerimine ülegenoomsetes seoseuuringutes“, mille juhen dajad on Anastassia Kolde, Krista Fischer ja Reedik Mägi, reprodutseerimiseks ees märgiga seda säilitada, sealhulgas lisada digitaalarhiivi DSpace kuni autoriõiguse keh tivuse lõppemiseni. 2. Annan Tartu Ülikoolile loa teha punktis 1 nimetatud teos üldsusele kättesaadavaks Tartu Ülikooli veebikeskkonna, sealhulgas digitaalarhiivi DSpace kaudu Creative Commonsi litsentsiga CC BY NC ND 3.0, mis lubab autorile viidates teost reprodutseerida, levitada ja üldsusele suunata ning keelab

luua tuletatud teost ja kasutada teost ärieesmärgil, kuni autoriõiguse kehtivuse lõppemiseni. 3. Olen teadlik, et punktides 1 ja 2 nimetatud õigused jäävad alles ka autorile. 4. Kinnitan, et lihtlitsentsi andmisega ei riku ma teiste isikute intellektuaalomandi ega isiku andmete kaitse õigusaktidest tulenevaid õigusi. Tuuli Jürgenson 25.05.2021 72

Page 8 of 8