siis ei pruugi olla õige jälgimiseelseid ja -aegseid juhtusid kokku võtta. Ülegenoomse analüüsi puhul võiks neid juhtusid seega esmalt analüüsida eraldi ja seejärel huvipakkuvate geenivariantide puhul testida erinevate mudelite hinnangute võrdsust. 57 Kokkuvõte Magistritöö eesmärk oli leida jälgimiseelsete ja jälgimisaegsete haigusjuhtude koos analüüsi miseks sobiv meetod, mis oleks rakendatav ülegenoomsetes seoseuuringutes. Peamiselt pakkus huvi see, kas jälgimiseelsete ja jälgimisaegsete juhtude analüüsimine eraldi vastavalt binaar se mudeli ja Coxi võrdeliste riskide mudeli abil ning seejärel hinnangute kombineerimine on parem, kui analüüsida kõiki haigusjuhtusid koos, kasutades ainult binaarset mudelit. Lisaks uuriti, kui hästi töötab Coxi mudeli lähendamiseks mõeldud martingaalijääkide meetod. Esmalt anti ülevaade biopankade andmete ja nendega seotud elektrooniliste terviseandmete analüüsimise eripäradest. Samuti kirjeldati erinevusi jälgimiseelsete ja jälgimisaegsete haigus juhtude vahel. Seejärel kirjutati elukestusandmete eripäradest ja nende analüüsimiseks rakenda tavast Coxi võrdeliste riskide mudelist ning kahest binaarse tunnuse analüüsimiseks kasutata vast meetodist: logistilisest ja täiend-log-log mudelist. Lisaks kirjeldati seoseid nende mudelite efektisuuruste vahel. Erinevate meetodite võrdlemiseks viidi läbi simulatsiooniuuring. Selle tarvis kirjeldati esmalt, kuidas genereerida Weibulli jaotusega võrdeliste riskide mudelile vastavaid elukestusandmeid. Samuti tuletati viis, leidmaks sobivad Weibulli jaotuse parameetrid kindlaksmääratud levimuse ja haigestumise mediaanvanusega haigestumisandmete simuleerimiseks. Neid teadmisi kasutati andmete simuleerimiseks ja analüüsimiseks kolme erineva stsenaariumi korral: 1. kõik haigus juhud on jälgimisaegsed, 2. osa juhtudest on jälgimiseelsed, osa jälgimisaegsed, 3. jälgimis eelseid ja jälgimisaegseid
juhtusid ei eristata. Simulatsiooniuuringu tulemusel selgus, et jälgimiseelsete ja jälgimisaegsete juhtude eraldi ana lüüsimine, kasutades vastavalt binaarset mudelit ning Coxi mudelit, ja sellele järgnev saadud hinnangute kombineerimine ei ole parem kui kõigi haigusjuhtude koos analüüsimine binaar se mudeliga. Samuti selgus, et täiend-log-log mudel hindab väga hästi andmete genereerimise aluseks olevaid riskimäärade suhteid. Ka nägime, et martingaalijääkide meetodi kasutamine on õigustatud, kui harvema alleeli sagedus on kõrge või efektisuurus ei ole palju erinev ühest. 58 Meetodeid rakendati Tartu Ülikooli Eesti Geenivaramu andmetel, uurimaks teist tüüpi diabee di seoseid SNP-dega, mis valiti välja viimase suurima teist tüüpi diabeedi transetnilise meta uuringu tulemustest. Esmalt nägime, et martingaalijääkide meetod töötab Coxi regressiooni lähendamiseks vaadeldud SNP-de korral hästi – selle hinnangud on väga lähedased Coxi mudeli hinnangutega. Samuti nägime, et erinevate mudelite puhul on tulemused sarnased ja keeruli sem meta-analüüsi meetod ei anna eelist lihtsa täiend-log-log mudeli kasutamise ees. Seega võiks ülegenoomsete seoseuuringute puhul jälgimiseelseid ja -aegseid haigusjuhtusid analüüsi da koos, kasutades selleks täiend-log-log mudelit.
59 Viited Ambos, A., Raie, E., Kiudma, T., Reppo, I., Rätsep, A., Tammiksaar, K., Toomsoo, T., ja Volke, V. (2016). 2. tüüpi diabeedi Eesti ravijuhend 2016. Eesti Arst, 95(7), 465–473. doi: 10.15157/ ea.v0i0.13016 American Diabetes Association. (2021). 2. Classification and diagnosis of diabetes: Standards of medical care in diabetes—2021. Diabetes Care, 44(Supplement 1),
S15–S33. doi: 10 .2337/dc21-S002 Bangdiwala, S. I. (2010). At odds with ratios. International Journal of Injury Control and Safety Promotion, 17(1), 73–76. doi: 10.1080/17457301003588229 Breslow, N. E. (1972). Contribution to Discussion on Professor Cox’s Paper. Journal of the Royal Statistical Society: Series B (Methodological), 34(2), 216–217. doi: 10.1111/j.2517 -6161.1972.tb00900.x Callas, P. W., Pastides, H., ja Hosmer, D. W. (1998). Empirical comparisons of proportional hazards, poisson, and logistic regression modeling of occupational cohort data. American Journal of Industrial Medicine, 33(1), 33–47. doi: 10.1002/(SICI)1097-0274(199801)33: 1<33::AID-AJIM5>3.0.CO;2-X Canchola, A., Stewart, S., Bernstein, L., West, D., Ross, R., Deapen, D., Pinder, R., Rey nolds, P., Wright, W., Anton-Culver, H., Peel, D., Ziogas, A., ja Horn-Ross, P. (2003). Cox regression using different time-scales. Kättesaadav: https://www.lexjansen.com/wuss/2003/ DataAnalysis/i-cox_time_scales.pdf Chang, C. C., Chow, C. C., Tellier, L. C., Vattikuti, S., Purcell, S. M., ja Lee, J. J. (2015). Second-generation PLINK: Rising to the challenge of larger and richer datasets. GigaScience, 4(1). doi: 10.1186/s13742-015-0047-8 Chung, W. K., Erion, K., Florez, J. C., Hattersley, A. T., Hivert, M. F., Lee, C. G., McCarthy, M. I., Nolan, J. J., Norris, J. M., Pearson, E. R., Philipson, L., McElvaine, A. T., Cefalu, W. T., 60 Rich, S. S., ja Franks, P. W. (2020). Precision medicine in diabetes: A consensus report from the american diabetes association (ada) and the european association for the study of diabetes (easd). Diabetes Care, 43(7), 1617–1635. doi: 10.2337/dci20-0022
Collett, D. (2015). Modelling Survival Data in Medical Research. New York, NY: Chapman and Hall/CRC. doi: 10.1201/b18041 Cox, D. R. (1972). Regression Models and Life-Tables. Journal of the Royal Statistical Society: Series B (Methodological), 34(2), 187-202. doi: 10.1111/j.2517-6161.1972.tb00899.x Cox, D. R. (1975). Partial likelihood. Biometrika, 62(2), 269–276. doi: 10.2307/2335362 Davies, H. T. O., Crombie, I. K., ja Tavakoli, M. (1998). When can odds ratios mislead? BMJ, 316(7136), 989–991. doi: 10.1136/bmj.316.7136.989 Efron, B. (1977). The efficiency of Cox’s likelihood function for censored data. Jour nal of the American Statistical Association, 72(359), 557–565. doi: 10.1080/01621459.1977 .10480613 Glass, G. V. (1976). Primary, Secondary, and Meta-Analysis of Research. Educational Rese archer, 5(10), 3. doi: 10.2307/1174772 Grambsch, P. M., ja Therneau, T. M. (1994). Proportional hazards tests and diagnostics based on weighted residuals. Biometrika, 81(3), 515. doi: 10.2307/2337123 Green, M. S., ja Symons, M. J. (1983). A comparison of the logistic risk function and the pro portional hazards model in prospective epidemiologic studies. Journal of Chronic Diseases, 36(10), 715–723. doi: 10.1016/0021-9681(83)90165-0 Hayes, B. (2013). Overview of statistical methods for genome-wide association studies (GWAS). Methods in Molecular Biology, 1019, 149–169. doi: 10.1007/978-1-62703-447 -0_6 Hong, E. P., ja Park, J. W. (2012). Sample size and statistical power calculation in genetic association studies. Genomics Informatics, 10(2), 117. doi:
10.5808/gi.2012.10.2.117 61 Ingram, D. D., Makuc, D. M., ja Feldman, J. J. (1997). Re: "Time-to-event analysis of longi tudinal follow-up of a survey: choice of the time-scale". American Journal of Epidemiology, 146(6), 528–529. doi: 10.1093/oxfordjournals.aje.a009309 Joshi, P. K., Fischer, K., Schraut, K. E., Campbell, H., Esko, T., ja Wilson, J. F. (2016). Variants near CHRNA3/5 and APOE have age-and sex-related effects on human lifespan. Nature Communications, 7(1), 1–7. doi: 10.1038/ncomms11174 Kalbfleisch, J. D., ja Prentice, R. L. (1973). Marginal likelihoods based on cox’s regression and life model. Biometrika, 60(2), 267. doi: 10.2307/2334538 Kalbfleisch, J. D., ja Prentice, R. L. (2002). The Statistical Analysis of Failure Time Data. Hoboken, NJ: John Wiley & Sons, Inc. doi: 10.1002/9781118032985 Klein, J. P., ja Moeschberger, M. L. (2003). Survival Analysis: Techniques for Censored and Truncated Data. New York, NY: Springer-Verlag New York. Kleinbaum, D. G., ja Klein, M. (2012). Survival Analysis. New York, NY: Springer New York. doi: 10.1007/978-1-4419-6646-9 Korn, E. L., Graubard, B. I., ja Midthune, D. (1997). Time-to-event analysis of longitudinal follow-up of a survey: Choice of the time-scale. American Journal of Epidemiology, 145(1), 72–80. doi: 10.1093/oxfordjournals.aje.a009034 Leffondré, K., Abrahamowicz, M., ja Siemiatycki, J. (2003). Evaluation of Cox’s model and lo gistic regression for matched case-control data with time-dependent covariates: A simulation study. Statistics in Medicine, 22(24), 3781–3794. doi: 10.1002/sim.1674 Leik, I. (2016). Mis on diabeet? Kättesaadav: https://www.haigekassa.ee/blogi/mis-diabeet
Loh, P. R., Tucker, G., Bulik-Sullivan, B. K., Vilhjálmsson, B. J., Finucane, H. K., Salem, R. M., Chasman, D. I., Ridker, P. M., Neale, B. M., Berger, B., Patterson, N., ja Price, A. L. (2015). Efficient Bayesian mixed-model analysis increases association power in large cohorts. Nature Genetics, 47(3), 284–290. doi: 10.1038/ng.3190 62 Mahajan, A., Spracklen, C. N., Zhang, W., Ng, M. C., Petty, L. E., Kitajima, H., Yu, G. Z., Rüeger, S., Speidel, L., Kim, Y. J., Horikoshi, M., Mercader, J. M., Taliun, D., Moon, S., Kwak, S. H., Robertson, N. R., Rayner, N. W., Loh, M., Kim, B. J., . . . Morris, A. P. (2020). Trans-ancestry genetic study of type 2 diabetes highlights the power of diverse populations for discovery and translation. medRxiv. doi: 10.1101/2020.09.22.20198937 Matlab optimization toolbox. (2021). (The MathWorks, Natick, MA, USA) Kättesaadav: https://se.mathworks.com/help/optim/ug/fsolve.html Maziarz, M., Liu, Y., Qin, J., ja Pfeiffer, R. M. (2019). Inference for case-control studies with incident and prevalent cases. Biometrics, 75(3), 842-852. doi: 10.1111/biom.13023 Mbatchou, J., Barnard, L., Backman, J., Marcketta, A., Kosmicki, J. A., Ziyatdinov, A., Benner, C., O’Dushlaine, C., Barber, M., Boutkov, B., Habegger, L., Ferreira, M., Baras, A., Reid, J., Abecasis, G., Maxwell, E., ja Marchini, J. (2020). Computationally efficient whole genome regression for quantitative and binary traits. bioRxiv. doi: 10.1101/2020.06.19.162354 Oleckno, W. A. (2008). Epidemiology: Concepts and Methods. Long Grove, IL: Waveland Press. Kättesaadav: https://books.google.ee/books?id=KXsbAAAAQBAJ Peto, R. (1972). Contribution to Discussion on Professor Cox’s Paper. Journal of the Royal Sta tistical Society: Series B (Methodological), 34(2), 205–207. doi:
10.1111/j.2517-6161.1972 .tb00900.x Pilling, L. C., Kuo, C. L., Sicinski, K., Tamosauskaite, J., Kuchel, G. A., Harries, L. W., Herd, P., Wallace, R., Ferrucci, L., ja Melzer, D. (2017). Human longevity: 25 genetic loci associated in 389,166 UK biobank participants. Aging, 9(12), 2504–2520. doi: 10.18632/aging.101334 Prasad, R. B., ja Groop, L. (2015). Genetics of type 2 diabetes-pitfalls and possibilities. Genes, 6(1), 87–123. doi: 10.3390/genes6010087 Purcell, S., Neale, B., Todd-Brown, K., Thomas, L., Ferreira, M. A. R., Bender, D., Maller, J., Sklar, P., de Bakker, P. I. W., Daly, M. J., ja Sham, P. C. (2007). PLINK: a tool set 63 for whole-genome association and population-based linkage analyses. American journal of human genetics, 81(3), 559–575. doi: 10.1086/519795 R Core Team. (2019). R: A language and environment for statistical computing. (R Foundation for Statistical Computing, Vienna, Austria) Kättesaadav: https://www.R-project.org/ Schoenfeld, D. (1982). Partial residuals for the proportional hazards regression model. Biomet rika, 69(1), 239. doi: 10.2307/2335876 Scott, R. A., Scott, L. J., Mägi, R., Marullo, L., Gaulton, K. J., Kaakinen, M., Pervjakova, N., Pers, T. H., Johnson, A. D., Eicher, J. D., Jackson, A. U., Ferreira, T., Lee, Y., Ma, C., Steint horsdottir, V., Thorleifsson, G., Qi, L., Van Zuydam, N. R., Mahajan, A., . . . Prokopenko, I. (2017). An expanded genome-wide association study of type 2 diabetes in europeans. Diabetes, 66(11), 2888–2902. doi: 10.2337/db16-1253 Staley, J. R., Jones, E., Kaptoge, S., Butterworth, A.Š., Sweeting, M. J., Wood, A. M.,
ja How son, J. M. M. (2017). A comparison of cox and logistic regression for use in genome-wide association studies of cohort and case-cohort design. European Journal of Human Genetics, 25(7), 854–862. doi: 10.1038/ejhg.2017.78 Sutradhar, R., ja Austin, P. C. (2018). Relative rates not relative risks: addressing a widespread misinterpretation of hazard ratios. Annals of Epidemiology, 28(1), 54–57. doi: 10.1016/j .annepidem.2017.10.014 Symons, M. J., ja Moore, D. T. (2002). Hazard rate ratio and prospective epidemiological studies. Journal of Clinical Epidemiology, 55(9), 893-899. doi: 10.1016/S0895-4356(02) 00443-2 Therneau, T. M. (2020). A Package for Survival Analysis in R. Kättesaadav: https://CRAN.R -project.org/package=survival Therneau, T. M., Crowson, C., ja Atkinson, E. (2021). Multi-state models and competing 64 risks. Vignette included in R package survival, version 3.2-11. Kättesaadav: https://CRAN.R -project.org/web/packages/survival/vignettes/compete.pdf Therneau, T. M., ja Grambsch, P. M. (2000). Modeling survival data: Extending the cox model. New York, NY: Springer New York. doi: 10.1007/978-1-4757-3294-8 Therneau, T. M., Grambsch, P. M., ja Fleming, T. R. (1990). Martingale-based residuals for survival models. Biometrika, 77(1), 147–160. doi: 10.1093/biomet/77.1.147 Thiébaut, A. C., ja Bénichou, J. (2004). Choice of time-scale in Cox’s model analysis of epidemiologic cohort data: A simulation study. Statistics in Medicine, 23(24),