報 告 人:陳國波 副研究員
報告題目:大規模醫學遺傳數據分析與實踐
報告時間:2023年6月9日(周五)上午9:00
報告地點:靜遠樓1506
主辦單位:數學與統計學院、數學研究院、科學技術研究院
報告人簡介:
陳國波,2009年浙江大學數量遺傳學博士,2011~2015年澳大利亞昆士蘭大學大腦研究所博士后。2017年至今,浙江省人民醫院臨床醫學研究所副研究員。從事統計遺傳學研究,在Nature,Lancet,Am J Hum Genet,Hum Mol Genet,Bioinformatics,Mol Ecology等雜志發表論文40余篇,Google Scholar引用超3200次,H-index 19。
報告摘要:
醫學遺傳學數據逐漸涌現為數據挖掘與分析的重要場景,尤其DNA測序數據結合表型數據構成全基因組關聯分析(Genome-wide association studies,GWAS)的規范數據格式,直接可以作為各類醫學預測的數據源。但醫學數據和DNA數據受到隱私保護的各類限制,現實中很難直接使用或者交互,極大限制了數據體量的擴增。本研究采用隨機矩陣的計算框架,采用projection的方式,對基因型數據進行單向哈希加密,精準測算projection所需要的維度k與最終求解精度的量化關系,開發出適用于多方計算的encG-reg(encrypted genotype regression)。以兩份真實世界的UKBiobank的約50萬GWAS樣本以及中國本土6個基因組相關研究所的約6萬份GWAS樣本,展示了如何在多方計算下采用encG-reg完成醫學遺傳學數據的親屬鑒定,以及將要展開的進一步工作內容和數據分析層面的各類挑戰。