• 研究报告 •
戴律1,2,汤子琛3,贾镇1,2,江丽2,赵传桐1,2,赵志远1,2,赵雯婷2,李彩霞1,2
1中国人民公安大学侦查学院,北京 100038
2公安部鉴定中心,北京 100038
3江苏师范大学生命科学学院,徐州 221116
Lv Dai1,2, Zichen Tang3, Zhen Jia1,2, Li Jiang2, Chuantong Zhao1,2, Zhiyuan Zhao1,2, Wenting Zhao2, Caixia Li1,2
1. School of Criminal Investigation, People’s Public Security University of China, Beijing 100038, China
2. Beijing Engineering Research Center of Crime Scene Evidence Examination, National Engineering Laboratory for Forensic Science, Institute of Forensic Science, Beijing 100038, China
3. School of Life Sciences, Jiangsu Normal University, Xuzhou, 221116, China
摘要:
近年来,法医遗传领域报道了多个包含不同数量单核苷酸多态性(single nucleotide polymorphism,SNP)的panel用于亲缘关系推断,但SNP位点数量对推断效能的影响及机器学习算法的应用缺乏系统探索。为此,本研究评估了SNP位点数量对亲缘关系推断效能的影响及机器学习方法对状态一致性(identity-by-state,IBS)算法的优化效果。首先,构建位点数量在15,476~20,838范围内的多个SNP panel,基于模拟家系评估似然比法和IBS算法在不同位点数量下的亲缘关系推断效能。在筛选出最优SNP panel后,利用真实家系进行验证,并进一步将IBS算法与机器学习方法结合以提升推断效能。结果显示,似然比法在六级和七级亲缘关系推断中的灵敏度与位点数量呈显著正相关。IBS算法四至七级亲缘关系推断的灵敏度虽然与位点数量呈显著正相关,但实际提升幅度有限(仅提升0.5%~2.2%)。基于上述结果,本研究确定了包含20,838个SNP位点的最优panel(21K panel)。21K panel基于似然比法可准确推断六级以内亲缘关系(六级亲缘关系推断灵敏度为93.65%);基于IBS算法可准确推断三级以内亲缘关系(三级亲缘关系推断灵敏度为86.79%)。IBS算法结合机器学习后,四级亲缘关系推断灵敏度从69.10%提升至87.66%,五级和六级亲缘关系推断灵敏度分别从38.03%和21.41%提升至48.75%和37.80%。