单核苷酸多态性(single nucleotide polymorphism,SNP)具有突变率低、数量多、长度短等优势。从“金州杀手案”到“瑞典双尸案”,一系列冷案通过法医SNP系谱推断技术(forensic SNP genealogy inference,FSG)成功告破,展示了该技术在犯罪调查中的应用前景。然而,SNP位点数量对亲缘关系推断效能的影响以及机器学习算法能否进一步提升状态一致性(identity-by-state,IBS)算法的亲缘关系推断效能缺乏系统研究。
2026年2月12日,公安部物证鉴定中心李彩霞课题组在《遗传》杂志上发表了题为“SNP密度对亲缘关系推断效能的影响及IBS算法的机器学习优化”的研究论文。该研究系统评估了SNP位点数量(15,476~20,838个)对亲缘关系推断效能的影响,并将IBS算法与机器学习方法结合,旨在提升远亲缘关系的推断能力。


该研究主要包括3个部分内容:
(1)探究SNP位点数量的实际影响。该研究发现,似然比法在六至七级亲缘关系推断中的灵敏度与SNP位点数量呈显著正相关;IBS算法虽然也呈正相关,但实际提升幅度有限(仅0.5%~2.2%)。
(2)筛选兼顾效能与实用性的SNP panel。基于模拟家系和真实家系的双重验证,该研究确定了包含20,838个SNP位点的21K panel。该panel基于似然比法可准确推断六级以内亲缘关系,基于IBS算法可准确推断三级以内亲缘关系。
(3)机器学习提升IBS算法远亲推断能力。相比IBS算法,四级亲缘关系推断灵敏度从69.10%提升至87.66%,五级和六级亲缘关系推断灵敏度分别从38.03%和21.41%提升至48.75%和37.80%(如图所示)。

A:灵敏度;B:假阳性。***:P<0.001;**:P<0.01;*:P<0.05。
公安部物证鉴定中心李彩霞主任法医师与赵雯婷副主任法医师为文章共同通讯作者。中国人民公安大学硕士研究生戴律为第一作者。该研究得到了中央级公益性科研院所基本科研业务费专项资金、国家自然科学基金面上项目以及北京市科技新星计划的资助。
文章录用版链接:

《遗传》是由中国科学院遗传与发育生物学研究所和中国遗传学会共同主办、科学出版社出版的国家级学术期刊、中文核心期刊、中国精品科技期刊。1979年创刊,至今已有40多年历史,在国内遗传学和基因组学研究领域具有广泛的读者和较高的影响力,被国际和国内多家权威数据库收录,如PubMed、Medline、Scopus、CSTPCD、CSCD、中国知网、万方数据等,多次荣获“中国精品科技期刊”、“百种中国杰出学术期刊”和“中国国际影响力优秀学术期刊”等称号。
欢迎积极投稿!欢迎转发宣传!



