• 研究报告 •
杨琪1, 2,康克莱2,赵博3, 4,冯凯3, 4,冯耀森2,叶健1, 2,邓晔3, 4,王乐2
1. 中国人民公安大学,北京100038
2. 法医遗传学公安部重点实验室,公安部鉴定中心,北京100038
3. 中国科学院生态环境研究中心,中国科学院环境生物技术重点实验室,北京 100085
4. 中国科学院大学资源与环境学院,北京 100049
Qi Yang1,2, Kelai Kang2, Bo Zhao3, 4, Kai Feng3, 4, Yaosen Feng2, Jian Ye1, 2, Ye Deng3,4, Le Wang2
摘要: 灰尘中的微生物信息与地理位置密切相关,能为侦查破案提供线索,在法庭科学领域具有重要应用价值。然而,利用宏基因组数据集中微生物群落特征推断地理位置的可行性尚未得到充分探索。本研究从中国北部、东部、西南部和西北部四个具有明显地理和气候差异的城市中采集了170份城市住宅小区的环境灰尘样本,并对所有样本进行宏基因组鸟枪测序,以揭示微生物组成的差异。共注释获得41,029个物种,其中细菌占93.39%,真核生物占6.37%,并发现少量的病毒(0.21%)和古菌(0.03%)。结果表明,四个城市之间的微生物群落组成存在显著差异,这些差异可以实现四个城市环境样本的有效区分(R2 = 0.870,P<0.001)。通过过滤所有样本中检出率低于10%的物种,进一步提高了城市间的区分效果(R2 = 0.948,P<0.001),并筛选出127个具有城市代表性的差异物种。每个城市都拥有独特的微生物群落,包括特有物种和相对丰度较高的分类单元,这些特征共同构成了城市特有的微生物图谱。所有样本按7:3的比例随机分为训练集和测试集。通过SourceTracker、FEAST、LightGBM、随机森林(random forest)和支持向量机(support vector machine, SVM)五种机器学习模型对51个随机测试集来模拟预测未知来源的环境样本地理分区,平均准确率分别达到了88.89%、92.16%、98.04%、99.35%、69.28%。这些结果构成了中国四个城市的微生物遗传图谱,突出了不同城市微生物分类特征的显著差异,并为城市尺度的灰尘样本溯源提供了一种方法。