摘要:
Briefings in Bioinformatics | 单卵双生子全基因组变异检测流程系统评估
全基因组测序(whole-genome sequencing, WGS)是实现精准个体识别和遗传诊断的关键技术。然而,不同算法在检测小变异(如SNVs/INDELs)方面的灵敏度、特异性和计算资源需求存在显著差异,传统基准测试往往基于模拟数据或非极端样本,无法充分模拟真实世界中的挑战,如司法场景中区分高度相似的个体,或医学中追踪罕见突变。为应对上述挑战,司法部司法鉴定科学研究院与澳门大学合作研究,采用单卵双生子作为“极端情境”模型,对8种主流全基因组测序变异检测工作流程进行了系统性基准评估(2025年12月8日发表,doi: 10.1093/bib/bbaf652),这种模型能揭示算法在低频变异检测上的局限性,同时为大规模WGS应用提供优化指导,且后续可通过识别双生子间的突变热点和功能位点,为司法鉴定应用提供快速、精准且控制成本的流程参考。结果显示,DRAGEN比对结合BCFtools作为变异检测工具,在识别双生子间极低频差异变异时,兼具高灵敏度和高效率,是当前WGS大规模应用的性价比优选方案;而GATK HaplotypeCaller在准确率和召回率上表现最佳,但计算资源消耗明显偏高。尽管这项研究的结果尚不足以直接作为司法鉴定的可靠依据(因为它依赖于有限的高置信度“Ground Truth”位点,且未涉及大规模验证),但此研究为司法鉴定中识别并区分单卵双生子的突变热点及具体位点功能分析提供了重要参考,同时为罕见突变发现及高精度人群队列研究中选择变异检测工作流程提供了直接的指导原则。■推荐人:谭程月,邵宁一
Cell | 解析小孢子命运重编程机制
自20世纪60年代以来,育种学家致力于利用胁迫处理(如高温、饥饿培养等)诱导植物小孢子转变发育命运,从配子体途径重编程为胚胎发生途径,以获得单倍体植株。但胁迫处理如何改变小孢子细胞命运的分子机制仍不清楚。近期,武汉大学孙蒙祥教授团队联合湖北大学罗盼副教授团队在Cell杂志上发表了“Reprogramming of microspore fate via BBM-BAR1 for highly efficient in vivo haploid induction”的研究论文(2025年9月3日在线发表,doi: 10.1016/j.cell.2025.08.014)。该研究发现,在小孢子中特异性表达BABY BOOM(BBM)基因可以在原位未离体下诱导烟草和水稻小孢子细胞命运转变和胚胎发生。进一步研究鉴定到了BBM激活的雄核发育调控因子1 (BBM-activated Androgenesis Regulator 1,BAR1),BAR1的异位表达同样可以诱导小孢子的胚胎化进程。值得注意的是,BBM与BAR1均能替代胁迫处理,成功实现小孢子发育重编程并启动雄核发育。这项研究揭示了一个保守的BBM-BAR1雄核发育调控模块,阐明其驱动小孢子命运胚胎化的分子机制,摆脱了传统技术中对胁迫处理的依赖。该策略有望在多种植物包括难以诱导材料中实现高效单倍体诱导,为未来作物育种提供理论支撑。■推荐人:洪磊,王克剑
Nature | 全基因组测序构建乳腺癌基因组图谱
尽管基于乳腺癌基因组特征的靶向治疗与免疫治疗等新型方案已不断优化并应用于临床,但乳腺癌的复发与转移仍较为普遍,这凸显了深入解析其内在生物学机制的重要性与紧迫性。近期,美国加利福尼亚州圣地亚哥市 Inocras 公司Young Seok Ju实验室通过对1,364例具有详细临床注释的乳腺癌样本进行全基因组测序(whole-genome sequences,WGS)和转录组分析,构建了乳腺癌全基因组图谱(2025年12月3日在线发表,doi:10.1038/s41586-025-09812-3)。该研究鉴定出BCL11B、RREB1、RAF1及SPECC1为乳腺癌新型驱动基因;证实同源重组缺陷(homologous recombination deficiency,HRD)相关突变特征(如SBS3、ID6)可作为聚腺苷二磷酸核糖聚合酶(PARP)抑制剂的潜在生物标志物;揭示染色体内结构变异或通过增强子劫持机制激活ERBB2 等癌基因;提出治疗耐药与转移或与部分反复性基因融合相关;重建关键基因组区域拷贝数变异的时间演变轨迹,推测基因组不稳定性或在肿瘤确诊前数十年即已发生;并明确乳腺癌基因组数据具备转化为临床生物标志物的潜在价值。■推荐人:刘宇,韦涵文,李汉增
Nature | 中国台湾精准医学计划提出针对汉族人群的多基因风险评分模型
多基因风险评分(polygenic risk score, PRS)在疾病风险预测中展现出巨大潜力,但其在不同人群间的可转移性受限于遗传背景差异,导致在非欧洲人群中预测效能显著下降。针对这一问题,中国台湾精准医学计划的研究团队基于大规模东亚人群(特别是汉族)的基因组和表型数据,开发了面向汉族人群的群体特异性多基因风险评分模型(2025年10月15日在线发表,doi: 10.1038/s41586-025-09350-y)。该模型整合了来自中国台湾地区汉族人群队列的数据,显著提升了对冠心病、自身免疫疾病和癌症等常见复杂疾病的预测准确性。研究还揭示了汉族人群中特有的风险位点和遗传结构,为实现面向东亚人群的个性化疾病预防和早期干预提供了实用工具,标志着精准医学向人群公平性和临床实用性迈出了关键一步。■推荐人:刘帅,何顺民
Nature Biotechnology | 百万规模细菌/古细菌基因组的序列比对软件LexicMap
序列比对是生物学研究中最常用到的生物信息学操作之一,对于基因注释和进化分析都必不可少。然而,当前全球学者已经鉴定出超过两百万种细菌和古细菌的基因组序列,如何快速精准地查询和比对基因序列,为传统序列比对工具带来了前所未有的挑战。近日,《自然—生物技术》(Nature Biotechnology)杂志发表题为“Efficient sequence alignment against millions of prokaryotic genomes with LexicMap”的原创性研究论文,报道了支持百万规模细菌基因组的序列比对软件LexicMap (2025年9月10日在线发表,doi: 10.1038/s41587-025-02812-8)。在保持相当准确性的同时,LexicMap具有更快的速度、更低的内存占用和更高的可扩展性,可实现数分钟内完成对基因在如此巨大规模数据库中的查询。这将为流行病学、生态学、进化生物学等领域的研究提供有力支持。LexicMap的源代码和程序可在下面网址获取:https://bioinf.shenwei.me/LexicMap。■推荐人:崔庆华
Science| 转录的每一次出发都已经确定了终点
生物体的基因由外显子与内含子连接组成。在转录过程中,转录机器有选择性地保留内含子或删去外显子的过程称为可变剪切。长期以来,人们认为RNA聚合酶通过“机会窗口”模型来调控可变剪切,即对于每个内含子与外显子的选择是独立调控的。近期,美国马萨诸塞大学Athma A Pai团队与波士顿大学Ana Fiszbein团队合作,在Science发表了题为“mRNA initiation and termination are spatially coordinated”的研究论文(2025年10月9日发表,doi: 10.1126/science.ado8279),该研究提出了一种名为“位点起始-终止轴(PITA)”的调控模型。该模型认为,可变剪切的发生受到转录本起始与终止位点的共同调控,并且参与调控的起始与终止外显子在空间位置上存在耦合。研究团队通过dCas9-CRISPR干扰实验验证了受调控的mRNA对于5′端外显子的选择会直接影响3′端末端外显子的选择。PITA调控模型广泛存在于多组织与进化历程中,具有该模型调控的基因长度普遍更长,同时也与多种染色质特征相关联,例如在基因的转录起始位点区域具有更强的绝缘性,从而促进RNA聚合酶的高效延伸。该研究从转录动力学的角度,解释了转录速率参与调控起始与终止位点之间关联的机制。这一发现从全长转录本调控的角度,揭示了一种mRNA异构体形成的机制,这既是对传统模型的扩展也暗示基因结构本身蕴含了转录本命运的信息。■推荐人:邢千龙,张铧坤