%A 赵小蕾, 左晓宇, 覃继恒, 梁岩, 张乃尊, 栾奕昭, 饶绍奇 %T 基于蛋白质互作知识的生物学通路扩充新方法 %0 Journal Article %D 2014 %J 遗传 %R 10.3724/SP.J.1005.2014.0387 %P 387-394 %V 36 %N 4 %U {http://www.chinagene.cn/CN/abstract/article_2824.shtml} %8 2014-04-20 %X

生物学通路被广泛应用于基因功能学研究, 但现有的生物学通路知识并不完善, 仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质-蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质-蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路, 然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database (HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质-蛋白质互作信息进行预测。结果表明, 在两套数据中, 随着互作邻居个数的增加, 预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中, 所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时, 预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID), 而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证, 至少有一个更新通路被预测正确的基因有50个, 其中43个基因的更新通路被完全正确预测, 相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。