遗传 ›› 2005, Vol. 27 ›› Issue (4): 629-635.
孙奕钢;高 雷;张忠华;薛庆中
SUN Yi-Gang , GAO Lei , ZHANG Zhong-Hua , XUE Qing-Zhong
摘要: 在分析DNA序列复杂度、预测基因编码区和非编码的DNA边界识别等问题中,以熵为基础构造的离散量度量提供了一种强有力的工具。为改进寻找水稻基因编码与非编码区边界的效率,本文提出了两个新的离散量度量(α-KL离散量与α-Jensen-Shannon 离散量),根据密码子的GC含量对氨基酸对应密码子构建了粗粒化向量。 比较了融合Jensen-Shannon 离散量、Jensen-Renyi 离散量、α-KL离散量和α-Jensen-Shannon 离散量等不同向量所获得的精度,结果表明,在对水稻基因编码区‘终止子’的识别效率上,构建的密码子粗粒化向量融合新引进的度量方法比Bernaola等人的方法(2000)提高了4~5倍。
中图分类号: