基于序列相似性和Z曲线方法重注释原核生物蛋白编码基因
刘硕, 曾志, 曾凡才, 杜萌泽

Comprehensive re-annotation of protein-coding genes for prokaryotic genomes by Z-curve and similarity-based methods
Liu Shuo, Zeng Zhi, Zeng Fancai, Du Mengze
表3 大肠杆菌(E.coli str. K-12 substr. MG1655)满足宽松阈值的新基因
Table 3 Newly annotated genes of E.coli str. K-12 substr. MG1655 under loose threshold
正/负链(在基因组上位置) 同源序列来源 功能 E 覆盖度
(%)
一致性
(%)
负链(190551~191603) 肠道沙门菌
(S. enterica subsp. enterica)
亮氨酸操纵子先导肽
(leu operon leader peptide)
8e-139 79 74.01
负链(2228549~2228758) 志贺氏菌属(Shigella) 多药耐药外膜蛋白MdtQ (multidrug
resistance outer membrane protein MdtQ)
1e-27 72 100
负链(4322661~4323281) 志贺氏菌属(Shigella) Pn转运体膜通道蛋白组分(membrane channel
protein component of Pn transporter)
4e-108 77 98.74
负链(4500432~4500791) 猪布鲁氏杆菌(Brucella suis) 磷酸乙醇胺转移酶(MULTISPECIES:
phosphoethanolamine transferase)
3e-45 69 91.57
正链(1465410~1467950) 宋内志贺菌(Shigella sonnei) 包含蛋白质的自转运体结构域
(autotransporter domain-containing protein)
0.0 74 87.03
正链(1470858~1474013) 福氏志贺氏菌
(Shigella flexneri)
自转运体外膜β管(MULTISPECIES:
autotransporter outer membrane beta-barrel)
0.0 76 100
正链(2070501~2071211) 双歧杆菌
(Bifidobacterium longum)
GTPase家族蛋白(GTPase family protein) 4e-129 77 99.45
正链(3993850~3994335) 痢疾志贺氏菌
(Shigella dysenteriae 1617)
CyaX蛋白(CyaX protein) 9e-67 63 96.12
负链(4506626~4506883) 红树杆菌属
(Mangrovibacter plantisponsor)
表皮粘着蛋白E
(surface-adhesin protein E)
1e-28 98 60