基于序列相似性和Z曲线方法重注释原核生物蛋白编码基因
刘硕, 曾志, 曾凡才, 杜萌泽

Comprehensive re-annotation of protein-coding genes for prokaryotic genomes by Z-curve and similarity-based methods
Liu Shuo, Zeng Zhi, Zeng Fancai, Du Mengze
表1 识别出过度注释的ORFs多于20的菌株基因组的信息
Table 1 The information of genomes with recognized over-annotated ORFs of more than 20
菌株 NC序列号 数量 菌株 NC序列号 数量
慢性型大豆根瘤菌(B. japonicum USDA 110) NC_004463 147 金黄色葡萄球菌
(S. aureus subsp. Aureus MW2)
NC_003923 36
哈氏弧菌(Vibrio harveyi ATCC BAA-1116) NC_009784 133 黑海甲烷袋状菌
(Methanoculleus marisnigri JR1)
NC_009051 34
大肠杆菌(E. coli CFT073) NC_004431 119 双叶钩端螺旋体血清型Patoc菌株
(Leptospira biflexa serovar Patoc strain 'Patoc 1)
NC_010602 34
织片草螺菌
(Herbaspirillum seropedicae SmR1)
NC_014323 109 拟杆菌属
(Bacteroides salanitronis DSM 18170)
NC_015164 34
结核分枝杆菌
(Mycobacterium tuberculosis CDC1551)
NC_002755 98 巴尔通体杆菌(Bartonella clarridgeiae 73) NC_014932 33
多形类杆菌
(Bacteroides thetaiotaomicron VPI-5482)
NC_004663 84 梅毒螺旋体梅毒亚种
(Treponema pallidum subsp. pallidum SS14)
NC_010741 32
鞘脂菌(Sphingobium japonicum UT26S) NC_014006 80 梅毒螺旋体
(Treponema paraluiscuniculi Cuniculi A)
NC_015714 32
生丝微菌属(Hyphomicrobium sp. MC1) NC_015717 70 鼠疫杆菌(Yersinia pestis CO92) NC_003143 31
长双歧杆菌(B. longum NCC2705) NC_004307 69 台湾贪铜菌
(Cupriavidus taiwanensis LMG 19424)
NC_010528 31
大肠杆菌(E. coli O157:H7 str. Sakai) NC_002695 55 噬纤维素菌属
(Cellulophaga algicola DSM 14237)
NC_014934 31
哈维弧菌(V. harveyi ATCC BAA-1116) NC_009783 53 结核分枝杆菌(M. tuberculosis H37Rv) NC_000962 30
溶血葡萄球菌(S. haemolyticus JCSC1435) NC_007168 51 沙漠自然球菌(Deinococcus deserti VCD115) NC_012526 30
缓纤维梭菌
(Clostridium lentocellum DSM 5427)
NC_015275 51 溃疡拟杆菌(Bacteroides helcogenes P 36-108) NC_014933 27
表皮葡萄球菌(S. epidermidis RP62A) NC_002976 47 金黄色葡萄球菌
(S. aureus subsp. Aureus Mu50)
NC_002758 26
鼠疫杆菌(Y. pestis KIM10+) NC_004088 46 金黄色葡萄球菌
(S. aureus subsp. Aureus N315)
NC_002745 25
海单孢菌属
(Marinomonas mediterranea MMB-1)
NC_015276 43 内脏臭气杆菌
(Odoribacter splanchnicus DSM 20712)
NC_015160 25
红球菌(Rhodococcus jostii RHA1) NC_008268 40 嗜热盐碱细菌
(Natranaerobius thermophilus JW/NM-WN-LF)
NC_010718 23
大肠杆菌(E. coli O157:H7 str. EDL933) NC_002655 39 圆柱杆菌(Teredinibacter turnerae T7901) NC_012997 23
固氮密螺旋体(T. azotonutricium ZAS-9) NC_015577 39 盐孢菌属(Salinispora tropica CNB-440) NC_009380 20
白蚁塞巴鲁德氏菌
(Sebaldella termitidis ATCC 33386)
NC_013517 38 巴西浮霉状菌
(Planctomyces brasiliensis DSM 5305)
NC_015174 20
金黄色葡萄球菌(S. aureus subsp.COL) NC_002951 37 苜蓿根瘤菌(Sinorhizobium meliloti AK83) NC_015590 20
肺炎衣原体
(Chlamydophila pneumoniae AR39)
NC_002179 36