基于序列相似性和Z曲线方法重注释原核生物蛋白编码基因
刘硕, 曾志, 曾凡才, 杜萌泽

Comprehensive re-annotation of protein-coding genes for prokaryotic genomes by Z-curve and similarity-based methods
Liu Shuo, Zeng Zhi, Zeng Fancai, Du Mengze
表4 9个菌株的名称、NC序列号、基因组大小、基因总数和新注释基因的数目
Table 4 The names of nine strains, NC number, genome size, gene numbers and number of new genes
菌株 NC序列号 基因组大小(bp) 基因总数 新基因的数目
枯草芽孢杆菌(B. subtilis subsp. subtilis str. 168) NC_000964 4215606 4175 52
金黄色葡萄球菌(S. aureus subsp. aureus NCTC 8325) NC_007795 2821361 2767 61
酿脓链球菌(S. pyogenes SF370) NC_002737 1852441 1696 104
流感嗜血杆菌(H. influenzae Rd KW20) NC_000907 1830138 1610 123
嗜酸氧化亚铁硫杆菌(A. ferrooxidans ATCC 23270) NC_011761 2982397 3147 143
大肠杆菌(E. coli str. K-12 substr. MG1655) NC_000913 4641652 4140 246
脑膜炎奈瑟球菌(N. meningitidis MC58) NC_003112 2272360 1953 279
炭疽芽孢杆菌(B. anthracis str. Ames) NC_003997 5227293 5039 418
肠道沙门氏菌(S. enterica subsp. enterica serovar Typhi str. CT18) NC_003198 4809037 4111 577