基于序列相似性和Z曲线方法重注释原核生物蛋白编码基因
|
刘硕, 曾志, 曾凡才, 杜萌泽
|
Comprehensive re-annotation of protein-coding genes for prokaryotic genomes by Z-curve and similarity-based methods
|
Liu Shuo, Zeng Zhi, Zeng Fancai, Du Mengze
|
|
表4 9个菌株的名称、NC序列号、基因组大小、基因总数和新注释基因的数目
|
Table 4 The names of nine strains, NC number, genome size, gene numbers and number of new genes
|
|
菌株 | NC序列号 | 基因组大小(bp) | 基因总数 | 新基因的数目 | 枯草芽孢杆菌(B. subtilis subsp. subtilis str. 168) | NC_000964 | 4215606 | 4175 | 52 | 金黄色葡萄球菌(S. aureus subsp. aureus NCTC 8325) | NC_007795 | 2821361 | 2767 | 61 | 酿脓链球菌(S. pyogenes SF370) | NC_002737 | 1852441 | 1696 | 104 | 流感嗜血杆菌(H. influenzae Rd KW20) | NC_000907 | 1830138 | 1610 | 123 | 嗜酸氧化亚铁硫杆菌(A. ferrooxidans ATCC 23270) | NC_011761 | 2982397 | 3147 | 143 | 大肠杆菌(E. coli str. K-12 substr. MG1655) | NC_000913 | 4641652 | 4140 | 246 | 脑膜炎奈瑟球菌(N. meningitidis MC58) | NC_003112 | 2272360 | 1953 | 279 | 炭疽芽孢杆菌(B. anthracis str. Ames) | NC_003997 | 5227293 | 5039 | 418 | 肠道沙门氏菌(S. enterica subsp. enterica serovar Typhi str. CT18) | NC_003198 | 4809037 | 4111 | 577 |
|
|
|