CNGBdb:国家基因库生命大数据平台
|
陈凤珍, 游丽金, 杨帆, 王丽娜, 郭学芹, 高飞, 华聪, 谈聪, 方林, 单日强, 曾文君, 王博, 王韧, 徐讯, 魏晓锋
|
CNGBdb: China National GeneBank DataBase
|
Chen Fengzhen, You Lijin, Yang Fan, Wang Lina, Guo Xueqin, Gao Fei, Hua Cong, Tan Cong, Fang Lin, Shan Riqiang, Zeng Wenjun, Wang Bo, Wang Ren, Xu Xun, Wei Xiaofeng
|
|
表1 知识搜索服务数据
|
Table 1 Data of knowledge search service
|
|
数据类型 | 索引量(万) | 主要外源数据库 | 主要信息 | 文献 | 2947.19 | GigaScience、PubMed和Europe PMC | 文献标题、摘要、医学关键词、引用和参考文献和文献相关数据等 | 基因 | 2274.41 | NCBI Gene | 基因名称、染色体位置、基因产物和它的属性、基因所在的基因组、基因序列和基因变异等 | 变异 | 76323.01 | dbSNP[28]、dbVar和ClinVar[29] | 变异名称(HGVS名称)、基因组位置、相关物种、人群频率以及变异数据与疾病、表型和文献等 | 蛋白 | 13406.59 | Uniprot[30] | 蛋白名称、蛋白长度、物种和编码蛋白的基因等 | 序列 | 213665.12 | NCBI Refseq[31]和GenBank[8] | 序列名称、序列长度、物种和fastq序列文件等 | 项目 | 35.63 | NCBI BioProject[32] | 项目的名称、描述和数据类型等 | 样本 | 1007.36 | NCBI BioSample[8] | 样本的名称、物种、样本类型和描述等 | 实验 | 5515.46 | NCBI SRA[33] | 实验的题目、测序平台、文库构建策略、文库来源和文库选项等 | 组装 | 0.24 | NCBI Assembly[34] | 组装的名称、分子类型、测序技术和组装方法等 |
|
|
|