资源与平台 栏目所有文章列表(按年度、期号倒序)
    一年内发表的文章 |  两年内 |  三年内 |  全部
Please wait a minute...
选择: 显示/隐藏图片
CNGBdb:国家基因库生命大数据平台
陈凤珍, 游丽金, 杨帆, 王丽娜, 郭学芹, 高飞, 华聪, 谈聪, 方林, 单日强, 曾文君, 王博, 王韧, 徐讯, 魏晓锋
遗传    2020, 42 (8): 799-809.   DOI: 10.16288/j.yczz.20-080
录用日期: 2020-06-01

摘要409)   HTML8)    PDF (573KB)(94)   

国家基因库生命大数据平台(China National GeneBank DataBase, CNGBdb)是一个致力于生命科学多组学数据归档和开放共享的数据库平台,是深圳国家基因库的核心功能“三库两平台”中生物信息数据库的对外服务平台,拥有深圳国家基因库丰富的样本资源、数据资源、合作项目资源和强大的数据计算和分析能力等优势。生命科学研究已经进入到了一个以高通量多组学数据为基础的大数据时代,迫切需要加强国际合作和信息共享。随着中国经济的发展和在生命科学研究领域的研究项目投入力度的加大,需要建立相关的生命大数据归档和共享的平台, 来促进我国生命科学研究项目中生成的基因组学数据的系统管理、开放共享与合理利用。目前,CNGBdb主要提供生命科学研究相关的数据归档、知识搜索、数据管理、数据计算和数据服务等服务。其归档和共享的数据类型,主要包括项目、样本、实验、测序、组装、变异、序列等。截止2020年5月22号, CNGBdb已接受了全球生命科学科研工作者提交的研究项目达2176个,归档的基因组学数据量超过2221 TB。未来,CNGBdb将继续推动生命科学研究多组学数据的开放共享和产业应用,完善基因组学数据的归档和共享功能,提升其服务生命科学数据开放共享的能力。CNGBdb的网址是:https://db.cngb.org/。

2019新型冠状病毒信息库
赵文明, 宋述慧, 陈梅丽, 邹东, 马利娜, 马英克, 李茹姣, 郝丽丽, 李翠萍, 田东梅, 唐碧霞, 王彦青, 朱军伟, 陈焕新, 章张, 薛勇彪, 鲍一明
遗传    2020, 42 (2): 212-221.   DOI: 10.16288/j.yczz.20-030
录用日期: 2020-02-08

摘要3094)   HTML117)    PDF (2093KB)(1701)   

2019年12月在中国武汉开始爆发的新型肺炎已造成全球25个国家/地区的31516人感染、638人死亡(截止2020年2月7日16时),引起该肺炎的病毒被世界卫生组织命名为2019新型冠状病毒(2019-nCoV)。为促进2019-nCoV数据共享应用并及时向全球公众提供病毒的相关信息,国家生物信息中心(CNCB)/国家基因组科学数据中心(NGDC)建立了2019新型冠状病毒信息库(2019nCoVR,https://bigd.big.ac.cn/ncov)。该信息库整合了来自德国全球流感病毒数据库、美国国家生物技术信息中心、深圳(国家)基因库、国家微生物科学数据中心及CNCB/NGDC等机构公开发布的2019-nCoV核苷酸和蛋白质序列数据、元信息、学术文献、新闻动态、科普文章等信息,开展了不同冠状病毒株的基因组序列变异分析并提供可视化展示。同时,2019nCoVR无缝对接CNCB/NGDC的相关数据库,提供新测序病毒株系的基因组原始测序数据、组装后序列的在线汇交、管理与共享、国际数据库同步发布等数据服务。本文对2019nCoVR数据汇交、管理、发布及使用等进行全面阐述,以方便用户了解该信息库各项功能及数据状况,为加速开展病毒的分类溯源、变异演化、快速检测、药物研发以及新型肺炎的精准预防与治疗等研究提供重要基础。

植物表型组学研究平台建设及技术应用
胡伟娟, 凌宏清, 傅向东
遗传    2019, 41 (11): 1060-1066.   DOI: 10.16288/j.yczz.19-277
录用日期: 2019-10-29

摘要416)   HTML11)    PDF (610KB)(436)   

随着许多重要作物及植物全基因组测序的完成,科研人员对高通量、精准、无损伤获取植物表型信息的需求日益增加,功能完善的研究设施将成为推动表型组学发展的加速器。在此背景下,中国科学院遗传与发育生物学研究所植物细胞与染色体工程国家重点实验室于2017年初建设了植物表型组学研究平台(Plant Phenomics Analysis Platform, PPAP)。目前,该平台已建设成为国内采集分析植物表型信息相对较全面的研究设施之一,集成可见光成像、红外成像、近红外成像、根系近红外成像、荧光成像、叶绿素荧光成像、高光谱成像及激光雷达成像8个数据采集单元。在此基础上,该平台同时建立了根系表型采集分析技术、穗部性状采集分析及抗逆性状采集分析技术体系等。植物表型组学研究平台是公共服务平台,致力于为国内外从事植物研究的科研人员提供各类表型采集分析服务,包括但不限于地上部表型分析、根系表型可视化及分析等。

从作物基因组分析到整合组学知识库建设
梁承志
遗传    2019, 41 (9): 875-882.   DOI: 10.16288/j.yczz.19-121
录用日期: 2019-08-26

摘要325)   HTML11)    PDF (772KB)(186)   

高通量技术的广泛应用使得各类组学数据的产出速度越来越快,由此产生的海量数据蕴藏着大量的基因组变异和相关功能信息。如何对这些数据进行深度整合和利用将会是一个长期而艰巨的任务,这需要具备高效的数据存储、分析和挖掘的能力。在过去几年中,本课题组通过与所内外课题组的合作,在多个植物的基因组的组装、注释、比较基因组和群体基因组分析等方面进行了探索,同时也将大量的水稻种质信息和组学数据进行了整合,存储于结构化数据库中并开发了一些相应的网络查询展示和数据挖掘工具。本文对相关的研究成果及其进展进行了概括性介绍,并展望了下一步的目标:构建一个用于支持作物功能基因组学和分子设计育种研究的整合组学知识库。

现代代谢组学平台建设及相关技术应用
张凤霞,王国栋
遗传    2019, 41 (9): 883-892.   DOI: 10.16288/j.yczz.19-122
录用日期: 2019-08-11

摘要361)   HTML8)    PDF (424KB)(2749)   

代谢组作为生命科学研究的5个层面(基因组、转录组、蛋白质组、代谢组和表型组)之一越来越受到科研工作者的关注。色谱-质谱联用技术由于其高分离能力、高灵敏度等优点在代谢组学(定性和定量)领域发挥重要的作用,基于色谱-质谱联用技术的代谢组学已成功应用于代谢表型差异研究、基因功能鉴定和转基因生物安全性评价等多个研究方向。本文以中国科学院遗传与发育生物学研究所代谢组学平台为例,详细介绍了现代代谢组学平台色谱-质谱联用仪器的硬件组成,以及不同技术平台在现在系统生物学研究中的具体应用。

中国人血红蛋白病突变数据集和临床辅助决策管理系统
张倩倩,张立,唐耀华,李厦戎,徐晓鹏,祁鸣,徐湘民
遗传    2019, 41 (8): 746-753.   DOI: 10.16288/j.yczz.19-136
录用日期: 2019-08-01

摘要219)   HTML5)    PDF (547KB)(301)   

个体基因组信息得益于大数据的积累,其应用不再局限于科学研究,正在经历逐步走向日常医疗实践的过程中。对疾病关联基因组信息的系统整理、归档及合理应用配置是未来精准医学的重要基础。血红蛋白病在我国南方发病率高,其分子病理学基础有明显的种族特异性。为助力我国南方血红蛋白病的临床诊断和遗传筛查的应用,本项目团队建立了中国人群血红蛋白病变异谱及表型谱LOVD基因变异数据管理系统,并通过设计全面整合和高效分析的在线辅助精确诊断及风险评估系统,展示了基于云端标准化的特定血红蛋白病变异注释库和诊断知识库辅助医生快速做出综合、全面的诊断和遗传咨询的操作。通过数据整合和人工智能技术的结合提高疾病临床决策效率的方法和经验,可为其他疾病的临床和预防应用起示范作用。

基于SSSL文库的水稻设计育种平台
张桂权
遗传    2019, 41 (8): 754-760.   DOI: 10.16288/j.yczz.19-105
录用日期: 2019-07-15

摘要365)   HTML7)    PDF (322KB)(147)   

“设计育种”是21世纪初提出的新概念,是指有目的地利用作物基因组中有利等位基因来设计并培育人们所需要的品种。在过去的20年中,本实验室制定了“三步走”的策略开展水稻设计育种研究,构建了基于染色体单片段代换系(single-segment substitution line, SSSL)文库的水稻设计育种平台,并在水稻设计育种上取得了初步的成效。基于SSSL平台开展水稻设计育种,能有效地利用SSSL文库的基因资源,设计并培育出各种各样的水稻新元件、新品系和新品种。本文详细介绍了水稻SSSL文库的构建以及利用该文库开展水稻设计育种的探索,以期为水稻乃至作物的设计育种提供参考。

国家基因库:共有、共为、共享
王博,刘芳,张二春,沃晨亮,陈振家,钱璞毅,卢浩荣,曾文君,陈泰,危金普,万仟,王韧,徐讯
遗传    2019, 41 (8): 761-772.   DOI: 10.16288/j.yczz.19-148
录用日期: 2019-08-05

摘要520)   HTML22)    PDF (567KB)(499)   

基因资源是国家的重要战略资源,保存、保护和合理利用基因资源将成为未来维护国家安全、打造核心竞争力的坚实基础和有效保障,然而我国在基因数据存储、样本存储等方面均起步较晚,无法满足国内日益增长的生命科学相关领域的研究发展需求。针对上述问题,2011年中国政府批复依托深圳华大生命科学研究院(原深圳华大基因研究院)建设我国首个读、写、存一体化的综合性生物遗传资源基因库——深圳国家基因库(亦称国家基因库)。本文总结了国内外较有影响力的基因资源大平台的发展概况,着重阐述了国家基因库的定位与使命,以及“三库两平台”的结构与功能——生物遗传资源的存储、读取、合成运用和开放共享。自2016年9月正式运行以来,国家基因库作为公益性、开放性、支撑性、引领性的战略性科技平台,已具备千万级可溯源样本存储能力,十万级基因组/年的存储和计算能力,建成首个国产化Pb (Petabases)级基因组数据产出平台以及千万碱基/年高效合成平台,同时基于自身平台能力,国家基因库建立了全面的开放共享机制,开展资源数据共享和公共平台服务,对生命科学研究和生物产业创新发展的支撑和助力初见成效。

中国人群参考基因组及基因组变异图谱资源库
宋述慧,滕徐菲,肖景发
遗传    2018, 40 (11): 1048-1054.   DOI: 10.16288/j.yczz.18-177
录用日期: 2018-09-11

摘要620)   HTML11)    PDF (465KB)(230)   

随着人类基因组计划和国际千人基因组计划的实施,已公开数百个中国人个体的全基因组数据。建立高精度的中国人群参考基因组序列,发现并解析中国人群特有的序列变异,是我国未来精准医学研究的基础。为满足未来精准医学研究中国人基因组数据持续增长的科学管理和深入研究的需求,中国科学院北京基因组研究所发展并建立了基于中国人群全基因组测序数据的虚拟中国人基因组数据库(Virtual Chinese Genome Database, VCGDB)和中国人群基因组变异数据库(Genome Variation Map, GVM),面向国内外用户提供数据检索、共享、下载和在线分析服务。本文重点介绍了这两个数据库的特点和功能,以及未来发展与应用前景,以期为中国人群参考基因组及基因组变异图谱资源库的推广使用、发展完善提供有益信息。

GSA:组学原始数据归档库
张思思,陈婷婷,朱军伟,周晴,陈旭,王彦青,赵文明
遗传    2018, 40 (11): 1044-1047.   DOI: 10.16288/j.yczz.18-178
录用日期: 2018-10-09

摘要566)   HTML9)    PDF (318KB)(128)   

生命科学的发展已进入组学大数据时代,然而我国至今尚未形成公共数据库存储体系。为弥补国内空白,组学原始数据归档库(Genome Sequence Archive, GSA, http://bigd.big.ac.cn/gsa)系统遵循国际核苷酸序列数据联盟(International Nucleotide Sequence Database Collaboration,INSDC)相关数据库建设标准,广泛收集各类生命组学原始数据。自2015年底上线运行以来,已获得了包括CellNaturePNASGPB等30余个国内外期刊的认可,收录的数据量呈显著增长趋势,提供的数据服务受到国内外广大科研人员的认可。GSA有效缓解了当前我国生命组学数据汇交、存储与共享困难的问题,为我国国家生物信息中心的建设奠定了坚实基础。本文对目前GSA数据汇交、审核、发布与管理等机制进行了深入阐述,以方便用户了解GSA的各项功能,提供更高效的数据服务。

生命与健康大数据中心资源
张源笙,夏琳,桑健,李漫,刘琳,李萌伟,牛广艺,曹佳宝,滕徐菲,周晴,章张
遗传    2018, 40 (11): 1039-1043.   DOI: 10.16288/j.yczz.18-190
录用日期: 2018-09-18

摘要829)   HTML11)    PDF (233KB)(223)   

生命与健康多组学数据是生命科学研究和生物医学技术发展的重要基础。然而,我国缺乏生物数据管理和共享平台,不但无法满足国内日益增长的生物医学及相关学科领域的研究发展需求,而且严重制约我国生物大数据整合共享与转化利用。鉴于此,中国科学院北京基因组研究所于2016年初成立生命与健康大数据中心(BIG Data Center, BIGD),围绕国家人口健康和重要战略生物资源,建立生物大数据管理平台和多组学数据资源体系。本文重点介绍BIGD的生命与健康大数据资源系统,主要包括组学原始数据归档库、基因组数据库、基因组变异数据库、基因表达数据库、甲基化数据库、生物信息工具库和生命科学维基知识库,提供生物大数据汇交、整合与共享服务,为促进我国生命科学数据管理、推动国家生物信息中心建设奠定重要基础。

国家斑马鱼资源中心的资源、技术和服务建设
熊凤,谢训卫,潘鲁媛,李阔宇,柳力月,张昀,李玲璐,孙永华
遗传    2018, 40 (8): 683-692.   DOI: 10.16288/j.yczz.18-151
录用日期: 2018-07-26

摘要421)   HTML4)    PDF (526KB)(176)   

随着我国斑马鱼研究群体的日益壮大,对各类斑马鱼研究资源和技术的需求日益增加,国家斑马鱼资源中心(China Zebrafish Resource Center, CZRC, 网址:http://zfish.cn)于2012年在中国科学院水生生物研究所成立。目前,CZRC已发展成为国内规模最大的单体斑马鱼养殖系统,建成包含1200多个斑马鱼品系和10 000余份冻存精子的斑马鱼资源保藏库,其中有超过200个突变和转基因品系是由CZRC自主创制。在此基础上,CZRC建立了安全规范的斑马鱼养殖和健康平台、高效的基因操作平台和稳定高效的精子冻存平台。CZRC致力于为国内外从事斑马鱼研究的科研人员提供各类服务,包括提供斑马鱼品系等资源服务、转基因和基因敲除等技术服务、养殖和健康等咨询服务,以及技术培训和学术会议服务等。经过5年的建设,CZRC已成为国际学术界公认的全球三大斑马鱼资源库之一。

肉鸡腹脂率双向选择系群体表型数据库(NEAUHLFPD)的设计及其功能实现
李敏,董翔宇,梁浩,冷丽,张慧,王守志,李辉,杜志强
遗传    2017, 39 (5): 430-437.   DOI: 10.16288/j.yczz.17-034
摘要546)   HTML6)    PDF (986KB)(606)   

表型性状的准确记录及其有效管理和分析是选育优良畜禽品种(系)工作的重要内容。东北农业大学肉鸡腹脂率双向选择系(Northeast Agricultural University High and Low Fat, NEAUHLF)经过20年的选育工作积累了大量与肉鸡脂肪沉积的分子遗传基础研究相关的表型数据。为了有效并系统地存储、管理和分析利用这些表型数据,本研究建立了东北农业大学肉鸡腹脂率双向选择系表型数据库(The NEAUHLF Phenome Database, NEAUHLFPD)管理系统。NEAUHLFPD主要涵盖以下表型记录和信息:1~19世代系谱记录和29项表型数据(分别为鸡体尺性状、体重性状、屠体性状及相应的率性状信息等)。该表型数据库的架构和设计过程具体如下:(1)架构信息。WEB服务器—Apache;数据库—MySQL;数据库管理工具—Navicat;用于动态交互性站点创建的服务器端脚本语言—PHP;超文本标记语言—HTML。(2)结构信息。主界面上有数据库整体组成及功能的详细介绍,以及数据库各部分基本结构的索引按钮。功能模块主要包含两方面内容:第一模块,表型(phenotype)数据的物理存储空间,可实现数据指标的选定、筛选、范围设定和查找等功能;第二模块,表型数据的基本描述性统计计算(descriptive statistics),可对条件筛选后的数据进行基本统计量的计算,同时还可实现对筛选数据的按条件排序等功能。NEAUHLFPD不仅能有效储存和管理表型数据,还可以兼容高通量基因组学数据,有利于今后进一步开展鸡脂肪组织生长发育的分子遗传基础研究以及推进低脂肉鸡的选育工作。

被引次数: Baidu(1)
中华民族永生细胞库在生命科学研究中的支撑作用
许崇凤,段子渊
遗传    2017, 39 (1): 75-86.   DOI: 10.16288/j.yczz.16-391
摘要482)   HTML3)    PDF (365KB)(1785)   

人类样品是生物医学研究必需的物质基础。B淋巴母细胞系(LCL)是利用Epstein-Barr(EB)病毒转化人的B细胞获得,制备简便,可以无限繁殖,是非常便捷的保存人类样品的形式。中华民族永生细胞库保藏有中国各个民族群体的LCL。目前,已经有详实的LCL的性质研究以及关于LCL的全基因组数据,因而, LCL已经广泛应用于遗传学、免疫学、药学基因组学、再生医学、癌症发生与免疫治疗、筛选制备全人单克隆中和抗体及EB病毒致病机理等研究领域。本文对LCL的特性以及LCL在上述研究领域中的应用进行了综述,最后对中华民族永生细胞库的保藏内容做了简单介绍,以促进广大科研人员进一步了解该细胞库的科研价值,充分发挥该库保藏资源在基础科学、生物医学研究中的科技支撑作用。