精子发生(Spermatogenesis) 是一高度复杂的过程, 包括有丝分裂、减数分裂和精子形成。精母细胞经过独特而广泛的染色质与表观遗传修饰重塑之后, 最终分化产生了具有特定表观遗传修饰的精子。最近研究表明, 成熟精子中的表观遗传修饰在发育的胚胎中发挥了重要作用, 其表观遗传模式的改变会导致某些疾病风险提高, 如受精失败、胚胎发生机能障碍、早产、出生体重低、先天畸形、新生儿死亡以及其他在辅助生殖技术后代中发现的发生频率较高的妊娠相关并发症。文章通过评价成熟精子中DNA甲基化、保留组蛋白修饰、RNAs和精蛋白等表观遗传修饰的重要意义及其在胚胎发育过程中的潜在作用, 阐述了成熟精子中改变的表观遗传修饰与相关疾病之间的关系, 为不育症的防治、精子表观遗传质量评价以及降低辅助生殖技术后代表观遗传疾病风险等提供基础资料。
生物学通路被广泛应用于基因功能学研究, 但现有的生物学通路知识并不完善, 仍需进一步扩充。生物信息学预测为通路扩充提供了一种有效且经济的途径。文章提出了一种融合蛋白质-蛋白质互作知识以及Gene Ontology(GO)数据库信息进行基因通路预测的新方法。首先选取目标基因在蛋白质-蛋白质互作层面上的邻居所在的Kyoto Encyclopedia of Genes and Genomes(KEGG)通路为候选通路, 然后通过检验候选通路中的基因是否在与目标基因关联的GO节点富集来判断目标基因的通路归属。分别利用Human Protein Reference Database (HPRD)和Biological General Repository for Interaction Datasets(BioGRID)数据库中的蛋白质-蛋白质互作信息进行预测。结果表明, 在两套数据中, 随着互作邻居个数的增加, 预测的平均准确率(在所有目标基因注释的通路中被成功预测的比例)及相对准确率(在至少有一个注释通路被成功预测的基因集中, 所有注释通路均被预测正确的基因所占的比例)均呈现上升趋势。当互作邻居个数达到22时, 预测的平均准确率分别达到96.2%(HPRD)和96.3%(BioGRID), 而相对准确率分别为93.3%(HPRD)和84.1%(BioGRID)。进一步利用新版数据库对旧版数据库中被更新的89个基因进行验证, 至少有一个更新通路被预测正确的基因有50个, 其中43个基因的更新通路被完全正确预测, 相对准确率为86.0%。这些结果显示该方法是一种可靠且有效的通路扩充方法。
常染色体显性脊髓小脑型共济失调(Autosomal dominant spinocerebellar ataxias, ADCAs)是一种神经系统退行性疾病, 具有高度的遗传异质性, 其中脊髓小脑型共济失调3型(Spinocerebellar ataxias type 3, SCA3)是一种常见的类型。文章通过PCR扩增广西一个脊髓小脑共济失调家系SCA3/MJD基因片段, 用毛细管电泳和测序方法检测了SCA3/MJD基因的CAG重复序列大小、传递特点以及SCA3/MJD基因的变异。结果显示:家系的所有4名患者和3名无症状携带者(Asymptomatic carrier)的SCA3/MJD基因第10外显子中存在异常扩增的CAG重复序列, 重复次数为64~71次; CAG重复次数在具有cgg等位基因的正常个体间传递时保持不变, 提示cgg等位基因不是正常个体两代间CAG重复序列稳定性的影响因素。SCA3/MJD基因中另有两个单碱基点突变, 一个是内含子区的杂合性突变(IVS9-113 T>C), 另一个是外显子区域的错义突变(220 G>A, 220 Glu>Gly)。这两个点突变为首次报道, 但尚不能明确这两个新的点突变对SCA3表型的影响。
MicroRNA是一类内源性的非编码小分子RNA, 通过下调蛋白编码基因的表达而对不同的细胞发育过程起到重要的调控作用。分析组织或细胞样本中microRNA的表达可为研究这类分子的生物学功能提供重要的信息。近年来, 研究者发展了许多方法检测不同的生理和病理学过程中microRNA的表达差异, 并发现microRNA的异常表达与癌症、神经紊乱和心脏疾病等的发生相关。文章系统地介绍了最新发展的microRNA定量检测方法, 详细阐述了基于探针杂交技术的Northern blotting法、微阵列芯片法、纳米金标记法、桥连同位素标记法, 以及基于扩增技术的定量PCR检测法、滚环扩增法、引物入侵法和新一代大规模高通量测序法等, 并对这些方法的优缺点进行了分析比较。
By using genome in situ hybridization (GISH) on root somatic chromosomes of allotetraploid derived from the cross Gossypium arboreum × G. bickii with genomic DNA (gDNA) of G. bickii as a probe, two sets of chromosomes, consisting of 26 chromosomes each, were easily distinguished from each other by their distinctive hybridization signals. GISH analysis directly proved that the hybrid G.arboreum×G. bickii is an allotetraploid amphiploid. The karyotype formula of the species was 2n = 4x = 52 = 46m (4sat) + 6sm (4sat). We identified four pairs of satellites with two pairs in each sub-genome. FISH analysis using 45S rDNA as a probe showed that the cross G. arboreum×G. bickii contained 14 NORs. At least five pairs of chromosomes in the G sub-genome showed double hybridization (red and blue) in their long arms, which indicates that chromatin introgression from the A sub-genome had occurred.
高通量的基因型分析和芯片技术的发展使人们能够进一步研究哪些遗传差异最终影响基因的表达。通过表达数量性状座位(eQTL)作图方法可对基因表达水平的遗传基础进行解析。与传统的QTL分析方法一样, eQTL的主要目标是鉴别表达性状座位所在的染色体区域。但由于表达谱数据成千上万, 而传统的QTL分析方法最多分析几十个性状, 因此需要考虑这类实验设计的特点以及统计分析方法。本文详细介绍了eQTL定位过程及其研究方法, 重点从个体选择、基因芯片实验设计、基因表达数据的获得与标准化、作图方法及结果分析等方面进行了综述, 指出了当前eQTL研究存在的问题和局限性。最后介绍了eQTL研究在估计基因表达遗传率、挖掘候选基因、构建基因调控网络、理解基因间及基因与环境的互作的应用进展。
表观遗传学是研究基因表达发生了可遗传的改变, 而DNA序列不发生改变的一门生物学分支, 对细胞的生长分化及肿瘤的发生发展至关重要。表观遗传学的主要机制包括DNA甲基化、组蛋白修饰及新近发现的非编码RNA。非编码RNA 是指不能翻译为蛋白的功能性RNA分子, 其中常见的具调控作用的非编码RNA包括小干涉RNA、miRNA、piRNA 以及长链非编码RNA。近年来大量研究表明非编码RNA在表观遗传学的调控中扮演了越来越重要的角色。文章综述了近年来生物细胞非编码RNA调控的表观遗传学研究进展, 以有助于理解哺乳动物细胞中非编码RNA及其调控机制和功能。
DNA甲基化是一种在原核和真核生物基因组中常见的复制后修饰, 参与体内多种重要生理过程, 主要包括:调节基因表达, 基因印记, 维持染色体完整性以及X-染色体灭活等。依据结构和功能的不同, 哺乳动物中DNA甲基转移酶(Dnmts)主要分为两大类: DNA甲基化维持酶Dnmt1以及DNA从头甲基化酶Dnmt3a、, Dnmt3b和Dnmt3L等。此外, Dnmt2也具有弱的DNA甲基转移酶活性, 近年来发现它可以甲基化tRNAAsp反密码子环处38C。这些Dnmts对于哺乳动物的生长发育是十分重要的, 它们的功能异常将导致胚胎发育障碍, 癌症等多种疾病。因此, Dnmts可能成为一个重要的分子靶标, 在疾病的治疗和预防中发挥重要作用。文章就Dnmts的分类、功能以及研究进展进行综述。
CRISPR/Cas系统广泛存在于细菌及古生菌中, 是机体长期进化形成的RNA指导的降解入侵病毒或噬菌体DNA的适应性免疫系统。对Ⅱ型CRISPR/Cas系统的改造使其成为继锌指核酸酶(ZFNs)和TALE核酸酶(TALENs)以来的另一种对基因组进行高效定点修饰的新技术, 与ZFNs和TALENs相比, CRISPR/Cas系统更简单, 并且更容易操作。文章重点介绍了Ⅱ型CRISPR/Cas系统的基本结构、作用原理及这一技术在基因组定点修饰中的应用, 剖析了该技术可能存在的问题, 展望了CRISPR/Cas系统的应用前景, 为开展这一领域的研究工作提供参考。
Restriction-site associated DNA sequencing(RAD-seq)技术是在二代测序基础上发展起来的一项基于全基因组酶切位点的简化基因组测序技术。该方法技术流程简单, 不受有无参考基因组的限制, 可大大简化基因组的复杂性, 减少实验费用, 通过一次测序就可以获得数以万计的多态性标记。目前, RAD-seq技术已成功应用于超高密度遗传图谱的构建、重要性状的精细定位、辅助基因组序列组装、群体基因组学以及系统发生学等基因组研究热点领域。文章主要介绍了RAD-seq的技术原理、技术发展及其在基因组研究中的广泛应用。鉴于RAD-seq方法的独特性, 该技术必将在复杂基因组研究领域具有广泛的应用前景。
高通量测序技术的发展衍生出一系列微生物组(microbiome)研究技术,如扩增子、宏基因组、宏转录组等,快速推动了微生物组领域的发展。微生物组数据分析涉及的基础知识、软件和数据库较多,对于同领域研究者开展学习和选择合适的分析方法具有一定困难。本文系统概述了微生物组数据分析的基本思想和基础知识,详细总结比较了扩增子和宏基因组分析中的常用软件和数据库,并对高通量数据下游分析中常用的几种方法,包括统计和可视化、网络分析、进化分析、机器学习和关联分析等,从可用性、软件选择以及应用等几个方面进行了概述。本文拟通过对当前微生物组主流分析方法的整理和总结,为同领域研究者更方便、灵活的开展数据分析,快速选择研究分析工具,高效挖掘数据背后的生物学意义提供参考,进一步推动微生物组研究在生物学领域的发展。
组蛋白共价修饰作为表观遗传修饰的重要部分, 主要包括乙酰化和甲酰化、甲基化、磷酸化、泛素化和SUMO化等, 它们形成一个复杂的网络共同调控基因的表达, 其中组蛋白甲基化修饰成为研究的热点, 甲基化主要发生在赖氨酸残基上。近年来, 随着有关植物组蛋白赖氨酸甲基化修饰研究的不断深入, 发现其通过改变自身赖氨酸残基的甲基化状态和甲基化程度, 形成转录激活或者转录抑制标记, 调控基因的表达, 在植物开花和逆境胁迫的响应过程中起着至关重要的作用。H3组蛋白的赖氨酸甲基化修饰能够调控FLC基因和有关抗性基因的表达, 具体表现为:H3K4的三甲基化促进FLC的表达, H3K27的三甲基化则抑制FLC的表达; H3K4me3作为转录激活标记, 可激活PtdIns5P基因的表达, 启动响应干旱的脂质合成信号通路, 响应干旱胁迫; 相反, H3K27me3作为一种转录抑制标记, 低水平的H3K27me3诱导COR15A和ATGOLS3基因表达, 它们分别编码叶绿体低温保护蛋白Cor15am和肌醇半乳糖合成酶GOLS, 以抵抗寒冷胁迫。文章主要综述了植物组蛋白赖氨酸甲基化修饰参与DNA甲基化、开花过程以及应答逆境胁迫的分子机制。
发现和正确解读疾病相关突变是遗传病分子诊断和临床指导的关键。尽管二代测序技术的应用显著改善了突变检测效率,但解读突变的生物学效应仍然存在挑战。目前对基因检测结果的解读更多地关注突变对蛋白质结构和功能的影响,而忽视了基因变异对RNA剪接的影响。越来越多的证据显示引起RNA剪接异常的基因变异在疾病发生中发挥重要作用。本文对影响RNA剪接的主要突变类型和确认方法进行介绍,以期为准确判断突变的遗传效应提供参考。
2005年, Science杂志首次报道了有关人类年龄相关性黄斑变性的全基因组关联研究, 此后有关肥胖、2型糖尿病、冠心病、阿尔茨海默病等一系列复杂疾病的全基因组关联研究被陆续报道, 这一阶段被称为人类全基因组关联研究的第一次浪潮。文章分别介绍了全基因组关联研究统计分析的方法、软件和应用实例; 比较了关联分析中多重检验的P值调整方法, 包括Bonferroni、递减的Bonferroni校正法、模拟运算法和控制错误发现率的方法; 还讨论了人群混杂对关联分析结果可能产生的影响及原理, 以及全基因组关联研究中控制人群混杂的方法的研究进展和应用实例。在全基因组关联研究的第一次浪潮中, 应用经典的遗传统计方法发现了许多基因-表型之间的关联并且能够对这些关联做出解释, 其中包括许多基因组中的未知基因和染色体区域。然而, 全基因组关联研究的继续发展需要进一步阐述基因组内基因之间相互作用、基因-基因之间的复杂作用网络与环境因素的相互作用在复杂疾病发生中的作用, 现有的统计分析方法肯定不能满足需要, 开发更为高级的统计分析方法势在必行。最后, 文章还给出了全基因组关联研究统计分析软件的相关网站信息。
RNA干扰(RNA interference, RNAi) 是生物界普遍存在的一种抵御外来基因和病毒感染的保守进化机制, 其本质是siRNA与靶向mRNA特异结合、并由RISC介导其降解, 从而阻止mRNA的翻译, 导致基因沉默。因此, RNAi可以作为基因功能研究、基因治疗等的新工具。但是, 随机设计的siRNA之间沉默效应差别很大。如何针对靶基因设计特异、高效的siRNA就成了一个关键的问题。文章对siRNA设计原则的研究进展进行了总结论述。
表观遗传学是指基于非基因序列改变所致基因表达水平的变化, 如DNA甲基化和组蛋白修饰等; 表观基因组学则是在基因组水平上对表观遗传学改变的研究。DNA甲基化已经成为表观遗传学和表观基因组学的重要研究内容, 人类表观基因组计划的最终目标是绘制出人类基因组中甲基化可变位点图谱。随着研究的不断深入, 各种研究方法被开发出来以满足不同类型研究的需要。文章主要介绍目前已有的表观基因组学研究方法, 并对其进行简要分析和总结。
Polycomb group (PcG) 蛋白是一组通过染色质修饰调控靶基因的转录抑制子, 从生化和功能上它可以分成两个主要的核心蛋白复合体PRC1(Polycomb repressive complex 1)和PRC2(Polycomb repressive complex 2)。研究发现PcG蛋白不仅控制个体正确的发育模式, 而且与细胞的增殖、分化和肿瘤发生有关。文章就PcG蛋白的组成、作用机制及功能进行综述, 并对PcG未来的研究方向进行展望。
染色质免疫沉淀(Chromatin immunoprecipitaion, ChIP)技术是分析细胞内生理状态下DNA结合蛋白与基因组DNA相互作用的技术。ChIP与高密度芯片(ChIP-chip)或高通量测序(ChIP-Seq)相结合能产生大量的研究数据, 在细胞的基因表达调控网络研究中发挥重要作用。文章主要介绍ChIP、ChIP-chip和ChIP-Seq的技术特点以及发展趋势, 重点讨论了ChIP-Seq数据分析方法及相关的应用实例。