%A 肖鹏,李仁辉 %T 基于蓝藻全基因组原始数据的转座元件挖掘及组成分析 %0 Journal Article %D 2011 %J 遗传 %R 10.3724/SP.J.1005.2011.00654 %P 654-660 %V 33 %N 6 %U {http://www.chinagene.cn/CN/abstract/article_2311.shtml} %8 2011-06-20 %X 二代测序技术及全基因组多样性比较是现代生物学及信息科学研究的热点, 对基因组中转座元件(Transposable element) 的分析已成为基因组比较分析的重要组成部分。目前对于转座元件的种类、数量和组成的挖掘和分析一般是基于完全拼接后的全基因组序列, 对在此之前的海量短片段序列后期处理及拼接仍是目前基因组研究的盲点, 以转座元件为主的重复序列在拼接过程中也存在着不可避免的拼接误差或丢失, 给转座元件系统的分析带来不确定。文章旨在建立一套分析流程, 对铜绿微囊藻NIES 843全基因组构建的罗氏(Roche)公司454测序随机模拟原始数据集的转座元件(主要类型为插入序列: Insert sequence, IS)组成进行分析, 结果表明, 采用对核酸探针扫描后备选序列分成3组, 并分设氨基酸检测阈值的方案分析得到的结果较为可靠, 结果显示铜绿微囊藻NIES843的蓝藻转座元件占基因组比例的10.38%, 归属于14个IS家族, 66个IS亚家族。与之前基于完整拼接基因组数据的两套不同分析流程得到的结果相比, 在丰度及家族/亚家族组成上无显著差异, 在转座元件序列水平上也显示了高比例的相似性序列重叠, 证实了本研究流程在基于高通量测序原始数据的转座元件分析方面具可靠性及实用性。