Transcriptomics
转录组学 (transcriptomics) 是对处于特定时间、特定发育阶段或某些特定的生理条件下的细胞、组织、器官或整个生物体的完整转录本的集合进行的全面分析。
—— Dinesh Yadav 等 《组学技术与生物工程》
转录组 Transcriptome
转录组(Transcriptome) 是单个或一组细胞中所有RNA转录本的集合,包括具有编码功能的和无编码功能的,有时也可以使用该术语指代所有RNA或仅指信使RNA(mRNA)。遗传信息在精密的调控下通过mRNA从DNA传递到蛋白质,因此mRNA被认为是DNA 与蛋白质之间生物信息传递的一个“桥梁”,而所有表达基因的身份以及其转录水平,综合起来被称作转录组。转录组是术语“转录本”和“基因组”的组合。 它与生物转录过程中转录产物的生产过程有关。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。
转录组测序(RNA-Seq)
转录组测序(RNA-Seq)是指利用第二代高通量测序技术进行cDNA测序,全面快速地获取某一物种特定器官或组织在某一状态下的几乎所有转录本。该技术能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点以及cSNP(编码序列单核苷酸多态性),提供更为全面的转录组信息。转录组分析的主要目标是:对所有的转录产物进行分类;确定基因的转录结构,如其起始位点,5′和3′末端,剪接模式和其他转录后修饰;并量化各转录本在发育过程中和不同条件下(如生理/病理)表达水平的变化
RNA-Seq的基本步骤: 提取样本总RNA后,根据所测RNA种类进行分离纯化。再进而片段化为所用测序平台所需的长度(或反转录后片段化), 基因在生物体内被转录,经过剪切后产生成熟的mRNA(红色)。提取mRNA后,经碎片化/片段化后反转录成稳定的ds-cDNA片段(蓝色)。反转录后连接测序接头。接着利用PCR扩增达到一定丰度上机测序,直到获得足够的序列。 使用高通量测序技术获得ds-cDNA序列。所得序列通过与参考基因组比对或从头组装(de novo assembly)形成全基因组范围的转录谱。这些数据可用于注释表达基因的位置及其相对表达水平等。
RNA-Seq数据处理
RNA-seq数据的生物信息学分析包括预分析,核心分析和进阶分析 (详见)。预分析(a) 包括实验设计,测序设计和质量控制步骤。质量控制包括对测序得到的原始数据的质量控制(序列质量、GC含量、接头序列、k-mers过多以及重复reads的分析等,以消除测序错误和PCR中产生的人为污染。) 、序列比对及mapping(可以map到已存在的基因组或者转录组上)、定量分析(GC含量、基因长度)、再现性分析(评估平行样本RNA数据集的再现性,排除实验批次误差)。核心分析(b)包括转录组分析,差异基因表达和功能分析。高级分析(c)包括可视化,其他RNA-seq技术和数据集成。