1、什么是RNA-seq 即转录组测序技术,就是把mRNA、smallRNAand Non-coding RNA等或者其中一些用高通量测序技术把它们的序列测出来。
2、先 认识两个概念 转录组:在特定发育时期或特定生理条件下,生物细胞DNA转录后所产生的mRNA、non-coding RNA和smallRNA的总称。 转录本: 由一条基因通过转录形成的一种或多种可供编码蛋白质的成熟的mRNA。 3、研究转录组的意义 可以获得比基因组学和蛋白质组学更丰富的信息 转录过程中的选择性拼接、转录后的RNA编辑可产生丰富多样的蛋白质组,对生命活动的调节作用日益受到重视。 大量非编码RNA(non-coding RNA)被转录,特别是lncRNA,其功能大多是未知的。 丰富的小RNA转录本(如真核的miRNA、原核的small RNA)在基因表达调控中起重要作用。 4、三代测序技术比较
| | | | | | | | | | | | | | 高读长,准确度一次性达标率高,能很好处理重复序列和多聚序列 | | | | | | | | | 样品制备较难;难于处理重复和同种碱基多聚区域;试剂冲洗带来错误累积;仪器昂贵 | | | HiSeq2000,HiSeq2500/MiSeq | | | | | | | | | | | | 很高测序通量;在广为接受的几种第二代平台中,所要拼接出人类基因组的试剂成本最低 | 测序运行时间长;读长短,造成成本高,数据分析困难和基因组拼接困难;仪器昂贵 | | | | | | | 高平均读长,比第一代的测序时间降低;不需要扩增;最长单个读长接近3000碱基 | 并不能高效地将DNA聚合酶加到测序阵列中;准确性一次性达标的机会低(81-83%);DNA聚合酶在阵列中降解;总体上每个碱基测序成本高(仪器昂贵); | | | | | | | 在第三代中通量最高;在所有测序技术中,用于拼接一个人基因组的试剂成本最低;每个测序步骤独立,使错误的累积变得最低 | 低读长; 模板制备妨碍长重复序列区域测序;样品制备费事;尚无商业化供应的仪器 | | | | | | | 对核酸碱基的掺入可直接测定;在自然条件下进行DNA合成(不需要使用修饰过的碱基) | 一步步的洗脱过程可导致错误累积;阅读高重复和同种多聚序列时有潜在困难; | | | | | | | | | 5、主要的几大二代测序技术
6、illumina测序原理步骤
7、RNA-seq技术制约
(1)细胞中95%以上的RNA是rRNA(>75%)和tRNA。而原核mRNA缺少3’-poly(A)纯化标签,mRNA的富集是技术上的最大障碍。如果直接测序,会得到大量的无用信息。 为此科学家想出了以下四种方法:
(2)链特异性问题:传统策略无法判断转录的方向性从而也无法鉴定反义RNA。丢失了部分转录组信息最简单的是直接以第一链cDNA为测序模板将序列特异的RNA接头通过RNA连接酶连接到RNA分子的5′或3′端,然后再合成cDNA,并用特异的接头引物进行测序在真核生物的转录组学研究中还用到了模板转换PCR、亚硫酸诱导RNA分子中的胞嘧啶转变为尿嘧啶(即C→U)、在逆转录引物中加序列标签、在第二链cDNA中加入脱氧尿苷并降解第二链cDNA等策略,以确保获得转录方向方面的信息。
8、区分两种测序方式
单端测序(Single-read)首先将DNA样本进行片段化处理形成200-500bp的片段,引物序列连接到DNA片段的一端,然后末端加上接头,将片段固定在flow cell上生成DNA簇,上机测序单端读取序列。
双端测序(Paired-end)方法是指在构建待测DNA文库时在两端的接头上都加上测序引物结合位点,在第一轮测序完成后,去除第一轮测序的模板链,用对读测序模块(Paired-End Module)引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量,进行第二轮互补链的合成测序。
|