基因组学技术与原理v2
- 格式:doc
- 大小:545.00 KB
- 文档页数:10
第2代测序技术
共同点:1、首先也是将基因组DNA随机切割成小片段DNA分子,然后在体外给这些小片段分子的末端连接上接头制成文库,也可以使用配对标签(mate-paired tag)制成跨步文库(jumping libraries)。2、通过原位polon、微乳液PCR(emulsion PCR)或桥式PCR(bridge PCR)等方法获得测序模板。这些方法有一个共同点,那就是任何一个小片段DNA分子的PCR扩增产物都是在空间上聚集的:原位polony法和桥式PCR法中所有的产物都集中在平板的某处,在微乳液PCR法(emulsion PCR)中所有的产物都集中在微珠的表面。3、真正的测序反应本身和传统测序法一样,是由重复的聚合酶促反应和最后的荧光读取分析反应组
一、ABI SOLiD技术平台
SOLiD使用连接法测序获得基于“双碱基编码原理”的SOLiD颜色编码序列,随后的数据分析比较原始颜色序列与转换成颜色编码的参考序列,把SOLiD颜色序列定位到reference上,同时校正测序错误,并可结合原始颜色序列的质量信息发现潜在SNP位点。
(1) 测序实验流程:
1、文库制备:随机片段文库、末端配对文库
2、模板磁珠制备:油包水微型反应体系; DNA片段在磁珠上扩增
3、磁珠固定:磁珠随机固定在测序玻片表面;可增大每个测序玻片上的磁珠密度
4、边连接边测序:四色荧光标记寡核苷酸;边连接边测序
5、测序引物重置:每一个模板选用5个引物进行连接反应测序
(2) 技术特点:
高通量,SOLiD 4.0每个测序反应能够获得50G的数据量;
高准确性,每个DNA碱基检测2次,增加了序列读取的准确性;
高稳定性,测序时采用连接反应,有效地解决了多聚核苷酸序列难读取的问题;
系统中两个独立控制的流动池和条码标定技术运用可以在单个测序中做很多不同的样品。
(3)详细过程
1. SOLiD文库构建
使用SOLiD测序时,可根据实际需要,制备片段文库(fragment library)或末端配对文库(mate-paired library)。制备片段文库就是在短DNA片段(60~110 bp)两端加上SOLiD接头(P1、P2 adapter)。而制备末端配对文库,先通过DNA环化、Ecop15I酶切等步骤截取长DNA片段(600bp到10kb)两末端各25 bp进行连接,然后在该连接产物两端加上SOLiD接头。两种文库的最终产物都是两端分别带有P1、P2 adapter的DNA双链,插入片段及测序接头总长为120~180 bp。
2 油包水PCR
文库制备得到大量末端带P1、P2 adapter但内部插入序列不同的DNA双链模板。和普通PCR一样,油包水PCR 也是在水溶液进行反应,该水相含PCR所需试剂,DNA模板及可分别与P1、P2 adapter结合的P1、P2 PCR引物。但与普通PCR不同的是,P1引物固定在P1磁珠球形表面 (SOLiD将这种表面固定着大量P1引物的磁珠称为P1磁珠)。PCR反应过程中磁珠表面的P1引物可以和变性模板的P1 adapter负链结合,引导模板合成,这样一来,P1引物引导合成的DNA链也就被固定到P1磁珠表面了。
油包水PCR最大的特点是可以形成数目庞大的独立反应空间以进行DNA扩增。其关键技术是“注水到油”,基本过程是在PCR反应前,将包含PCR所有反应成分的水溶液注入到高速旋转的矿物油表面,水溶液瞬间形成无数个被矿物油包裹的小水滴。这些小水滴就构成了独立的PCR反应空间。理想状态下,每个小水滴只含一个DNA模板和一个P1磁珠,由于水相中的P2引物和磁珠表面的P1引物所介导的PCR反应,这个DNA模板的拷贝数量呈指数级增加,PCR反应结束后,P1磁珠表面就固定有拷贝数目巨大的同来源DNA模板扩增产物。
3. 含DNA模板P1磁珠的固定
SOLiD测序反应在SOLiD玻片表面进行。含有DNA模板的P1磁珠共价结合在SOLiD玻片表面。磁珠是SOLiD测序的最小单元。每个磁珠SOLiD测序后形成一条序列。
4. SOLiD双碱基编码原理及测序流程
SOLiD“双碱基编码原理”实质上是阐明了荧光探针的颜色类型与探针编码区碱基对的对应关系。SOLiD连接反应的底物是8碱基单链荧光探针混合物。连接反应中,这些探针按照碱基互补规则与单链DNA模板链配对。探针5’末端可分别标记“CY5,Texas Red,CY3,6-FAMTM”4种颜色的荧光染料,并且这四种颜色用数字“3,2,1,0”示
意;探针3’端1~5位为随机碱基,可以是“A,T,C,G”四种碱基中的任何一种碱基,其中第1、2位构成的碱基对是表征探针染料类型的编码区,“双碱基编码矩阵”规定了该编码区16种碱基对和4种探针颜色的对应关系,而3~5位的“n”表示随机碱基,6~8位的“z”指的是可以和任何碱基配对的特殊碱基,由上可知,SOLiD连接反应底物中共有45 种底物探针。
单向SOLiD测序包括五轮测序反应。每轮测序反应含有多次连接反应(一般情况下,片段文库是7次,mate-paired 文库是5次,所以片段文库共有35个连接反应,而末端配对文库共有25次连接反应)。每轮测序反应的第一次连接反应由与P1引物区域互补的“连接引物”介导。这五种连接引物长度相同,但在P1引物区域的位置相差一个碱基(分别用n,n-1,n-2,n-3,n-4表示),都含有5’端磷酸,所以可以介导连接反应的进行。
5. 数据分析原理
SOLiD测序完成后,获得了由颜色编码组成的SOLiD原始序列。理论上来说,按照“双碱基编码矩阵”,只要知道所测DNA序列中任何一个位置的碱基类型,就可以将SOLiD原始颜色序列“解码”成碱基序列。但由于双碱基编码规则中双碱基与颜色信息的兼并特性(一种颜色对应4种碱基对),前面碱基的颜色编码直接影响紧跟其后碱基的解码,所以一个错误颜色编码就会引起“连锁解码错误”,改变错误颜色编码之后的所有碱基。
和所有其它测序仪一样,测序错误在所难免,关键是对测序错误的评价和后续处理。为避免“连锁解码错误”的发生SOLiD数据分析软件不直接将SOLiD原始颜色序列解码成碱基序列,而是依靠reference序列进行后续数据分析。SOLiD序列分析软件首先根据“双碱基编码矩阵”把reference碱基序列转换成颜色编码序列,然后与SOLiD 原始颜色序列进行比较,来获得SOLiD原始颜色序列在reference的位置,及两者的匹配性信息。Reference转换而成的颜色编码序列和SOLiD原始序列的不完全匹配主要有两种情况:“单颜色不匹配”和“两连续颜色不匹配”。由于每个碱基都被独立地检测两次,且SNP位点将改变连续的两个颜色编码,所以一般情况下SOLiD将单颜色不匹配处理成测序错误,这样一来,SOLiD分析软件就完成了该测序错误的自动校正;而连续两颜色不匹配也可能是连续的两次测序错误,SOLiD分析软件将综合考虑该位置颜色序列的一致性及质量值来判断该位点是否为SNP。
二、Illumina Solexa技术平台
(1)Solexa 技术的基本原理:
1、基因组DNA 被随机打断成为小的DNA 片断;并在DNA 片断的两端连上接头 (adapter);
2、Solexa 测序专用的测序芯片(flow cell)表面连接有一层单链引物,单链状态的DNA 片断与芯片表面的引物通过碱基互补被一端“锚定”在芯片上;
3、通过扩增反应使得单链DNA 成为双链DNA;
4、双链再次变性后成为单链,其一端“锚定”在测序芯片上,另外一端(5’或3’)随机和附近的另外一个引物互补,被“锚定”住,形成“桥“(bridge);
5、在测序芯片上同时有上千万DNA 单分子发生以上的反应;
6、4中形成的单链桥,以周围的引物为扩增引物,在测序芯片表面再次进行扩增,形成双链;
7、双链经变性成单链,再次形成桥,成为下一轮扩增的模板继续扩增反应;
8、在反复进行30 轮扩增,每个单分子得到了1000 倍扩增,成为单克隆“DNA 簇群”;
9、“DNA 簇群”在Solexa 测序仪上进行序列分析;
10、测序反应:“可逆性末端终结反应”,提高碱基合成来进行测序。四种碱基分别标记四种不同荧光,每个碱基末端被保护基团封闭,单次反应只能加入一个碱基,经过扫描,读取该次反应颜色后,该保护基团被除去,下一个反应可继续进行,如此反复,得出碱基的精确序列;
(2)技术特色突出表现在:
1、每张测序芯片有8 个通道,每个通道可单独运行一个样品,也可以把多个样品混合在一起检测;
2、一次实验可读取大于15 亿个碱基/芯片;
3、可精确读取重复序列如:AAAAAAAAAAAAAAAAA,TTTTTTTTTTTTT;
4、实验费用低,测序成本为传统测序方法的1/100;
5、无需建库,自动化样品制备,简单,成本低;
6、样本使用效率极高,所以对少量样本也可以极灵敏精确地检测;
7、可以进行35 碱基长度的末端双向测序反应;
三、Roche 454技术平台
(1)454 GS FLX原理