基因测序技术的基本原理和应用特点
栏目分类:医学论文   发布日期:2017-09-15   浏览次数:

基因测序技术已发展至第四代,其中第二代、第三代和第四代测序技术统称为下一代测序(NGS)技术。基因测序原理也相应地经历了Sanger测序法,边合成边测序、单分子测序和纳米孔测序。NGS技术因为通量提高、成本降低和测序周期缩短的优势已被广泛应用于基因组学
 基因测序技术的出现对生命科学和医学的发展起到了革命性作用,不仅推动各类基因组学的研究[1],为复杂疾病的病因学研究提供了新思路[2],还促进了基因检测在产前诊断、器官移植配型、肿瘤分子诊断和靶向治疗以及在药物个体化治疗等方面的应用[3-4].作为基因组学研究的关键技术--基因测序技术在过去的38年里迅速发展。自1977年Sanger发明链终止双脱氧链终止法 (Sanger测序法)、Maxam和Gilbert发明化学降解法测序技术以来,基因测序技术不断发展,作为第一代基因测序技术代表的ABI3700荧光标记自动核酸分析仪 (Sanger测序法) 将基因测序带入自动化时代。2003年完成的人类基因组计划测序长度达30亿个碱基对[5].然而,第一代测序技术无论在通量、成本、读长、测序速度和数据分析系统等方面都不能满足日益增长的全基因组测序需求,因此出现了下一代测序 (next generation sequenc-ing,NGS) 技术。NGS技术又称大规模平行测序或深度测序[6],包括第二代、第三代和第四代测序技术。目前,具代表性的第二代测序平台有瑞士Roche公司的454,美国Illumina公司的基因组测序仪 (genome analyzer,GA)、Hi Seq 2000和Mi Seq,美国ABI公司的寡聚物连接检测测序(sequencing by oligo ligation detection,SOLi D)5500XL,美国Life Technologies公司的Ion Torrent个人化操作基因组测序仪 (personal genome ma-chine,PGM);第三代测序平台有美国HelicosBiosciences公司的Heli Scope遗传分析系统和Pa-cific Biosciences公司的单分子实时 (single mole-cule real time,SMRT) 测序技术;第四代测序技术有英国Oxford Nanopore Technologies公司的纳米孔测序技术。本文拟综述这些测序技术的基本原理和应用特点。
  
  1第二代测序技术
  
  Sanger测序法是测序技术的金标准,其测序长度可达1 000 bp,准确性几乎100%,但存在通量低、成本高和耗时长的不足,严重影响其大规模应用,为此产生了第二代测序技术。第二代测序技术的核心原理是边合成边测序,其基本步骤包括文库制备、单克隆DNA簇的产生和测序反应。与第一代测序技术相比,第二代测序技术具有以下特点:(1) 高通量。第二代测序技术不依赖传统的毛细管电泳,其测序反应在芯片上进行,可对芯片上数百万个点同时测序[7];(2) 成本 降 低 . 第 二 代 测 序 技 术 每Mb碱 基 成 本 比Sanger测序法降低96.0%~99.9%[5];(3) 敏感性高,如Roche 454测序平台“1个片段=1个磁珠=1条读长”的设计能保证对低丰度DNA信息的检测;(4) 读长较短,不便于后续数据分析时的拼接;(5) 聚合酶链式反应 (polymerase chain reac-tion,PCR) 过程可能引入偏倚和错配。
  
  1.1 Roche 454测序平台
  
  Roche 454(Genome Sequencer 20 System)是第一个NGS测序平台,由美国454 Life Sciences公司于2005年推出,2007年被瑞士Roche公司收购。此后Roche公司在此基础上开发了Roche GSTitanium、Roche GS FLX +、Roche GS Junior和Roche GS Junior+[8].Roche 454是一种基于微乳液PCR和焦磷酸测序技术的测序平台[9].Roche 454测序原理见图1.首先单链DNA模版被限制在经乳化的磁珠上并在乳液滴中进行微乳液PCR,产生成千上万条待测模板DNA簇。随后将磁珠放置在有焦磷酸测序底物的微滴定板小孔中进行酶联化学发光反应,对单条DNA分子的多个拷贝进行大规模平行测序[10].Roche 454测序平台具有较长的测序读长和短耗时的优势,如Roche GS FLX+读长达1 kb,一轮测序时间仅为23 h[8].Roche454测序准确性高达99.9%,达到了与Sanger测序法相当的长度与准确性,并降低了测序成本。Roche 454测序主要应用领域有微生物群落多样性分析 (如16s、18s、ITS扩增子测序)、复杂环境样品的宏基因组学研究、微生物基因组的从头测序、转录组测序、外显子测序、目标区域捕获测序和病原菌检测等[11].然而,Roohe 454平台也存在一些不足,比如焦磷酸测序试剂成本相对较高,样本制备相对较复杂,对重复和同种碱基聚合区域难以处理,以及试剂冲洗带来的错误积累等。随着测序仪器的更新,454平台无论从扩展性还是从成本来看都很难再次升级和改良,故Roche公司宣布自2016年逐步淘汰焦磷酸测序仪器的生产[7].
  
  焦磷酸测序原理示意图
  
  1.2 Illumina测序平台
  
  美国Solexa公司于2006年推出GA,2007年被Illumina公司收购,此后Illumina公司又开发了GAⅡX、Hi Seq 2500、Hi Seq 3000、Hi Seq 4000、Hi Seq X Ten、Hi Seq X Five、Next Seq 500、Mi Seq系列和Mini Seq系统[12].Illumina测序平台是基于桥式PCR和荧光可逆终止子的边合成边测序,其测序原理见图2.单链DNA固定在8通道的芯片表面形成寡核苷酸桥,芯片置于流通池内,经过PCR扩增各通道均产生不同单克隆DNA簇。加入DNA聚合酶和4种荧光标记的d NTP可逆终止子后进行合成反应,每次只增加单个碱基,合成的同时检测其荧光信号确定碱基类型,之后切掉d NTP 3‘端延长终止基团,继续添加碱基进行测序反应。Illumina在NGS平台中通量最高,如Kampmann等[13]采用GAⅡX在一个通道中一个测序循环内完成了9个甲型流感病毒标本的全基因组测序工作。新推出的Next Seq 500兼具了样品制备和测序功能,其按钮式的操作可以在许多常见测序应用之间切换。该系统能够在一天内测序整个人类基因组和多达16个外显子组,Next Seq500运行75个测序循环只需12 h. 此外,Illumina测序成本最低,因此应用最广泛,几乎涵盖了测序应用的各个方面,比如基因组学的全基因组从头测序、重测序、外显子和目标区域捕获测序;转录组学的转录组测序、数字基因表达谱测序、微小RNA测序和降解组测序;表观组学的甲基化测序、简化甲基化测序和甲基化DNA免疫共沉淀测序等[11].然而,Illumina平台由于读长较短,会导致后期用于数据删节和分析的费用增高。
  
  Illumina测序原理示意图 1.3 SOLi D测序平台
  
  SOLi D测序技术由美国Agencourt公司开发,2006年被ABI公司收购。ABI于2007推出SOLi D的第一个测序平台,2010年又推出SOLi D 5500XL.同Roche 454测序平台一样,SOLi D也采用微乳液PCR,不同之处在于其采用寡核苷酸连接测序。SOLi D测序原理见图3.微乳液PCR后模板链经磁珠连接至SOLi D玻片上进行测序反应。首先,通用引物与模版链上的接头互补配对,加入16种8碱基探针和连接酶竞争与引物连接的位点。连接反应后,探针的后3个碱基被清除,荧光信号释放,多次加入底物直至延伸至待测链末端,然后换用新引物进行新一轮测序反应。新引物与第一个引物区别是长度相同、与接头配对位置相差一个碱基,完成待测链测序需要5个此种引物。采用双碱基编码策略进行连接反应,即每两个相邻位点的碱基对应16种任意组合的8碱基探针中的4种荧光信号之一,核苷酸链延伸时,每个位点被扫描2次,准确率达99.94%,但双碱基编码策略也可能导致连锁解码错误。SOLi D一次循环可产生75~110 bp读长,产生300 Gb的测序序列。同Illumina一样,SOLi D可用于全基因组重测序确定单核苷酸多态性、缺失和插入等基因组结构变异,也可用于目标区域捕获测序、染色质免疫共沉淀测序和RAN测序,但读长短、成本高和数据结果分析困难的不足使其应用受限。
  
  SOLiD测序原理示意图
  
  1.4 Ion Torrent PGM和Proton半导体测序
  
  美国Ion Torrent公司自2010年被Life Technolo-gies收购后陆续推出Ion Torrent PGM(2010年) 和Proton(2012年),二者是介于第二代和第三代之间的测序平台,其核心技术是Ion Torrent公司开发的半导体测序[14].半导体测序技术也采用微乳液PCR,不同之处在于其检测的是单核苷酸与芯片上固定的模板链配对时释放氢离子引起的p H变化,而不是荧光信号。Ion Torrent PGM有3种芯片,314芯片适合小基因组测序,316和318芯片用于全转录组测序和染色质免疫共沉淀测序[15].Ion Torrent PGM通量虽低,但速度快,成本低且仪器规模小,因此应用广泛,适合16s RNA测序[16]、微生物和病毒的从头测序和重测序、目标区域捕获测序、单核苷酸多态性检测[17]、短串联重复序列测序[18]、混合感染鉴定和线粒体DNA测序等[19- 20].但Ion Torrent PGM也存在因多次洗脱过程导致的错误累积、阅读高度重复序列和同种多聚序列时出错率高等不足。现有Roche GS Junior、Ion Tor-rent PGM和Mi Seq 3种针对临床和中小型实验室的小型测序仪,其性能比较见表1[21].
  
  2第三代测序技术
  
  第三代测序技术是在第二代基础上增加读长,降低试剂成本,并且加快运行速度。其显着特点是单分子测序,即不经PCR直接进行边合成边测序[22],不仅简化了样品处理过程,避免了扩增可能引入的错配,而且不受鸟嘌呤和胞嘧啶或腺嘌呤和胸腺嘧啶含量的影响,因此第三代测序技术能直接对RNA和甲基化DNA序列进行测序[23].现有的第三代测序平台包括美国Helicos Bioscience公司的Heli Scope遗传分析系统和Pacific Biosciences公司的Pac Bio RS单分子实时测序系统。
  
  Roche GS Junior、MiSeq和Ion Torrent PGM的比较
  
  2.1 Heli Scope遗传分析系统
  
  Heli Scope遗传分析系统为第一个单分子测序系统,由美国Helicos Bioscience公司于2008年推出。其基本过程为3’末端多聚腺嘌呤修饰的单链DNA模板被芯片上多聚胸腺嘧啶修饰的引物捕获,在DNA聚合酶的作用下,荧光标记的d NTP与模板链配对,通过采集荧光信号可获得碱基信息[24].该系统每次循环可产生21~25 Gb,平均读长35 bp的序列。Heli Scope遗传分析系统所需样本量较少且对样本质量要求低,可用于古生物信息检测[25].Heli Scope遗传分析系统最常用于基因表达分析,如在哺乳动物基因功能注解计划中用Heli-Scope进行基因表达加帽分析[26-27].
  
  2.2 Pac Bio RS单分子实时测序系统
  
  Pac Bio RS单分子实时测序系统由美国PacificBiosciences公司于2010年推出,采用四色荧光标记的d NTP和单分子实时芯片上的零级波导 (zero-mode waveguides,ZMW)对单个DNA分子进行测序。ZWM是一种直径50~100 nm、深度100 nm的孔状纳米光电结构,当光线进入后呈指数衰减,仅靠近基底的部分被照亮。DNA聚合酶固定在ZMW底部,加入模版、引物和四色荧光标记的d NTP后进行DNA合成,只有参加反应的d NTP才能停留在ZMW底部,从而使d NTP的荧光信号被识别[28],该测序过程见图4.Pac Bio RS单分子实时测序系统的优势在于读长,最新的Pac Bio RSⅡ读长可达20 kb.Pac Bio RS每次循环产生400 Mb序列,成本为2~17美元/ Mb,与其他NGS平台相比,其通量低,成本高,且单碱基识别错误率高达14%[7],但可通过提高循环次数来改善,也可与第二代测序技术联合应用以降低成本并提高准确度[29].Rhoads等[30]最近的研究表明Pac Bio RS适合于从头测序、基因结构突变检测、复杂重复序列测序、发现基因亚型、4-甲基胞嘧啶和6-甲基腺嘌呤检测。
  
  PacBio RS测序原理示意图 3第四代测序技术
  
  纳米孔测序技术虽属单分子测序,但不同于Heli Scope遗传分析系统和Pac Bio RS单分子实时测序平台,它无需进行合成反应、荧光标记、洗脱和电荷耦合器件 (charge couple device,CCD) 照相机摄像,实现了从光学检测到电子传导检测和短读长到长读长测序的双重跨越,为真正的单分子测序技术,故归为第四代测序技术。英国OxfoldNanopore Technologies公 司 现 已 推 出 高 通 量 的Grid ION(2012年) 和U盘大小的Min ION(2013年) 测序仪[31],它们均处于试用阶段。瑞士Roche公司、美国Illumina和Life Technologies等公司也在投资纳米孔测序,如Roche投资了Genia Tech-nologies和Stratos Genomics公司[32].与其他NGS平台相比,纳米孔测序技术具长读长、高通量、低成本、短耗时和数据分析相对简单的优势,未来纳米孔测序技术投入市场后有望在几小时、几百美元的成本内完成全基因组测序。
  
  纳米孔测序原理见图5.由于DNA分子每个碱基的大小形状不同,DNA分子在电泳驱动下通过纳米微孔组成电路时可引起特征性电流变化,据此可确定DNA分子的碱基类型和排列顺序。纳米孔有生物纳米孔和固态纳米孔两种[33],生物纳米孔有α-溶血素纳米孔和Msp A蛋白纳米孔[34-35],固态纳米孔如石墨烯纳米孔[36].与生物纳米孔相比,固态纳米孔稳定性更好。Min ION成本较低,U盘大小,读长可达10 kb[37],但DNA分子通过速度快,难以区分碱基信息和本底噪音[38],错误率很高[39],因此还有待改进。在应用方面,纳米孔测序可用于单核苷酸、ss DNA、ds DNA和RNA测序,同时纳米孔技术还用于DNA、微小RNA、蛋白质、阴离子、阳离子和有机分子的定性与定量。
  
  纳米孔测序原理示意图
  
  4结语
  
  NGS平台的更新实现了全基因组的高通量、低成本和快速化检测,尤其是第二代测序技术的逐渐成熟,促进了NGS在临床领域的应用。越来越多的研究者选择NGS的基因panel检测 (一种芯片上含若干基因对应的探针来捕获目标DNA并进行基因测序的方法) 对肿瘤进行研究,或者通过外显子测序鉴定潜在的药物靶点。在诊断儿童遗传性疾病时,也逐渐抛开了传统的诊断方法,转而使用全外显子组测序。NGS检测既可以帮助医生确定治疗方案,又可以为患儿父母评估他们未来子女患同样疾病的风险,必将推动分子诊断革新和精准医疗的发展。总体而言,Illumina测序平台应用最为普遍,测序成本也显着降低,首次达到1 000美元完成人类基因组测序的目标;Roche 454因其较长的测序读长,主要用于从头测序和宏基因组学研究;ABI SOLi D比Illumina应用少;介于第二代和第三代间的Ion Torrent PGM,因其简单、快速、低成本和小规模优势而得到广泛应用。在应用于临床时,第二代测序的结果仍需要测序金标准--第一代测序技术的验证。第三代和第四代测序技术目前处于发展阶段,虽读长比Sanger测序法长十几倍,但Pac Bio RS单分子实时测序系统和Min ION测序仪错误率高,还有待改进。另外,NGS数据的生物信息学分析也面临着巨大挑战。总之,随着对基因组信息更深层次的理解、测序技术的进步和生物信息学分析软件的革新,测序技术将在生物学和生物医学研究中发挥更大的作用。
  
  参考文献:
  [1] Buermans H P, den Dunnen J T. Next generation sequenc-ing technology: advances and applications[J]. BiochimBiophys Acta, 2014, 1842(10): 1932-1941.
  [2] Baudhuin L M. A new era of genetic testing and its im-pact on research and clinical care[J]. Clin Chem, 2012,58(6): 1070-1071.
  [3] Chan L L, Jiang P. Bioinformatics analysis of circulatingcell- free DNA sequencing data[J]. Clin Biochem, 2015,48(15): 962-975.
  [4] Meldrum C, Doyle M A, Tothill R W. Next- generation se-quencing for cancer diagnostics: a practical perspective[J].Clin Biochem Rev, 2011, 32(11): 177-195.
  [5] Mestan K K, Ilkhanoff L, Mouli S, et al. Genomic se-quencing in clinical trials[J]. J Transl Med, 2011, 9: 222.
  [6] Behjati S, Tarpey P S. What is next generation sequenc-ing[J]. Arch Dis Child Educ Pract Ed, 2013, 98(6): 236-238.
  [7] Van Dijk E L, Auger H, Jaszczyszyn Y, et al. Ten years ofnext-generation sequencing technology[J]. Trends Genet,2014, 30(9): 418-426.
  [8] Roche. Products[EB/OL]. [2016- 4- 7]. 
  [9] Xuan J, Yu Y, Qing T, et al. Next- generation sequencingin the clinic: promises and challenges[J]. Cancer Lett,2013, 340(2): 284-295.
  [10] Morey M, Fernandez-Marmiesse A, Castineiras D, et al.A glimpse into past, present, and future DNA sequenc-ing[J]. Mol Genet Metab, 2013, 110(1-2): 3-24.
  [11]华大基因。华大技术平台[EB/OL]. [2016- 4- 7]. 
  [12] Illimina. Systems[EB/OL]. [2016- 4- 7].
  [13] Kampmann M L, Fordyce S L, Avila-Arcos M C, et al.A simple method for the parallel deep sequencing of fullinfluenza A genomes [J]. J Virol Methods, 2011,78(8):243-248.
  [14] Golan D, Medvedev P. Using state machines to modelthe ion torrent sequencing process and to improve readerror rates[J]. Bioinformatics, 2013, 29(13): 344-351.
  [15] Jessri M, Farah C S. Next generation sequencing and itsapplication in deciphering head and neck cancer[J]. OralOncology, 2014, 50 (4): 247-253.
  [16] Salipante S J, Kawashima T, Rosenthal C, et al. Perfor-mance comparison of illumina and ion torrent next- gen-eration sequencing platforms for 16S r RNA-based bacte-rial community profilin[J]. Appl Environ Microbiol,2014, 80(24): 7583-7591.
  [17] Daniel R, Santos C, Phillips C, et al. A SNa Pshot of nextgeneration sequencing for forensic SNP analysis[J].Forensic Sci Int Genet, 2015, 14(6): 50-60.
  [18] Fordyce S L, Mogensen H S, Borsting C, et al. Second-generation sequencing of forensic STRs using the ion tor-rent HID STR 10-plex and the Ion PGM[J]. Forensic SciInt Genet, 2015, 14: 132-140.
  [19] Paparini A, Gofton A, Yang R, et al. Comparison ofSanger and next generation sequencing performance forgenotyping cryptosporidium isolates at the 18S r RNAand actin loci[J]. Exp Parasitol, 2015, 151: 21-27.
  [20] Parson W, Strobl C, Huber G, et al. Evaluation of nextgeneration mt Genome sequencing using the ion torrentpersonal genome machine (PGM) [J]. Forensic Sci IntGenet, 2013, 7(5): 543-549.
  [21] Chen S, Li S, Xie W, et al. Performance comparison be-tween rapid sequencing platforms for ultra-low coveragesequencing strategy[J]. PLo S One, 2014, 9(3): e92192.
  [22] Schadt E E, Turner S, Kasarskis A. A window into third-generation sequencing[J]. Hum Mol Genet, 2010, 19(R2):R227-240.
  [23] Korlach J, Turner S W. Going beyond five bases in DNAsequencing[J]. Curr Opin Struct Biol, 2012, 22(3): 251-261.
  [24] Thompson J F, Steinmann K E. Single molecule sequenc-ing with a Heli Scope Genetic Analysis System[M]. CurrProtoc Mol Biology. John Wiley & Sons, 2010: 7.10.1-7.10.14.
  [25] Orlando L, Ginolhac A, Raghavan M, et al. True single-molecule DNA sequencing of a pleistocene horse bone[J].Genome Res, 2011, 21(10): 1705-1719.
  [26] Yu N Y, Hallstrom B M, Fagerberg L, et al. Complement-ing tissue characterization by integrating transcriptomeprofiling from the human protein atlas and from the FAN-TOM5 consortium[J]. Nucleic Acids Res, 2015, 43(14):6787-6798.
  [27] Itoh M, Kojima M, Nagao-Sato S, et al. Automated work-flow for preparation of c DNA for cap analysis of gene ex-pression on a single molecule sequencer[J]. PLo S One,2012, 7(1): e30809.
  [28] Mc Ginn S, Gut I G. DNA sequencing-spanning the gen-erations[J]. N Biotechnol, 2013, 30(4): 366-372.
  [29] Faino L, Thomma B P. Get your high- quality low- costgenome sequence[J]. Trends Plant Sci, 2014, 19(5): 288-291.
  [30] Rhoads A, Au K F. Pac Bio sequencing and its appli-cations[J]. Genomics Proteomics Bioinformatics, 2015,13(5): 278-89.
  [31] Feng Y, Zhang Y, Ying C, et al. Nanopore-based fourth-generation DNA sequencing technology[J]. GenomicsProteomics Bioinformatics, 2015, 13(1): 4-16.
  [32]仪器信息网。从二代到四代:基因测序颠覆你对世界的“想象力”[EB/OL]. (2015-3-3)[2016-4-7]. 
  [33] Mattei T A. Biomimetic nanopores: a new age of DNA se-quencing[J]. World Neurosurg, 2014, 82(3-4): 252-254.
  [34] Manrao E A, Derrington I M, Laszlo A H, et al. ReadingDNA at single- nucleotide resolution with a mutantMsp A nanopore and phi29 DNA polymerase[J]. NatBiotechnol, 2012, 30(4): 349-353.
  [35] Haque F, Li J, Wu H C, et al. Solid- state and biologicalnanopore for real-time sensing of single chemical and se-quencing of DNA[J]. Nano Today, 2013, 8(1): 56-74.
  [36] Stoloff D H, Wanunu M. Recent trends in nanopores forbiotechnology[J]. Curr Opin Biotechnol, 2013, 24(4):699-704.
  [37] Laver T, Harrison J, O'Neill P A, et al. Assessing theperformance of the Oxford Nanopore TechnologiesMin ION[J]. Biomol Detect Quantif, 2015, 3: 1-8.
  [38] Luan B, Stolovitzky G, Martyna G. Slowing and con-trolling the translocation of DNA in a solid- state nano-pore[J]. Nanoscale, 2012, 4(4): 1068-1077.
  [39] Mikheyev A S, Tin M M. A first look at the OxfordNanopore Min ION sequencer[J]. Mol Ecol Resour,2014, 14(6): 1097-1102.

相关热词:

论文大全 硕博论文 论文指导 论文学堂 关于我们