二代测序

来自医学百科

二代测序

文件:NGS Workflow.jpg
二代测序 (NGS) 标准工作流程:文库构建 $\rightarrow$ 簇生成 $\rightarrow$ 测序 $\rightarrow$ 数据分析。

二代测序(Next-Generation Sequencing,简称 NGS),又称高通量测序(High-Throughput Sequencing),是继 Sanger 测序(一代测序)之后的革命性 DNA 测序技术。

NGS 的核心特征是大规模并行测序(Massively Parallel Sequencing),即能够同时对数百万甚至数十亿个 DNA 分子进行测序。这使得测定一个人类全基因组的成本从 30 亿美元(人类基因组计划时代)降低至 1000 美元以内,极大地推动了肿瘤精准医疗、遗传病诊断和无创产前筛查的发展。

基本信息

中文名称 二代测序 / 高通量测序
英文名称 Next-Generation Sequencing (NGS)
核心原理 边合成边测序 (Sequencing by Synthesis)
关键特征 大规模并行、高通量、低成本
主流平台 Illumina (全球垄断地位), Ion Torrent, MGI (华大智造)
临床应用 肿瘤伴随诊断 (Panel)、无创产前筛查 (NIPT)、病原宏基因组 (mNGS)

技术原理 (以 Illumina 平台为例)

目前的市场主流技术基于“边合成边测序”原理:

  1. 文库构建 (Library Prep):将 DNA 打断成小片段(通常 200-500bp),并在两端加上特定的接头(Adapter)。
  2. 簇生成 (Cluster Generation):DNA 片段在测序芯片(Flow Cell)上进行桥式 PCR 扩增,形成包含数千个相同拷贝的 DNA “簇”,以增强信号强度。
  3. 测序 (Sequencing):加入带有荧光标记的 dNTP。每合成一个碱基,就释放出特定颜色的荧光,光学系统捕获荧光信号,从而读出碱基序列(A/T/C/G)。
  4. 数据分析:利用生物信息学算法将数亿条短序列(Reads)比对回人类参考基因组,识别变异。

与一代测序 (Sanger) 的对比

维度 一代测序 (Sanger) 二代测序 (NGS)
通量 低 (一次只能测 1-96 个样本) 极高 (一次可产生 T 级别数据)
原理 双脱氧链终止法 大规模并行合成测序
读长 长 (800-1000 bp) 短 (150-300 bp)
准确性 金标准 (99.999%) 较高 (99.9%),但在重复区域易出错
主要用途 单个基因验证、小片段测序 全基因组、全外显子、大 Panel 筛查

临床应用场景

1. 肿瘤精准医疗

  • 伴随诊断 (Panel):一次性检测几十到数百个癌症相关基因(如 EGFR, ALK, KRAS, TP53),指导靶向药和免疫治疗(TMB 评估)。
  • 液体活检:利用超高深度 NGS(通常 >10000×)检测血液中的 ctDNA,用于 微小残留病 (MRD) 监测。

2. 遗传病与生殖健康

  • 无创产前筛查 (NIPT):通过检测母体血浆中的胎儿游离 DNA,筛查唐氏综合征(21三体)等染色体异常。
  • 全外显子测序 (WES):诊断罕见遗传病。

3. 感染病原检测 (mNGS)

  • 宏基因组测序:不依赖培养,直接对样本中所有核酸进行测序,能快速识别疑难危重感染中的病毒、细菌、真菌或寄生虫。

局限性

  • 读长较短:难以处理复杂的基因组结构变异(如大片段倒位、易位)或高重复区域。这方面正逐渐被三代测序(长读长测序,如 PacBio/Nanopore)所补充。
  • 数据分析复杂:海量数据需要昂贵的计算资源和专业的生物信息学团队进行清洗、比对和注释。
  • 扩增错误:PCR 过程可能引入偏差(Bias),影响定量准确性(需通过 UMI 技术校正)。

参考文献

  • [1] Metzker ML. Sequencing technologies - the next generation. Nat Rev Genet. 2010.
  • [2] Goodwin S, et al. Coming of age: ten years of next-generation sequencing technologies. Nat Rev Genet. 2016.
  • [3] Shendure J, Ji H. Next-generation DNA sequencing. Nat Biotechnol. 2008.

相关条目