长读长测序技术

长读长技术穿透复杂基因组区域

长读长测序可破解高难度区段,如高度重复或高同源区域,让隐藏变异无所遁形。

长读长测序是什么?

长读长测序是一种DNA测序技术,与传统的短读长测序方法相比,它可以对更长的DNA片段进行测序。尽管短读长测序能够捕获多数遗传变异,但长读长测序能够检测短读长难以检测的复杂结构变异,包括,大片段的倒位、缺失,或易位,其中某些结构变异与遗传疾病等领域相关。

长读长测序的优势

长读长测序技术通过测序数千个碱基,有助于解析基因组中具有挑战性的区域,从而实现以下目标:

  • 解析以往难以绘制的基因或基因组区域,例如,包含高度可变或高度重复元件的基因或基因组区域
  • 进行定相测序,以鉴定共遗传等位基因、单倍型信息和定相新发突变
  • 为从头组装和构建基因组完成图的应用生成长读长

长片段基因组学信息

因美纳已定位读数技术提供了长距离的基因组信息,可以帮助科学家检测大型结构变异,并解析难以绘制的区域。尽管本质上是一种短读长技术,因美纳已定位读数利用流动槽文库制备和新型信息学技术,通过整合邻近纳米井中簇的邻近信息,生成准确的长片段基因组信息。独特的工作流程保持了原长DNA模板与测序所得短读长之间的关联,增强了结构变异的检测,延长了遗传变异的超长定相时间,并改善了低复杂度区域的定位。

深入了解已定位读数技术

Introducing Illumina Complete Long Read sequencing technology
因美纳已定位读数技术的工作原理是什么?

使用标准或高分子量方法从样本中提取DNA模板后,将其直接引入流动槽表面,在槽内完成捕获、转化为簇并进行测序的流程。将长DNA模板直接引入流动槽,近端纳米井会形成类星群模式,借助DRAGEN二级分析中的新算法,可使簇重新定位至原始模板。这一技术显著提升了读数在参考基因组上的定位精度,使科学工作者人员能够利用短读长SBS测序的准确性和可扩展性,深入分析长片段基因组。

长读长测序的额外优势

长读长测序技术有望提升某些现有DNA测序应用的效率和准确性,同时提高对临床上重要基因的分辨率。

这些优势实现了人类基因组的定相重测序,以及对植物和动物基因组的快速从头测序。

在定相应用中,产生的长读长通常跨越多个杂合性SNP。由于该技术能够轻松跨过DNA片段中的大量重复区域,进而简化了从头测序。

长读长还能跨越大型重复序列,从而简化复杂序列中的映射及从头测序工作。

可选的长片段基因组学技术:连接读长 Linked reads

连接读长Linked reads是可生成非连续的长片段数据,为从头组装或超长片段(>1 Mb)定相提供信息的一种可选技术。这种可选的测序数据类型可用于补充新基因组或复杂基因组的标准短读长数据。

超长片段定相

TELL-Seq技术生成超长相区块,为进行基因组定相研究提供了一种易于获取的解决方案。

微生物从头组装

TELL-Seq在微生物WGS方面表现出卓越的性能,即使对于复杂样本或高GC含量区域也是如此。

TELL-Seq

观看此录播的网络研讨会,了解研究人员如何利用基于转座酶相关技术的长读长测序(TELL-Seq)对九种昆虫的基因组进行测序和组装。

常见问题解答

短读长测序将 DNA 打断成 50–600 bp 的片段进行测序,以低成本提供高质量、高深度的数据。Illumina 边合成边测序技术(SBS)可产生 50–600 bp 的高精度读长,易于扩缩,既可靶向小片段,也能覆盖全基因组。

长读长测序可一次读取数万碱基,适用于无完整参考基因组的组装、大型结构变异的检测以及低复杂度区域的跨越。

Illumina 短读长的核心优势在于 SBS 化学的高准确性、检测范围可从基因Panel到全基因组、仪器与解决方案多样,可单人也可大规模群体研究。不足之处在于极少数富含重复、同源或大型结构元件的区域难以解析;Illumina 映射读长技术可提供长距离信息,帮助攻克这些难绘区域。

深入了解映射读长技术

长读长信息可与高质量、低成本的短读长数据互补。许多长读长技术流程繁琐、结果波动大。1-4短读长(50–600 bp)深度高、准确性佳,配合高级NGS数据分析可获得精准的全基因组变异谱。少数难绘基因区域再辅以长读长,可进一步提升分辨率。
连接读长试图以短读长的准确性获取长距离信息。其方法是在长 DNA 模板中引入化学标签或序列条码,生信分析时利用条码还原长片段。缺点在于模板修饰和额外分析步骤提高了复杂度与成本,限制其通量与普及。无参考基因组、重复区准确定位、变异分型及大型结构变异检测等场景,仍需真正长读长。
连接读长测序的主要缺点是模板修饰和额外的分析步骤增加了复杂性和成本,限制了其在许多实验室的可用性和可扩展性。在无需参考基因组映射、重复区域精确映射、变异分型和识别大型结构变异等方面,长读长测序可能仍具有优势。
合成长读长测序是指给长DNA模板加上独特的序列条码或化学标签,再将其打断成片段。随后,这些片段在短读长测序仪上进行测序,并通过专门的生物信息学软件组装成“合成长读”。软件利用条码将片段重新映射回原始的长DNA模板。
其主要缺点是DNA模板的修饰和额外的计算分析步骤增加了复杂性和成本,从而限制了其在许多实验室中的可用性和可扩展性。

相关应用

rare disease icon
罕见病全基因组测序

全基因组测序是针对罕见病的全面检测,能提供出色的检测效能并具有改善治疗效果的潜力。

wgs icon
人类全基因组测序

人类全基因组测序为我们独特的复杂遗传变异提供了更详细的研究视角。

hematological cancer icon
癌症全基因组测序

获得癌症中特有基因组异常的全面碱基视图。

相关解决方案

测序平台

通过应用、通量及其他重要参数来比较新一代测序(NGS)平台。寻找工具来助您选择合适的测序仪。

技术进步

阅读文章,了解因美纳科学家和思想领袖近期在生物信息学和临床研究方面取得的突破和进展。

DNA测序

DNA测序过程中会识别出DNA片段的碱基。因美纳DNA测序仪一次运行即可产生数Tb的测序数据。

参考文献
  1. Pacific Biosciences. Preparing DNA for PacBio HiFi sequencing—Extraction and quality control. pacb.com/wp-content/uploads/Technical-Note-Preparing-DNA-for-PacBio-HiFi-Sequencing-Extraction-and-Quality-Control.pdf.
  2. Pacific Biosciences. Preparing whole genome and metagenome libraries using SMRTbell prep kit 3.0. pacb.com/wp-content/uploads/Procedure-checklist-Preparing-whole-genome-and-metagenome-libraries-using-SMRTbell-prep-kit-3.0.pdf.
  3. Oxford Nanopore Technologies. Ligation Sequencing Kit. store.nanoporetech.com/us/ligation-sequencing-kit110.html.
  4. Pacific Biosciences. Low Yield Troubleshooting Guide. pacb.com/wp-content/uploads/Guide-Low-Yield-Troubleshooting.pdf.