NovaSeq X系列是因美纳最强大的测序平台,采用XLEAP-SBS化学技术,提供更高的流通池密度、前所未有的测序通量,并最终实现更低的成本。软件更新v1.4通过显著提升易用性和运营效率,延续了NovaSeq X平台的演进,同时进一步扩展了此前在数据质量和仪器稳健性方面的进步。
本文将重点介绍客户易用性和运营效率方面的提升:
· 运营具有更大灵活性,使用交错启动,可在一个流动池测序时启动另一个流动池
· 通过自动检测流动池上的样本标签,减少样本拆分误差和延迟
· 新增5B流动池以及1.5B流动池的2×300循环测序,扩展样本规模灵活性与应用灵活性
· 更高的测序数据质量,包括碱基质量的显著提高
· 在包含低多样性碱基类型的应用中提高了整个测序的稳健性
· 增强的NGS二级分析,包括升级至DRAGEN v4.4,提高变异检测的准确性
提高易用性
灵活安排测序运营
NovaSeq X系列软件的先前版本允许用户在双流动池配置中同时启动两个流通池(图1)。
图1. 先前NovaSeq X系列版本支持的双流动池配置
这种同时启动的限制影响了运营效率,因为在前一次单面运行完成之前,无法开始第二次运行。通过软件更新v1.4,用户现在可以在第一个流通池已经开始测序后启动第二个流动池,如图2所示。
图2. 软件更新v1.4支持的交错启动流动池配置
图3. 软件更新v1.4支持的交错启动操作示例
样本标签自动检测减少拆分错误和延误
任何测序仪都面临的一个常见挑战是样本拆分过程中的错误频发。这些错误源于样本表配置与流动池上加载的文库不一致。其影响可能十分显著;通常需要重新处理样本,导致更长的周转时间和增加的存储成本。
软件更新v1.4通过引入样本标签自动检测功能解决了这一问题。该功能可识别样本表中缺失的样本标签,并可选择性地纠正常见错误,例如第二个(i5)测序标签的方向错误。该功能适用于NovaSeq X系列、云端(BSSH/ICA)或本地服务器,且兼容因美纳和非因美纳文库制备试剂盒。简而言之,该功能有助于在首次尝试时就将BCL正确转换为FASTQ,消除不必要的重新排队。
标签自动检测包含两种基本运行模式:
· 盲态检测
· 引导检测
如图4所示,盲态检测无需输入样本表即可工作:
图4. 软件更新v1.4提供的标签自动检测——盲态检测
检测到的标签在标签2之后立即以生成示例表的形式提供,以及显示检测标准和决策过程的HTML和JSON文件。测序后输出中包括HTML格式的每个样本详细FastQC统计报告。FASTQC作为可选文件,可以在测序后根据生成的样本表在仪器上自动生成。
盲态检测的常见应用,为用户在标签2之后将生成的样本表与预期进行比较,识别任何差异(例如,缺失的样本),并将校正后的样本表提供给通过离线处理执行的BCL转换运行。通过这种增强的工作流程,只需执行BCL 转换即可获得所需的输出,消除周转时间的延迟和额外的存储成本。
相比之下,计划检测模式需要输入样本表,如图5所示:
图5. 软件更新v1.4提供的引导模式标签检测
但是,计划检测类似于盲态检测模式:检测到的标签在标签2后立即可用,并在测序后生成每个样本的FastQC报告和FastQC文件。
计划检测模式的好处是,保留了原始样本表的特征(例如,样本ID和条形码不匹配率),同时提供以下可选配置:
· 通过反向互补标签2来纠正样本,和/或
· 通过从未确定的数据中提取具有高读取计数的标签来添加样本。
反向互补过程很简单。如果原始样本表中样本拆分的百分比小于5%,则样本表中的标签2将被反向互补。如果反向互补的样品表产生的样本拆分百分比大于80%,则接受反向互补的样本表。在v1.4软件更新中,反向互补操作在流动池上进行;在未来的更新中,反向互补过程将依据每个通道进行。
计划检测模式最常见的用例包括生成FASTQC文件。
此外,计划检测模式可以配置为模拟盲态检测,同时保留样本表的特定参数格式(例如,条形码失配公差)。
图6重点展示了自动检测功能的准确性。
图6. 盲态自动检测精准度
系统会生成漏检率和误检率的统计数据。算法经过调优以降低漏检率,因为任何非预期的额外样本都可以由用户轻松丢弃。总体而言,自动检测功能对因美纳生成的测序数据在多种文库制备和应用中表现良好,未来版本将根据用户反馈持续改进算法。由于检测过程在标签2之后进行,执行时间相对较短。测序后统计数据通常在清洗周期内完成,FASTQC生成通常在下次运行的聚类间隔内完成,从而实现连续的24/7测序,如图1和图2所示。
重要的是,关于软件自动判断文库池中是否存在某些样本的担忧可以得到缓解。用户始终掌控自动检测过程。如有需要,可自定义参数——例如候选标签被接受所需的最小读数——以适应特定应用。归根结底,标签自动检测并非做出决策,而是提供信息以帮助用户做出决策。如果自动检测识别出额外的非预期样本,可以轻松将其丢弃。
新型流动池和测序长度实现优化批次处理和全新应用
软件更新v1.4推出了5B流动池,这是NovaSeq X系列上的一款新型中通量产品,可提升运营效率。5B流动池可与100、200和300循环试剂盒配合使用。这些试剂盒非常适合开展因美纳蛋白质制备的试点研究,或适合需要与典型样本到达间隔相匹配的更实用批次处理规模的用户。
此外,软件更新v1.4通过引入1.5B 600循环流动池扩展了测序选项。这一新配置为鸟枪法宏基因组学、免疫组库分析和扩增子测序等应用解锁了高通量层级,可在单次运行中实现更深的覆盖度和更长的读长。
客户可安装软件
NovaSeq X系列此前的软件更新需要因美纳现场服务工程师将仪器更新至最新软件版本。随着软件更新v1.4的发布,未来软件版本的升级过程可通过因美纳软件更新管理器(ISUM)在无需因美纳协助的情况下完成。ISUM不仅简化了安装流程,还能在软件版本发布后立即采用最新的测序仪增强功能。
更高的测序数据质量
碱基质量提升
随着NovaSeq X系列每一次软件更新,因美纳都体现了其对数据质量持续改进的承诺。这些改进体现在超过Q30的碱基比例增加,以及变异检出准确性的相应提升。数据质量的提升源于对测序流程(控制测序过程的一系列步骤)的优化;通过对簇生成(DNA文库片段附着并在流动池上扩增的过程)的增强;以及对初级分析(用于从测序仪提取碱基判读的信号处理算法)的改进。
通过软件更新v1.4,进一步通过微调测序流程中热控和流体步骤的速率和驻留时间实现了改进。簇生成步骤经过优化,促进了基因组纯度更高、更稳健的簇生长。这些改进提高了信噪比,从而获得了更高的质量分数。此外,初级分析中信号处理的增强在挑战性条件下(尤其是碱基多样性可变的情况)提供了更稳健的性能。
由于这些改进,质量提升在初级分析数据中显而易见。图7显示,最高质量区间中的平均质量分数已从软件更新v1.3的Q40提升至Q41。此外,大多数碱基超过了Q41平均值。这一向更高质量分数的转变在10B和25B流动池中均有观察到。
图7. 软件更新v1.4将高质量区间碱基的平均质量提升至Q41
图8. 软件更新v1.4中≥Q30碱基百分比的提升
低多样性增强
在某些测序文库中,四个可能的碱基类型在给定循环的测序簇池中丰度不足。当一个或多个碱基类型在数据中显著代表性不足时,就会出现低多样性条件。在低多样性条件下保持高数据质量和碱基判读准确性对实时碱基判读具有挑战性,尤其是当碱基多样性随循环变化时。
为提高低多样性应用的稳健性,建议使用Phi X掺入以确保每个循环具有最低碱基多样性。软件更新v1.3中的增强功能使Phi X掺入比例从15%降至5%,可用数据增加了10%。软件更新v1.4通过额外的增强功能进一步改善了低多样性条件下的性能,尤其适用于碱基多样性随循环变化的应用。
图9A显示了软件更新v1.4相对于v1.3的改进性能,超过Q30的碱基百分比更高,且碱基质量的负向波动更少。图9B展示了一种碱基多样性从高多样性过渡到低多样性再回到高多样性的应用。在这些条件下,软件更新v1.4通过Q30指标保持了持续的高数据质量。这些改进未对更典型的高多样性用例的性能产生影响。
图9A. 以低多样性循环为主的测序运行
图9B. 低多样性与高多样性循环之间过渡的测序运行
增强的二级分析
准确度提升
初级分析数据质量的改进,结合DRAGEN v4.4的升级,转化为增强的二级分析性能。使用TruSeq PCR-Free 450文库在10B和25B流动池上处理HG002样本。变异检出结果与T2T truth set进行评估,结果如图10所示。相对于软件更新v1.3,软件更新v1.4在假阳性(FP)率和假阴性(FN)率方面均显示出显著降低。
图10. 通过v1.4软件更新提高SNP和indel的精确度
升级至DRAGEN v4.4
软件更新v1.4包含通过升级至DRAGEN v4.4实现的二级分析性能增强。在测序仪上,所有此前可用的分析流程均已升级,包括BCL Convert、DRAGEN胚系(用于全基因组测序)、DRAGEN体细胞(仅肿瘤,用于全基因组测序)、DRAGEN RNA、DRAGEN富集(胚系和仅肿瘤体细胞模式)以及DRAGEN甲基化。
除自动检测功能外,BCL Convert现在还支持数据部分中的自定义字段,从而改善样本的可追溯性和追踪。此外,DRAGEN体细胞分析流程现在同时支持血液肿瘤和实体瘤选项。与先前版本一样,单个流动池上可使用多个DRAGEN版本,且先前版本的DRAGEN可在最新软件更新v1.4上运行。
云端分析流程包括测序仪上启用的流程,以及额外的产品如DRAGEN蛋白质定量和DRAGEN单细胞RNA。更多详情请参阅 NovaSeq X系列软件安装程序和发行说明。
即将推出
展望未来,以下功能已计划纳入即将发布的版本:
基于文件的LIMS集成
因美纳将在首次加载耗材后引入运行自动化,以最大限度减少操作员错误,并确保临床专业研究和生物制药客户的可追溯性。
增强的自动检测
因美纳将根据用户反馈扩展自动检测功能,添加按泳道标签校正、物种检测和按样本覆盖度指标。
改进的数据质量
因美纳将引入Q70质量分数技术,以无与伦比的准确性支持新一代肿瘤学应用。
提升的产出
因美纳将把NovaSeq X的产出从25B提升至35B(增加40%),同时10B配置将扩展至14B,使同一台仪器能够开展规模更大、更复杂的研究。
提升的速度
因美纳将实现更快的周转时间,14B产出仅需20-22小时,全基因组测序(WGS)工作流程平均提速30%。
结论
软件更新v1.4代表了NovaSeq X系列向前迈进的重要一步,在三个维度上推进了平台发展:运营灵活性、易用性和数据质量。通过引入流动池交错启动功能,用户可以更好地优化流动池调度,在样本就绪且有流动池面可用时按需启动第二次运行。新型5B流动池提供了灵活的中通量选择,提升了运营效率,而1.5B流动池上的600循环运行则解锁了更广泛的应用范围。
未来软件版本的升级可通过因美纳软件更新管理器(ISUM)在无需因美纳协助的情况下完成,确保在软件版本发布后立即采用最新的测序仪增强功能。这些进步共同提供了前所未有的灵活性,并实现了运营效率的大幅提升。
此外,软件更新v1.4彰显了因美纳对持续改进已上市平台数据质量的承诺。通过此次发布,在保持毫不妥协的数据质量的同时,实现了每个流动池数据产出的显著提升。值得注意的是,超过Q30的碱基比例较先前软件版本有所提高。这些质量改进直接转化为二级分析的提升,SNP和indel的精确度与召回率均获得可测量的增益。
软件更新v1.4是NovaSeq X系列创新路线图上的早期里程碑,在灵活性、效率和数据质量方面带来了提升,同时为 NovaSeq X创新路线图中概述的产出、速度和准确性的持续进步奠定了基础。