DRAGEN迭代gVCF基因分型程序

面向群体规模变异聚集的高性能分析

大规模快速基因分型

DRAGEN Iterative gVCF Genotyper(IGG)为群体规模的变异分析提供了突破性的解决方案,能够对大型队列中的小型生殖系变异进行高效聚集和基因分型。

DRAGEN IGG的速度、准确性和可扩展性经过精心设计,支持增量分析,可以添加新的样本批次,而无需重新处理整个数据集。无论是承担国家生物样本库的重任,还是推进罕见病研究或PopGen研究项目,DRAGEN IGG都能为您提供开展现代人群基因组学研究所需的出色性能与精准度。

Blurry image to be used as a background City street in Hongkong

主要特点

迭代工作流程

可以向现有队列添加新样本,无需重新处理整个队列 — 非常适合大型研究。

紧凑的多样本输出

生成紧凑、标准化的msVCF及PLINK格式文件,同步输出包含等位基因频率和基因型统计数据等位点指标,并保留输入gVCF中的样本级分析指标。

准确的结果

通过基于ML的队列水平变异筛选、高基因分型率和基因型一致性,实现准确的变异检测。

可扩展的架构

实现跨分布式节点的高效扩展,确保任何单个节点均无新增CPU或内存负载。

无缝整合

可与Hail、PLINK和BCFtools等工具轻松集成,适用于关联研究、队列探索和定相/归因分析。

灵活部署

可在Illumina Connected Analytics(ICA)、DRAGEN服务器或高性能计算(HPC)集群上部署,实现云端或本地高性能计算。

供世界上最大的PopGen项目使用

本次点播网络研讨会将展示Illumina DRAGEN Iterative gVCF Genotyper,其设计旨在通过迭代分析和批量处理克服传统工具的局限性,避免完整的队列重新基因分型。

这项具有里程碑意义的Nature研究展示了DRAGEN IGG如何为英国生物样本库的490,640个全基因组联合分析提供支持,以创新的精准度和速度实现跨祖源群体的15亿个变异位点发现。

基因组发现联盟(AGD)利用DRAGEN IGG聚集了250,000个全基因组,提高了变异检测的准确性,让我们能够更深入地了解祖源多样化群体中的罕见和复杂性状。

技术规格参数

输入格式 使用DRAGEN生成的全基因组gVCF(单样本或多样本)
输出格式 具有队列范围指标的多样本VCF文件
变异类型 单核苷酸位点变异(SNV)、插入缺失(indel)和PLINK格式输出
参考基因组支持 人类基因组参考序列联盟第38版(GRCh38)及端粒-端粒CHM13(T2T-CHM13)完整基因组组装
部署选项 Illumina Connected Analytics、DRAGEN服务器、本地高性能计算基础设施(早期试用版)
性能 多达384个唯一双(UD)标签组合和96个组合双(CD)标签组合

常见问题解答

DRAGEN Iterative gVCF Genotyper是因美纳开发的工具,包含在DRAGEN二级分析软件工具包中,用于对已通过DRAGEN变异检出程序(VC)预处理为gVCF(基因组VCF)格式的多个基因组生殖系样本进行基因分型和聚集。

样本基因分型和聚集是大规模变异检测流程中的关键步骤,包括用于群体研究、GWAS或PheWAS分析、基因组研究项目和临床研究的变异检测流程。

对于处理大规模全基因组样本队列的研究人员而言,DRAGEN IGG能够带来显著助益。

当前用户包括Genomics England, UK Biobank基因组发现联盟 (AGD)等组织。

DRAGEN服务器、HPC高性能计算集群和Illumina Connected Analytics支持DRAGEN IGG。

DRAGEN服务器: 对于通常由几百个样本组成的小型队列,建议使用DRAGEN服务器上的IGG。

HPC:  建议将基于HPC的DRAGEN IGG用于大型群体级队列,通常包含数千个或更多样本,具体取决于计算能力。适用于DRAGEN服务器和HPC的软件可从DRAGEN支持页面下载。

ICA: 对于大规模群体基因组学项目,推荐使用基于ICA的DRAGEN IGG,它可以提供全程管理的工作流程以及一键式操作体验。基于ICA的IGG分析功能已通过ICA平台的授权套件提供,并在其各区域站点上线。

DRAGEN集成基因分型(IGG)工作流程与传统GATK联合基因分型在几个方面有所不同:

  • 高准确度:相比于GATK和其他变异检出软件,DRAGEN IGG可提供出色的样本水平变异准确性
  • 独立样本检出:在聚集过程中,DRAGEN IGG会保持每个样本的基因型,而不是根据其他样本对其进行修正
  • 队列水平排序:机器学习模型在队列水平对变异质量进行排序和筛选
  • 增强性能:这种方法提高了变异和基因型的准确度,相对于GATK联合基因分型提高了计算效率
/ 结果

产品资源

DRAGEN gVCF Genotyper产品指南

本指南详细介绍了DRAGEN gVCF Genotyper,并提供了全面的解析、配置技巧和最佳实践,可帮助您更大限度提高基于队列的基因分型性能和准确性。

相关产品

DRAGEN二级分析

利用Illumina DRAGEN二级分析,获得尽可能多的基因组信息。了解最新更新,阅读常见问题解答并查找产品支持。

Illumina Connected Analytics

通过测序仪整合,可定制工作流程的自动化分析,或即用型DRAGEN流程,实施生物信息学工作流程。

DRAGEN服务器

DRAGEN服务器提供本地化解决方案,能够以远胜传统CPU系统的速度和精度,完成全面、精准的二级分析。

申请演示

联系我们,了解DRAGEN IGG如何加速变异分析并扩展您的研究。