Skip to content

测序文件格式

用于多种数据分析选项的序列文件格式

选择您优选的格式进行测序数据的下游分析

Illumina测序的文件格式

我们提供多种用于下游分析的序列数据选项,可将数据转换为兼容的序列文件格式(例如FASTQ文件)。Illumina测序仪设计使得数据可轻松地传输到Illumina Connected Analytics和BaseSpace Sequence Hub,用于基于云的数据管理、分析和合作。

原始数据文件以序列文件格式提供,该格式兼容或易于转换为标准化数据格式,用于简化大型队列的汇集和挖掘。通过DRAGEN BioIT平台,可以获得最新的文件格式FASTQ.ORA。FASTQ.ORA是一种无损压缩文件,可减小文件大小、传输时间和存储成本。

FASTQ序列文件格式

FASTQ是基于文本的测序数据文件格式,可储存原始测序数据和质量分值。FASTQ文件已成为储存Illumina测序系统的NGS数据的标准格式,可用作多种二级数据分析解决方案的输入。

MiniSeq和MiSeq测序系统提供自动将数据从BCL转换为FASTQ格式的选项,因此不需要单独的转换软件。

深入了解FASTQ文件

FASTQ ORA序列文件格式

FASTQ ORA是基于文本的FASTQ测序数据文件格式的二进制压缩文件格式。fastq.ora文件最多可比相应的fastq.gz文件小5倍,且不会影响数据完整性。所有的fastq.ora文件使用这里提供的免费解压软件查看。安装后,通过简单的命令即可直接将解压的输出结果传递给各种常见定位工具,例如BWA,1 STAR,2和Bowtie。3

BCL序列文件格式

二进制碱基检出(BCL)序列文件格式需要转换为FASTQ格式以用于用户开发的或第三方数据分析工具。NextSeq和HiSeq测序系统以及NovaSeq 6000可生成BCL格式的原始数据文件。

The DRAGEN Bio-IT 平台提供快速的BCL至FASTQ文件的转换,作为其流程套件的一部分。

Illumina还提供BCL转换软件用于将BCL文件转换为FASTQ文件。bcl2fastq是一款独立的转换软件解决方案,可分离数据并将BCL文件转换为标准FASTQ文件格式以用于下游分析。

其他序列文件格式

FASTQ文件是测序数据分析的典型起始格式。但是,BaseSpace Sequence Hub 还可创建其他常用于二级和三级分析程序的文件格式。

在NGS数据的次级和三级分析中,Illumina信息学平台中的软件平台和应用程序通常将原始数据从FASTQ文件转换为其他序列文件格式(例如.vcf、.bam),这是分析工作流程的一部分。

希望收到关于基因组分析技术的新闻、案例研究和信息?

请输入您的电子邮件地址。

更多资源

开发人员门户

访问用户指南、发布说明和更多技术信息。

在线培训

这些免费在线课程包含了文库制备、测序和数据分析的常见问题。

Illumina DRAGEN Bio-IT平台培训

深入了解准确且超快速的二级分析平台以及其中提供的流程。

企业级的保护

Illumina Connected Analytics平台的构建以安全和合规为核心,以满足最严格的安全性要求。

参考文献
  1. Li H. and Durbin R. Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics. 2009 Jul 15; 25(14): 1754–1760.
  2. Dobin A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics. 2013 Jan; 29(1): 15–21.
  3. Langmead B. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology 2009 10:R25