测序质量分值用来评估碱基的错误检出率。利用边合成边测序(SBS)技术,read中的每个碱基会得到基于phred样算法1,2与最初为桑格测序实验开发的算法类似)的质量分值。
某个碱基的测序质量分值 Q 由以下公式定义:
Q = -10log10(e)
其中 e 为该碱基检出错误的预估概率。
Q20 表示错误率为 1/100,即每 100 bp 的测序读段中可能出现 1 个错误,对应碱基检出正确率为 99%。
当测序质量达到 Q30 时,几乎所有读段均无错误或歧义,因此 Q30 被视为新一代测序(NGS)的质量基准。
质量分值 | 碱基的错误检出率 | 推断的碱基检出精确度 |
---|---|---|
10 (Q10) | 1/10 | 90% |
20 (Q20) | 1/100 | 99% |
30 (Q30) | 1/1000 | 99.9% |
Illumina测序化学过程提供较高的精确度,绝大多数碱基得分在Q30及以上。这种精确度水平是多种测序应用的理想选择,包括临床研究。了解为何PhiX可以作为Illumina NGS运行中的质控品,进行运行质量监测。