2026年6月1日
在人类基因组约30亿个碱基对中,仍有部分区域因高度重复、序列同源性高,或具有复杂结构特征,至今难以通过传统测序与分析方法完整解析。这些区域常被称为基因组的“暗区” 1,其中可能隐藏着与遗传疾病密切相关的重要变异 2,3 。
对罕见疾病研究而言,基因组暗区带来的挑战尤为明显。许多长期未能确诊的病例,即使已接受传统基因检测或短读长全基因组测序,仍可能因结构变异、重复序列或复杂基因区域未被充分解析,而缺乏明确的分子诊断线索。
台北荣民总医院儿童罕见疾病专家牛道明医生深耕遗传疾病研究逾二十年,长期致力于将基因组医学应用于临床诊断与精准医疗。牛医生认为,全基因组测序是未来精准医疗的重要基石,其价值不仅体现在一次性的诊断结果,更在于数据可以长期保存并反复重新分析。
随着分析技术、疾病数据库与临床知识持续进步,患者的WGS数据可在不同生命阶段被重新审视,从而获得更准确、也更具临床意义的解读。换言之,WGS不只是一次检测,而是一份可伴随患者终身使用的基因组数据资产。未来在临床诊疗中,医生可能需要像查看影像或实验室数据一样,将患者的WGS数据纳入长期随访与临床判断。因此,建立快速、即时且可持续更新的全基因组分析系统,将成为推动精准医疗走向临床的重要关键。
基于此理念,牛医生团队建立了快速即时全基因组分析系统Magic Bison,并已积累数千例全基因组测序样本的分析经验。然而,牛医生表示,团队多年来在罕见疾病基因诊断中,仍经常遇到二代测序难以充分解析的区域。尤其是基因组暗区、重复序列、高度同源区域以及复杂结构变异,往往成为长期未解病例的关键瓶颈。这些经验让团队深刻认识到,若要进一步突破罕见疾病诊断限制,必须依赖更先进、解析度更高的基因组技术。
拓展对基因组暗区的解析能力
长读长技术为解析复杂基因组区域带来了新的可能,但在成本、流程复杂度及大规模应用方面仍面临挑战。如何从海量基因组数据中提取具有临床研究价值的洞见,始终是科研人员关注的重要问题。
在此背景下,因美纳团队开始探索,如何在既有测序平台上引入更多长距离基因组信息,使短读长数据不再仅是零散片段,而能够重建更完整、连续的基因组结构。基于这一理念,因美纳推出TruPath Genome,助力研究人员更全面地解析与遗传疾病相关的基因组信息。
TruPath Genome采用邻位映射读长(proximity mapped read)技术,在短读长测序数据基础上整合DNA片段间的空间信息,使研究人员能够重建更完整的长距离基因组结构,从而提升复杂基因组区域的解析能力。
同时,数据分析也是整体流程中的关键环节。通过结合DRAGEN™二级分析与Emedgene™三级分析,研究人员可进一步提升从原始数据处理、变异检测到临床关联分析的效率,使过去隐藏在海量数据中的潜在线索能够被更系统地整合与解读。
在近期因美纳举办的专题论坛中,牛医生向生物技术领域的合作伙伴分享了团队的研究进展。结果显示,TruPath Genome在多种罕见疾病研究中展现出良好的应用潜力。
骨骼发育异常病例开启新的研究方向
一名患有骨骼发育异常的儿童长期未能获得明确诊断。牛医生团队运用TruPath Genome进行深入分析后,将研究重点逐步聚焦至与染色体易位相关的区域——如同将一张模糊的地图不断放大,关键线索逐渐清晰显现。
分析显示,这些染色体重排不仅改变了基因组结构,也影响了一个与骨骼发育密切相关的调控区域。该区域包含与软骨形成、骨骼生长及骨重塑相关的非编码RNA调控元件,有助于建立患者基因组结构变异与骨骼异常表型之间的联系。
这一发现也促使团队提出新的研究假设:致病机制不仅与编码基因有关,也可能涉及调控基因活性的非编码RNA及microRNA。这意味着本次分析不仅缩小了潜在病因范围,也为理解骨骼发育疾病提供了新的研究方向。
血液呈现“草莓牛奶”样的新生儿病例
在另一案例中,一名新生儿出现严重高甘油三酯血症,血液样本呈现罕见的“草莓牛奶”样外观。牛医生团队最初怀疑为家族性脂蛋白脂酶缺乏症,但多项检测始终未能明确病因。随后,团队采用TruPath Genome结合Emedgene AI进行分析,检出APOC4-APOC2基因区域的缺失变异。
“更整合的检测与分析流程,使原本隐藏在数据中的关键线索逐渐清晰,也帮助我们更系统地追踪和解析疾病相关信号。” 牛医生表示,“对于患者及其家庭而言,减少反复接受多项检测,也有助于降低不确定性带来的经济和心理负担。TruPath Genome为我们提供了新的研究视角,也为探索复杂罕见疾病的致病机制带来新的可能。我相信,这项技术的价值将在更多真实世界研究中持续得到验证。”
让罕见疾病研究逐步走向清晰
“在罕见疾病研究中,基因组信息为我们提供了重要起点,” 牛医生指出, “未来如果能够整合更多不同层级的生物学数据,将有助于以更系统的方式理解疾病机制,也为长期未解的疑难病例提供新的突破契机。”
从解析基因组暗区,到深入理解疾病背后的生物学机制,技术进步正不断提升研究人员对罕见疾病的解析能力。每一个更清晰的信号、每一个新发现的变异,都让研究人员更有机会将疑难病例中的零散线索逐步串联,从而构建对罕见疾病更加深入且精准的认识。
参考文献
1 Defined as the “dark-by-MAPQ” regions in Ebbert et al2, in which 90% of the reads covering the region have a mapping quality (MAPQ) less than 10.
2 Ebbert MTW, Jensen TD, Jansen-West K, et al. Systematic analysis of dark and camouflaged genes reveals diseaserelevant genes hiding in plain sight. Genome Biol. 2019;20(1):97. Published 2019 May 20. doi:10.1186/s13059-019-1707-2
3 Ryan NM, Corvin A. Investigating the dark-side of the genome: a barrier to human disease variant discovery?. Biol Res. 2023;56(1):42. Published 2023 Jul 20. doi:10.1186/s40659-023- 00455-0


