"有了Genome Analyzer,像我们这样的小型实验室也能在极短时间内完成非常大的项目。这台仪器相当于盒子中的基因组中心!"
Ecker博士是植物分子生物学和遗传学方面的主要权威之一。他是拟南芥基因组测序这个多国计划的主要负责人,还是拟南芥2010计划的重要成员,该计划旨在2010年前收集拟南芥所有基因的功能信息。
实验室的目的是了解引起表型变异的遗传和表观遗传改变。我们的兴趣主要是在植物上,特别是拟南芥,尽管我们也研究人类细胞。我们实验室完全是发现驱动型,而不是假说驱动型。我们的理解是:如果我们在全基因组水平使用这项技术,我们肯定会发现一些有趣的东西。这是我们研究中的唯一假说,这种方法也从来没让我们失望过。例如,我们知道我们不了解基因组中的所有转录本。现在我们转向序列水平,我们一开始就打算这样做,但是那时这种规模的实验对我们来说太贵了。
因此,也是必然,我们使用了本身分辨率较低的芯片方法。最终,我们了解基因结构、了解甲基化、了解DNA序列变异所需要的分辨率水平是序列。我们正与美国和世界各地的同事在构想一个计划,对超过1001个拟南芥菌株进行测序。当(计划)完成后,这个序列数据将以前所未有的分辨率水平实现全基因组关联分析。我们对这个计划非常兴奋,如果没有Genome Analyzer,那是无法想象的。
我们在3月开始甲基化组的测序。大约花了5个月的时间,我们现在已经接近尾声了。这在一年前是难以置信的。你需要40-50倍的覆盖范围,因为你在研究一群细胞。如果你研究50条染色体,它们可能甲基化,或者在某个位点甲基化,那么如果你想要定量特定位点的甲基化程度,你必须深度测序。于是问题不仅仅是这个特定的胞嘧啶是否甲基化,而是甲基化了20%、40%还是80%。如果我们用Sanger测序来达到50倍的覆盖,那相当于以2倍覆盖度对人的全基因测序。
Genome Analyzer的分辨率和信号都大大高于我们以前的芯片数据。我们看到它与tiling array有着极好的相关性,而Genome Analyzer还抓住了芯片错过的信息。我们发现,有一类事件,当甲基化不是成簇而是分散时,tiling array几乎完全错过,因为那儿缺乏足够的胞嘧啶让抗体pull down。因此当胞嘧啶甲基化水平相当低时,富集的方法会失败。相对于调控转座子,这种甲基化可能对调控基因很重要。沉默和CG甲基化之间有着很好的关联,不对称甲基化在调控中的作用胜过基因表达。因此在这些情况下了解序列变得特别有用,因为我们无法在芯片上看到很多。
既然人们的读数能达到十亿个序列,那我肯定他们会想出更多的应用。我想我们现在只看到冰山一角。目前发表的文章是关于显而易见的方面。人们将会考虑我仍未想到的东西,比如利用DNA序列作为读数的相互作用图谱。Cluster Station(簇生成工作站)*让你只需要它就能完成。你实际上能创造出一个工作的基础。Cluster Station*创造出密集的分子簇;你实际上创造出自定义的芯片。比如,你可以用这个去结合蛋白。你在一片玻璃上创造出数百万个双链分子,唯一的问题是你打算怎么处理它?
* cBot与Cluster Station(簇生成工作站)功能相同
Dr. Ecker is one of the leading authorities on plant molecular biology and genetics. He was a principal investigator in the multinational project that sequenced the Arabidopsis thaliana genome and is a leading member of the Arabidopsis 2010 Project, which aims to gather information about the functions of all Arabidopsis genes by the year 2010.