新科诺贝尔化学奖得主保罗·莫德里奇(Paul Modrich)和同事曾在2006年第7期《环球科学》上发表文章《组装生命的生物工厂》,向全球读者介绍刚刚兴起的“合成生物学”:借鉴工程技术的成功原理和实践,将有助于生物技术由一种特种行业向成熟产业转型。
虽然“基因工程”这个词已至少用了30年,DNA重组技术也是现代生物学研究的主流技术,但是大多数生物工程学家所进行的生物相关研究,却与工程技术鲜有共同之处。其中一个原因就是,现有的生物工具,在标准化和实用性方面还没有达到与其他工程技术领域相应的水平;而另一个原因,则是生物学的研究方法和思路还有待改进,尽管生物学研究已经深受工业技术的影响。
举例来说,电子工程的转型起始于1957年。
那一年,美国Fairchild半导体公司(这家公司的所在地就是后来的硅谷)的琼·霍尔尼(Jean Hoerni)和罗伯特·N·诺伊斯(Robert N.Noyce)发明了平面技术。这是一种利用光掩模(photomask),在硅晶圆(silicon wafer)内,对金属及化学物质进行层叠和刻蚀的系统。
利用这种新技术,工程师们不仅能够制造出品质稳定的、简洁的集成电路,还能通过改变光掩模的模式,制造出各种类型的电路。
在那个年代,电子电路的标准制造方法还比较原始,只是将电路的各个晶体管(transistor)逐一串连起来。这是一种手工制造过程,其产品质量参差不齐,被新兴电子工业界公认为技术瓶颈。相反,平面技术则大步前进,进展速度惊人,与著名的摩尔定律(Moore’s Law)所提出的速度相差无几。
半导体芯片的设计制造技术与方法学相结合的产物——芯片制造厂(chip fab),已成为史上最成功的工程范例之一。它也为另一新兴技术领域——生物体系制造业,提供了宝贵的发展模式。
实际上,今天的基因工程师所使用的方法,仍处于较原始的阶段。正如我们的同事,美国麻省理工学院人工智能实验室的汤姆·奈特(Tom Knight)所说的那样:“DNA序列的组装技术没有标准化,致使每一次DNA组装反应在自身还处于实验阶段的同时,就不得不充当解决目前研究课题的实验工具。”
生物工程在制造方法和组件上的标准化,可以促使兼容组件设计库建立,并使组件的加工外包成为可能。
理论与制造的分离,使生物工程师能够自由地构想更加复杂的装置,并应用强大的工程工具(例如计算机辅助设计),来处理由此而来的复杂性。向着这些目标,我们小组的成员已经开始寻找和开发能够构成“生物工厂”(bio fab)基础的仪器和工艺技术。我们还想组建一个团队,然后借团队的力量,将最好的工程原理和实践应用于生物技术。
如果说单个的晶体管是电子电路的基本组件,那么在生物学中,与之对应的便是基因(有序的DNA片段)。为了给高级的生物装置构建基因电路(genetic circuit),我们就需要一种快速可靠、价格合理的DNA片段合成法。
20年前,在前人的工作基础上,美国科罗拉多大学博尔德分校(University of Colorado at Boulder)的马文·H·卡拉瑟斯(Marvin H.Caruthers),利用DNA自身的化学性质,研发出一种单链DNA合成法。
DNA由4种核苷酸组成,而每种核苷酸又含有一个相应的碱基,分别是腺嘌呤(adenine,A)、胞嘧啶(cytosine,C)、鸟嘌呤(guanine,G)和胸腺嘧啶(thymine,T)。碱基之间的亲和力使它们两两配对(A-T配对,G-C配对),形成梯状双链DNA分子中的梯级。化学键不仅在碱基对之间形成,在邻近的核苷酸之间也会形成。
卡拉瑟斯所使用的方法被称为固相亚磷酰胺法,这是目前大多数商业DNA合成法的基础。合成反应起始于一个单核苷酸,这可不是一个普通的核苷酸,它附着在悬浮于酸性液体中的固相支持物(如聚苯乙烯颗粒)上,并承担着发起合成反应的重任。当碰见“新来”的核苷酸,两者便会通过形成化学键相连。如果不断加入核苷酸,反应就会持续进行,核苷酸链就会不断延长。
这样,就可以合成任何想要的核苷酸序列,并且不易出错(出错几率约为1%)。
但很多时候,生物工程师想要的基因片段,远远超出了该方法的合成能力。一个简单的基因网络也许就有数千碱基对;就算像细菌这样的微小生物,基因组也可达数百万碱基对。因而,我们如果想找到高产出、低误差的合成法,就只能寄希望于从自然界中获得一些提示了。
在生物体中,像酶(如聚合酶)这样的生物机器,能以高达每秒500个碱基的速度,合成和修复DNA分子,而错误率仅为十亿分之一!这就意味着,即便是最好的DNA合成机器(每300秒合成1个碱基),产出率(输出量/错误率)也不及聚合酶的万亿分之一。更有甚者,在细菌体内,当复制像基因组那样的长链DNA时,多个聚合酶会同时运作,在20分钟内就能合成含有500万个碱基的DNA!
于是,丘奇开始仿效细菌聚合酶的这种平行作业方式,以适应现有的基因芯片技术。基因芯片其实就是特殊的玻璃片,在它的表面上,繁星般地点缀着长为50~70个碱基的寡核苷酸(oligonucleotide/oligo,短小的核苷酸链)。通过亚磷酰胺反应法,寡核苷酸被同时合成于基因芯片的表面,并以格状排列,密度高达100万点/平方厘米。
在传统技术的基础上,我我们又在这些寡核苷酸上加上可剪切的连接子,以便特定的寡核苷酸能够从基因芯片上释放出来。在我们的实验性基因芯片上,每个点约为30微米宽,含有大约1000万个寡核苷酸分子。
通常,基因芯片上的核苷酸链被称为构建性寡核苷酸(construction oligo),因为它们的部分序列是相互重叠的,通过重叠的序列,可将它们组装成更长的DNA结构(如整个基因)。但是,任何含有错误序列的寡核苷酸都必须被清除。为此,我们采用了两种不同的纠错方法。
第一种是选择性寡核苷酸(selection oligo)法。
合成选择性寡核苷酸的方法与制造基因芯片的方法相同,只是在核苷酸序列上,前者有特殊的要求:与构建性寡核苷酸的序列互补。合成之后,便对连接子进行剪切,从玻璃片上释放选择性寡核苷酸,并使它们流过构建性寡核苷酸的芯片。按照碱基配对的原则,选择性寡核苷酸就会与互补的构建性寡核苷酸结合(杂交,hybridize),形成双链DNA。
这样,任何不能配对,或者含有错误序列、配对不完全的构建性寡核苷酸,都无法逃过我们的“法眼”,也就无法继续在芯片上“滥竽充数”。与制造基因芯片一样,在合成时,选择性寡核苷酸的序列也会出错。但是,构建性与选择性寡核苷酸的错误序列很难完全互补。因此,利用一组寡核苷酸对另一组进行校对是一种有效的纠错方法。利用这种方法,我们合成寡核苷酸的平均错误率可以低至1/1,300。
正如人们所料,生物体系非常注重自身复制的精确度。我们的第二种纠错方法就来源于自然界。十年前,莫德里奇首先发现了生物体系复制时的详细纠错过程,并将这个过程命名为“MutS,L,H”。当两条DNA链的碱基不能完全配对时,那么在错配区,便不能形成双螺旋结构。MutS是一种天然存在的蛋白,它会识别这种缺陷,并与之结合。随后,它招集“同伴”——MutL和MutH,共同完成修正任务。
利用该方法,雅各布森与美国麻省理工学院的彼得·卡尔(Peter Carr),已经将DNA合成的错误率降到1/10,000。对于生产小型基因网络,这样的保真度足矣。
在可释放性平行合成技术和纠错技术的支持下,长链DNA的合成速度更快、成本更低、精确度更高。这些技术将是生物工厂的基础,随着时间的流逝,它们会像半导体芯片光刻技术那样,不断进步。先进的技术是宝贵的财富,能解放我们的思想,让我们思考更多:在生物工厂里,我们可以做些什么呢?
利用生物工厂的平台探索征服疾病的新方法,是我们最早的目标之一。基斯林和贝克的研究对象是疟疾和艾滋病——两种困扰人类多年的恶疾,他们致力于开发对付这两种疾病的药物。尽管我们所研究的治疗方法与他们的不尽相同,但在很大程度上,两个小组的研究都依赖于精确合成长链DNA的能力。我们的研究只是工厂化的一个代表,工厂化拥有强大的力量,必将颠覆传统的新药开发模式!
以疟疾为例,已有药物能将感染者体内的致病寄生虫彻底消灭,从而根治疟疾。这是一种小分子药物,叫做C-15倍半萜(sesquiterpene),俗名青蒿素(artemisinin),是由青蒿植物(sweet wormwood,多发现于中国华北地区)合成的天然化合物。但在植物中,天然合成的青蒿素过少,造成青蒿素的价格极其昂贵,无法推广。
因此,在过去五年中,基斯林的研究小组努力克隆合成青蒿素的遗传途径,并将它插入酵母菌中,让酵母菌大量合成青蒿素。
在酵母菌中,我们还能对遗传途径进行改良,使青蒿素的合成效率大幅提高。青蒿素的合成途径叫作甲羟戊酸途径(mevalonate pathway),目前,我们已经能够对途径中的关键基因进行重新设计。较之细菌中的原始途径,关键基因的改变可使青蒿酸(amorphadiene,青蒿素的前体)的产量提高10万倍!但这仍然不够,要使青蒿素得到广泛应用,必须进一步提高产量。这就需要我们对整个青蒿素途径进行综合重建。
整条遗传途径由九个基因构成,每个基因的平均长度约为1,500个核苷酸。因此,我们所构建的每个新途径大约包含13,000个核苷酸。另外,还需要制造每个基因的突变型,再对不同基因的突变型进行组合,挑选出最优组合。假若为每个基因制造两种突变型,那么,我们就得合成2^9即512条遗传途径,共约600万个核苷酸!对于传统DNA合成技术,这项任务无疑难于登天;而对于基因芯片合成技术,这不过是小事一桩。
工厂化技术不仅可以用于大规模合成基因网络,还可以用于创造新型蛋白,例如化学合成反应或治理环境污染所使用的新型催化剂,以及用于基因疗法或杀灭病原体的高特异性酶。贝克的研究小组正在开发一种计算机设计法,用于设计新型蛋白结构。他们已设计出两种新型蛋白,可以模拟人类免疫缺陷病毒(HIV)表面的重要特征。目前,这两种蛋白已作为候选疫苗,并进入了测试阶段。
计算机辅助设计法也有局限性:不够先进,不能保证设计出来的所有蛋白都具有期望中的功能。但计算机可以设计出成百上千的、有希望的候选蛋白,供我们试验。如果把这些蛋白结构转化为相应的基因序列,那就需要合成上百万的核苷酸。对于现今的技术,这是一个困难而昂贵的方案,但利用工厂化技术,可以毫不费力地完成任务。
上述针对疟疾和HIV的DNA、蛋白质合成研究表明,这种以生物工厂技术为基础的方法,可用于对付更多的疾病,包括新出现的疾病。比如,将高效而廉价的DNA测序方法与工厂合成能力相结合,我们就可以快速鉴定新型病毒(如SARS病毒)或新型流感病毒,然后再以现有技术难以企及的速度,制备相应的蛋白疫苗。
当然,生物工厂并非只是一个高速合成技术的集合体,而是一种方法:不仅对现有生物机器进行思索,而且借用工程学的语言和方法,构建新型生物机器。
2000年,当时就职于美国普林斯顿大学(Princeton University)的迈克尔·埃洛威茨(Michael Elowitz)和斯坦尼斯拉斯·莱布勒(Stanislas Leibler),以及美国波士顿大学(Boston University)的柯林斯、蒂姆·加德纳(Tim Gardner)和查尔斯·坎托(Charles Cantor)等人,利用生物零件(biobrick)制造了第一批基本电路元件:一个环形振荡器和一个扳键开关。
他们的研究代表了人造功能性生物电路的首次成功。而早在1975年,科学家们就已经知道,自然界的生物正是利用此类电路来调控它们的基因——从知道到成功,科学家们用了整整25年的时间!
埃洛威茨和莱布勒的环状振荡器很好地阐释了何为生物电路。振荡器的基本电路是一个质粒(plasmid,环状DNA),该质粒带有三个基因:tetR、lacI和λcI,分别编码三种蛋白:TetR、LacI和λcI。
任何基因翻译成蛋白质的首要条件是,聚合酶(polymerase)与基因上游区域的启动子(promoter)结合。随后,聚合酶将基因转录为信使RNA(messenger RNA),然后信使RNA被翻译成蛋白质。如果聚合酶不能与启动子结合,那么基因就不能被翻译,也就不能生成蛋白质。
埃洛威茨和莱布勒给三个基因的蛋白产物分配了特殊的任务:选择性地与另外一个基因的启动子结合。
如此一来,LacI蛋白与tetR的启动子结合,λcI蛋白与lacI基因的启动子结合,而TetR蛋白则与λcI基因的启动子结合。这种关联性使得一个基因的蛋白产物能够阻遏聚合酶与另一个基因的启动子结合。因此,这三种蛋白的生成构成了一个振荡循环:大量LacI蛋白的生成抑制了tetR基因的表达;TetR蛋白的缺失使λcI基因得以表达;而λcI蛋白又抑制LacI蛋白的生成,这个过程不断循环。
若将该循环中的一个基因与表达绿色荧光蛋白的基因相连,再将整个电路转入一个细菌中,那么你就会发现神奇的一幕:这个细菌会像节日彩灯般闪烁!与之相似,柯林斯小组最新研制的基因扳键开关也可用于细菌的程序化:一旦细菌的DNA受损,那么在细菌周围就会出现一种跳跃着绿色荧光的“菌苔”!
最初,在测试制造半导体芯片的新工艺时,电子工程师会制造电子电路,将它作为检测工具。
在功能上,合成生物电路(synthetic biological circuit)与这些电子电路完全一致,这可能会让很多人不敢相信。电子工程师们知道,像振荡器或开关这样的基本组件,在逻辑上是相通的。如果能可靠并精确地制造出这些简单组件,那么就有可能设计制造更为复杂的电路。
同样,一旦生物工程师能理所当然地将合成生物电路视为基本材料,他们就可以走得更远:创造多细胞体系、进行二维和三维设计、制作非生物功能装置,都将不再是难事。
最近,韦斯制造出一种多细胞体系的原型,它能检测爆炸物或化学药品。当发现可疑物时,它就会发出可视信号。这种生物机器使我们能够利用指令和协议对上百万的细菌细胞进行程序化,让细胞在执行命令的同时,进行细胞间的交流,并且输出多彩的光信号。
受到这些早期范例的启发,恩迪与奈特,和我们的同事——美国麻省理工学院的兰迪·雷特伯格(Randy Rettberg)一起来,正在建立生物组件库,类似于电子晶片设计师们的资料库。这个标准生物零件注册库(Registry of Standard Biological Parts)将会推动各种生物构建的研究,而且我们希望有更多的人为注册库添砖加瓦。
迄今为止,注册库已涵盖了超过1000种的生物零件,其中包括许多与电子器件相仿的零件,如变换器(inverter)、开关(switch)、计数器(counter)、放大器(amplifier)以及能够接收输入信号或进行输出显示的组件。我们还定义了一个标准信号载波(standard signal carrier)——聚合酶/秒(PoPS),近似于连接两个电子组件的导线中的电流。
这样一来,生物工厂的工程师对基因装置进行组合和重新利用时,就能更得心应手。
为了发扬生物工厂技术,也为了培养后继人才,美国麻省理工学院的研究小组于2003年,开设了第一门关于生物零件的工厂工程课程。这个课程很快发展成一项年度竞赛。今年夏天,30多个大学的团队将会慕名而来。
自国际基因工程机器(International Genetically Engineered Machine,iGEM)竞赛开设以来,在很短的时间内,就已经产生了许多令人惊叹的细胞装置(cellular device):可以记录和显示相片的生物膜(biofilm),以及能够像开关一样对小分子输入信号(如咖啡因)进行感知和响应的程序化细胞。
有一个iGEM参赛作品,由斯莫尔克、柯林斯和丘奇共同开发研制,这是一个利用一系列DNA片段进行数字计数的装置。区区20个DNA片段就能对上百万(2^20)种的细胞状态进行计数和报告。这项技术可以融入传感器,而传感器又能与工程化的代谢途径(例如,基斯林的研究小组研发的青蒿素合成的优化途径)相连。于是,只须用手指扳动开关就能提高药物产量!
当我们刚开始致力于建立生物工厂时,精确快速而又廉价的长链DNA合成法还没有浮出水面。今天,生物工程师们拥有的工具越来越多,长链DNA合成技术只是其中之一。目前,我们正朝着一种生物工厂的生产模式发展,即首先在计算机中对生物装置进行设计和建模,然后将它“裁剪”成最终的生物形式。这与硅晶片首先被设计出来,然后通过刻蚀而成的过程非常相似。
与半导体电路一样,这种方法还有一个附加的好处:我们可以优化零件之间的相互作用,以及预测可能出现的问题。当我们所构建的体系越来越复杂时,这个能力就变得越来越有用。而抽象设计的另一个优点是,生物工程师不必从头开始构建每一个零件,也不必清楚每一个零件在内部如何运作,他们只须知道这些零件能够可靠地运作就足够了。
参加iGEM的学生代表了第一代生物学家工程师,他们在事业起步之初所接受的训练,就使他们将自己视为生物学家兼工程师。然而,我们所面临的一个重要挑战,是如何使更多的生物学家像硅片工程师那样思考,并吸引更多的工程师进入生物领域,特别是涉及零件共用的时候。直到现在,生物技术仍然像一个独立自足的工作团体,开发单一用途的物质(如某种药物)。而今后,在很大程度上,生物技术还需要各种团队所提供的辅助体系。
我们希望,为生物学建立工厂可以推动这个进程,并且使它如半导体工业一样,取得革命性的进步。