转录因子中的“明星”:一项划时代发现

作者: 王立铭

来源: 赛先生

发布日期: 2015-07-18

本文讲述了转录因子TFIIIA的发现及其在基因组编辑中的重要作用,探讨了锌手指蛋白的结构和功能,以及基因组编辑技术的发展历程。

“明星分子”TFIIIA,在研究生命最基本现象——DNA转录的大学实验室中被发现。短短16年之后,它就开始指引我们根据大自然的美妙规律,编辑自身基因组,战胜顽固遗传疾病了。

王立铭(浙江大学生命科学研究院教授、研究员,国家青年千人计划和浙江省千人计划入选者)在“基因治疗的前世今生”系列上一篇文章中,被喻为“黄金手指”的锌手指蛋白正式登场,今天继续讲述关于它的故事。

“黄金手指”到底是什么?它是如何被发现的?又将如何帮助我们精准定位基因组DNA?

在现代生物学和医学的历史上,很少有一个分子,能够凭一己之力,在最基本的生命现象与最强有力的疾病治疗之间架起桥梁。事实上,人类探索未知世界的规律,以及利用这些规律更好武装和造福自身的过程,总是充满意外、挫折、惊喜和坚持,从来不是看到开头就能猜出结尾的肥皂剧。这一次,我们要讲述的是人类探索史上少有的浪漫轻喜剧。一个叫做TFIIIA的神奇分子,见证了几十年中一系列巧合以及巧合带给我们的惊喜。

时间退回到1977年。已经在美国中部久负盛名的圣路易斯华盛顿大学任教4年有余的罗伯特·里德(Robert G. Roeder)有充分的理由志得意满。仅仅30岁出头的他,在十几年的科学研究生涯中几乎每一步都踩在了历史发展的鼓点上。

早在读研究生期间,里德利用生物化学方法,首次从动物细胞中提取并纯化出了三个能够以基因组DNA为模板、精确转录出RNA单链分子的蛋白质——RNA聚合酶I、II、III“三兄弟”。

尽管早在20世纪50年代,人们已经总结出分子生物学的“中心法则”,认为基因组DNA正是通过转录(即基于DNA模板的RNA合成)——翻译(即基于RNA模板的蛋白质合成)的路径,决定了我们人类身体所得到的大多数特性,但里德的发现,第一次从物质层面说明了DNA到RNA这一过程的生物学机制。这一里程碑式的发现迅速进入教科书,至今仍是生物专业大学生必修的基本概念之一。

在拿到博士学位、前往圣路易斯开始自己的独立研究生涯之后,里德和他的研究生和博士后们再接再厉,揭示了RNA聚合酶“三兄弟”的不同功能特性,圆满解释了为什么我们身体里需要三种而不是一种RNA聚合酶来作“中心法则”的执行者。罗伯特·里德因为在基因转录调控领域的杰出贡献,独享2013年拉斯克基础医学研究奖。在基因转录这一热门领域,这是难得的极大认可。

在同行眼里,里德是一个勤奋、难以亲近、严谨到近乎刻板的老牌科学家。

然而,某种来自本能的挑剔始终折磨着里德先生。这是一个习惯于“24×7式”工作、严谨到近乎刻板的生物化学家。数十年如一日,他坚持在周六清晨开实验室组会,习惯深更半夜打电话给实验室确认实验进展(而他自己早年当学生时,也有这样的经历,发现RNA聚合酶的那天夜里,他一个电话把导师从床上捞了起来)。生物化学的训练和思维方式已经写进了他的大脑和骨髓里,不过,他也因此而经受着折磨。

在一个古板的生物化学家看来,生命体,或者至少是细胞的所谓“生命”,实质上无非是许许多多化学物质混合反应的产物。因此,生物化学家的最高理想就是能把决定“生命”的许许多多物质找出来,小心翼翼按照一定比例混合在试管里,从而在试管中“创造”生命本身,或者至少“重现”生命的部分特征。

按照同样的思路,里德几年来一直在努力做一件事情:他和学生们用非洲爪蟾卵母细胞作为原料,提纯了他自己在学生时代发现的RNA聚合酶III,之后又想办法把细胞中的染色体DNA给提纯了出来。在一个生物化学家的世界里,把RNA聚合酶III和染色体DNA混合在一起,“砰”的一声,RNA应该就会被合成出来。

里德没有猜错,1977年他和自己的博士后Carl Parker在《美国科学院院刊》上发表了一篇学术论文,令人信服地说明,RNA聚合酶+染色体DNA,确实会在试管里诱导出50倍于本底值的RNA合成,新生的5S RNA(一种特别的RNA分子,能够被RNA聚合酶特异的合成)在胶片上能够清晰可见。

然而问题在于,所谓染色体DNA,指的是我们的基因组DNA在体内与许许多多蛋白交缠在一起形成的复杂物质。

我们知道,基因组DNA由两条缠绕在一起的碱基链构成,如果把人类基因组DNA分子拉直放平,总长度大概有2米多,而直径只有不值一提的数埃(1埃=100亿分之一米),这样的结构是无论如何也看不到、塞不进微米尺度的细胞里面去的。所以在体内,基因组DNA是被大量的蛋白质折叠、包装之后形成的结构,直径达到微米数量级(扩大了上万倍)而长度同时缩小到微米数量级(缩小了百万倍)。

因为能够被染料识别,并且在粗糙的光学显微镜下清晰可见,所以它被称为染色体。

因此,证明了RNA聚合酶+染色体DNA能够在试管内发挥功能,显然不能让刻板的生物化学家里德先生满意。天知道染色体DNA上还包裹、携带着什么东西!但是,里德的麻烦也从此而来。

他和博士后Parker在与上述1977年发表的同一篇论文中发现,如果用暴力的化学方法去掉染色体DNA上的蛋白质,只留一条光秃秃的DNA分子链,加上再多的RNA聚合酶也无法产生足量的5S RNA。这个发现说明,里德实验室的“试管化”功夫还没有做到家,存在于染色体DNA上的某些未知物质,对于生命体利用DNA合成RNA是不可或缺的。

这些未知物质是什么呢?

怎么把它们找出来,最终在试管里人工模拟出DNA转录的整个过程呢?接下来的3年,可能是里德实验室最有效率的时光。他们的目标很简单:找到这个未知的物质!

他们用到的方法是这样的:首先,准备好光溜溜的DNA分子;随后,把细胞打碎、收集,然后过筛子分离;再把分离出的不同组分一点一点加到光溜溜的DNA分子上,看看是否可以观察到合成的RNA;如果发现某个组分具备这种能力,就继续用各种筛子分离这个组分中小组分,然后继续丢到DNA分子上看是否产生RNA;直到最终从细胞内的上万种蛋白质中,找到一两种能够激活RNA转录的蛋白质。

这是一个极其繁琐、但又非常聪明而有效的活儿。大家可以简单想像一下这样的场景:给你一万颗传说中的“龙珠”,要求你从其中找出能够召唤神龙的唯一一颗。若要一颗一颗机械地试下去是不行的,神龙很快会不耐烦,你的人生也有限啊!于是你的方法是,首先把真假“龙珠”们按照个头大小分成10组,每组大约1000颗吧,然后用卡车一车一车运给神龙看。

假设,第3辆卡车里那1000颗龙珠里的某颗有魔法,可以召唤神龙,那么,你再继续根据红、黄、蓝、白、黑的颜色,把这1000颗继续分成10组,用笸箩装给神龙看。假设你又发现,原来召唤神龙的“龙珠”在红色那一笸箩里啊,于是你又根据质地、重量等等分组……

按照这个逻辑,其实只要分类5次,每次10组,就可以很快找到一万颗龙珠中间真正能召唤神龙的那一颗(10^5=10000)。但是,如何进行这5次分类,里面的学问可就大了:从哪里搞到这一万颗龙珠、每次按照什么标准分组、分几组、如何检验能否召唤神龙,等等。这是最考验神龙召唤者——啊不——生物化学家的时刻,而里德实验室深厚的生物化学功底帮助了他们。

亲和层析柱是蛋白质分离的工具,科学家手中寻找龙珠的武器。生物化学家们利用蛋白质分子各种各样的特性(例如大小和带电荷等等)对细胞内成千上万的蛋白质进行分组、分析和纯化。这些技术也被广泛应用于今天的现代制药工业。

1980年,寻找“龙珠”的努力修成正果。在当年发表的几篇学术论文中,里德和他的学生们发现了一系列能够帮助RNA聚合酶、在裸露的DNA分子上启动RNA合成的“辅助”蛋白。

基于它们在DNA到RNA转录过程中所起的作用,这些分子被赋予了一个新名字——转录因子(TF, transcription factor)。其中的一个转录因子叫做TFIIIA,顾名思义,就是能够促进RNA聚合酶III转录的、第一个被发现的转录因子。TFIIIA是我们今天故事的主角。在发表于1980年Cell杂志的论文中,里德等人发现,这种转录因子有个异常有趣的特性。

与同时期他们发现的许多转录因子(例如TFIIIB/C,TFIIB/D/E/F/H等等)不同,TFIIIA不是对所有DNA区域的转录都重要。它仅仅能够刺激一种非常特别的RNA——5S RNA的产生。进一步的分析说明,TFIIIA能够非常紧密的结合在DNA序列上,而且恰恰是编码5S RNA的那一段!这个现象表明,TFIIIA蛋白或许能够通过识别和结合5S RNA基因序列,特异性地启动这个基因的表达。

对此重大发现的意义,我们如何强调都不为过。因为这一现象至少提示了一个重要的可能性,即每个细胞中一模一样的DNA分子,可能由于不同转录因子的存在,在不同细胞中合成出千变万化的蛋白质分子。可以说,整个发育生物学以及整个遗传信息调控网络的研究,都源自30年前这个划时代的发现。

然而对于我们的故事来说,精彩的一幕才刚刚上演。

1983年,纽约州立大学石溪分校的Cheng-wen Wu实验室发现,TFIIIA蛋白结合DNA的能力需要一个金属离子——锌离子。1984年,里德实验室鉴定出了编码TFIIIA的蛋白质基因序列,使得人们可以容易地在实验室中大量生产TFIIIA,这个神奇分子的真容很快浮现。

1985年,来自英国医学研究理事会(MRC)的Klug实验室证明,每个TFIIIA蛋白均由9个长相接近的片段连接而成,每个片段都含有约30个氨基酸以及几个锌离子。在科学家的想象中,这30个氨基酸围绕在锌离子的周围,形成了类似于手指一样的立体结构,从而能够识别出特定的DNA三碱基序列。

而TFIIIA的9个手指结构,因此就具备了识别一个特定的3×9=27个碱基序列的高超能力,帮助它在汪洋大海般的DNA碱基中准确定位到5S RNA基因。

于是,大自然送给基因科学家的礼物——锌手指蛋白(zinc finger protein)终于进入了人们的视野。

锌手指蛋白的故事还有很多很多,从某种意义上讲,其背后是整个分子生物学的“黄金时代”。

在20世纪八九十年代,许许多多的转录因子被发现、研究,其中有很多至今仍被不断提及。例如,第一个人类转录因子SP1(加州大学伯克利分校钱泽南/Robert Tjian);受到外界病原体刺激而激发、负责启动人体免疫响应的转录因子NF-kappaB(洛克菲勒大学David Baltimore);在癌症和抗癌的永恒斗争中鼎鼎大名的p53、Rb和Myc,等等。

这些知识帮助我们进一步理解了生命现象的复杂,特别是同一套遗传物质如何造就五光十色的细胞类型和人类个体。

不过,锌手指蛋白的意义不止于此。

锌手指结构提示了一个非常诱人的可能性:既然每一个大约30个氨基酸构成的、包含锌离子的锌手指结构,能够特异地识别和结合独特的一组DNA三碱基序列(由A/T/C/G四个碱基自由排列而成),那么,如果自然界存在足够多样的锌手指蛋白,我们是不是可以从中筛选出各种各样的锌手指结构,进而可以覆盖全部64种可能的三碱基序列组合(4×4×4=64)呢?

而如果是这样的话,对这64种锌手指进行组合,我们是不是就可以轻易地定位到基因组上任何我们需要寻找的序列?这是否就是我们一直在讨论、但从未找到过的“基因组GPS”呢?之后,如果我们再找到传说中的基因组“剪刀”和“缝纫机”,是不是就可以自由地编辑、改写基因组了呢?

好事成双。1996年,人们同时找到了“基因组GPS”和“剪刀”,定点修改基因组的理想出现了技术上的可能性。

应该说,这又是一段有着喜剧色彩的研究历史。在美国东海岸的约翰·霍普金斯大学任教的Srinivasan Chandrasegaran最终成为“基因组GPS”的发现者,但他本人其实是研究基因组“剪刀”功能的!Chandrasegaran实验室的研究兴趣主要是一类能够剪切基因组DNA的蛋白质——限制性内切酶。这类蛋白质的功能是在DNA双链的某个特定区域咔嚓一刀,把DNA长链从中切断。

例如,Chandrasegaran实验室关注的一个名叫FokI的限制性内切酶,能够切断任何带有GGATG-CATCC回文序列的DNA链。

1994年,Chandrasegaran实验室发现,FokI蛋白有一个有别于很多限制性内切酶的非常有趣的特点。它识别GGATG-CATCC回文序列和切割这个序列的功能是完全分离的:蛋白的前半部分专门负责定位,后半部分则专门负责剪切。他们还令人信服地证明,通过修改FokI蛋白的前半部分,可以让FokI蛋白完美更换剪切的目标序列。

值得指出的是,限制性内切酶虽然同时具备定位基因组序列和切割的能力,但是用其基因组定位功能来做基因组编辑是不太现实的。因为大多数限制性内切酶一般只能识别个位数的碱基序列,而在人类基因组中,任何由六七个碱基构成的组合其重复出现的概率实在太高,高到技术上失去了任何特异性。因此,已经剪刀手在握的Chandrasegaran实验室的目光所及之处,便是所有带有“基因组GPS”功能的“活地图”。

1996年,Chandrasegaran实验室终于让锌手指蛋白和FokI“剪刀手”走到了一起。他们在FokI“剪刀手”的一端连接上三个不同的锌手指结构,随后观察这个杂种蛋白到底会剪切什么样的DNA序列。我们已经知道,每个锌手指结构能够识别一个特定的DNA三碱基,因此三个锌手指结构应该能帮助我们把DNA“剪刀手”准确运送到一个特定的9碱基位点上去。

实验取得了完美成功,两个人工构造的杂种蛋白毫无悬念的准确找到了这个9碱基位点并痛下杀手。9碱基序列本身当然还远不足以帮助人们在30亿个人类基因组碱基中定位,但是,这个实验结果已经确定无疑地告诉我们,基因组编辑的时代至少在理论储备上已经接近成熟了。

基因组GPS和剪刀的组合:锌手指内切酶(ZFN/zinc finger nuclease)。

把限制性内切酶的剪切功能部分(FokI cleavage domain)和几个针对特定碱基序列的锌手指蛋白结构(ZFP, zinc finger protein)结合在一起,人工构造出能够准确定位基因组序列并执行剪刀功能的杂种蛋白ZFN。值得一提的是,基因组编辑所需的最后一项技术——剪切之后的再缝补——倒是不需要科学家们太过操心。细胞内原生的各种酶可以一定程度上自动起到这个功能,我们后文会讲到。

接下来,我们需要在技术上、商业上、伦理上做好准备。本文讲述的“明星分子”TFIIIA,在研究生命最基本现象——DNA转录的大学实验室中被发现。短短16年之后,它就开始指引我们根据大自然的美妙规律,编辑自身基因组,战胜顽固遗传疾病了。每想到这里,我都会对孜孜以求破解自然奥秘的科学家们心生敬意。而作为生物医学研究的大同行和小晚辈,我也会不由自主羡慕前辈们的好脑筋和好运气。

UUID: d0213628-2898-4145-9bea-12b58026f2e2

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/赛先生公众号-pdf2txt/2014-2015/赛先生_2015-07-18_转录因子中的“明星”:一项划时代发现.txt

是否为广告: 否

处理费用: 0.0283 元