一段转基因公案（上）：槽点满满的研究

一切都要从这张照片说起。

这张照片来自《食品与化学毒理学》杂志。2012年11月，由法国卡昂大学分子生物学家塞拉里尼教授带领的科研小组在这个杂志上发表了一篇学术论文，题目是：“草甘膦除草剂和转基因玉米的长期毒性的研究”。照片中展示的是患有乳腺瘤的雌性大鼠，这一点从皮肤上鼓起的巨大的包上看得出来。那么得了乳腺瘤的是哪些可怜的大鼠呢？

作者在图片的下方用字母做了注解，GMO指的是吃了转基因玉米的，GMO + R是吃了施加有草甘膦除草剂的转基因玉米的，而R指的是喝了一定浓度除草剂的。所以，这张照片给大众展示的就是：吃了转基因玉米或除草剂的大鼠得乳腺瘤了。这也是作者的意思。早在当年的9月18日，文章刚刚在《食品与化学毒理学》杂志网页上提前发表的当天，塞拉里尼就召开了新闻发布会向部分媒体公布了这一研究结果。

之后的几天，这张图片在大众媒体和网络上得到了大量的流传，向大众传递着一个转基因致癌的信息。比如，法国《新观察家》杂志就以封面故事的形式发表了《是的，转基因食品有毒》的文章。媒体的宣传和大众的关心让本来在转基因问题上就比较谨慎和保守的欧洲政府迅速做出了反应。法国时任总理让-马克·埃罗表示，如果这一结果被证明是真的，那么政府将在全欧洲范围内禁止该转基因玉米。

欧盟也立即指令下属的欧洲食品安全局对这项研究进行评估。欧盟之外的俄罗斯则干脆直接暂停来自美国孟山都公司的转基因玉米。而远在非洲的肯尼亚，则在两个月后出台了禁止一切转基因农作物的规定，缘由也是这篇论文、这张图片。如今，这件事已经过去了六年，在学术界基本上也有了这项研究的结论不成立的定论，但这张照片作为转基因食品有害的证据还在大众中流传，而且这项研究也依然被反对转基因的人士拿出来当证据。

所以，依然有必要回顾一下这桩学术公案，也科普一下为什么那篇文章的结论不成立。

那张流传甚广的照片只是塞拉里尼的研究里的其中一个图的一部分，因为直观和能吸引眼球而被重点突出了出来。一个受过基本生命科学训练的科研人员在看了这张图片之后，第一个会问的问题是：对照呢？是啊，既然这项研究要给大家传递一个吃了转基因玉米容易得乳腺瘤的信息，那么这个“容易”是相对于什么而言得出来的呢？

换句话说，那个“不容易”得乳腺瘤的大鼠吃的是什么呢？科学实验都需要合适的对照，因为对照能告诉你实验结果意味着什么。举个简单的例子，假设给一些小鼠喂苹果，然后这些小鼠得了胃病。我们就可以因此得出吃苹果让小鼠得胃病的结论吗？不能，因为我们不知道这些小鼠如果没有吃苹果是不是也会得胃病。所以，如果我们想要判断吃苹果是否会导致小鼠得胃病，需要把小鼠分成两组，一组喂苹果，一组不喂苹果。

如果只有喂苹果的那组小鼠（实验组）得病，我们才可以下结论说是吃苹果让小鼠得胃病了。不喂苹果的那组就是对照组。《食品与化学毒理学》作为正规的学术刊物，当然不会发表一项连对照都没有的研究。所以，我们先要去认真看看那篇论文。

令人疑惑的实验设计。塞拉里尼等人的研究是这样设计的，他们用了200只Sprague Dawley大鼠（以下简称SD大鼠）来做这个实验。

其中100只雄性SD大鼠被随机分成了10组（每组10只）。对照组SD大鼠喂的是掺有33%的非转基因玉米的正常大鼠饲料。剩下的九组为实验组，其中三组喂养转基因玉米（分别掺有11%、22%、33%的转基因玉米），另外三组喂养用过草甘膦除草剂的转基因玉米（分别掺有11%、22%、33%的用过草甘膦除草剂的转基因玉米），最后三组喂养对照组一样的非转基因玉米饲料，但在饮水里加入了三个不同浓度的草甘膦除草剂。

和雄鼠一样，另外100只雌性大鼠也采用了同样的分组来进行实验。在这个实验里，为了保证大鼠的饮食量和生活空间的一致性，所有大鼠都是两只一笼地进行饲养。整个实验耗时两年，这是一个规模不小的动物实验。

要看懂这个实验设计，先要简单介绍一下转基因玉米和除草剂。这项研究里用的转基因玉米是来自美国孟山都公司的NK603品系，是一个带有抗除草剂基因的转基因品系。

所以，在栽培这种转基因玉米的时候，使用除草剂不会影响玉米的生长，从而节省劳力和成本，提高种植效率。但是，这一转基因作物的栽培让大家有两个关于食品安全上的疑问。一是食用转基因玉米安全吗？二是除草剂在玉米中的残留会不会危害健康？塞拉里尼的研究就是为了探讨这两个问题的，所以他们的实验里的不同实验组除了有喂养转基因玉米的，也有饮水里有除草剂的，还有喂养用过除草剂的转基因玉米的。

看到这里就知道了，这项研究的确是有对照的，对照组喂了含有33%非转基因玉米的大鼠。只不过这个对照没有在上面的那个令人印象深刻的图里展示出来，原因我们后面再谈。

因为我们先要谈谈这个实验设计里的一个缺陷，即使用实验动物的数目。一般来说，出于保护动物的要求，我们需要尽量使用少的动物数量来开展实验。但是，另一方面，根据实验目的的要求，每个实验会有一个最低的实验数目要求，以保证得出有说服力的数据。

比如说，一般90天的毒理试验，每个实验组需要至少10只动物；而关于肿瘤的实验，每组的动物数目则需要至少50只。而在这一项关于肿瘤的实验里，作者只使用了10只SD大鼠。所以，这个较小的动物数量，很难帮助作者研究出转基因食品和肿瘤的关联。

讲完了实验设计，接下来我们看这项研究的实验结果。文章的结果部分先显示的是大鼠的死亡情况，研究转基因玉米和除草剂是否会导致大鼠非正常死亡。

作者用对照组雄鼠和雌鼠分别的平均年龄为界，小于平均年龄的死亡被定义为非正常死亡。那么，结果是什么样的呢？在对照组的雄鼠里，30%的大鼠非正常死亡（10只里面有三只），而其它九个实验组的雄鼠非正常死亡率则在10%（包括喂养22%含量的转基因玉米组，喂养33%含量的转基因玉米组和饮用高浓度除草剂的实验组）到50%之间。雌性大鼠的非正常死亡情况和雄性大鼠有些不同。

对照组中有20%的大鼠非正常死亡（10只里面有两只），而其它九个实验组的雌鼠非正常死亡率则在30%到70%之间。对于这一结果，作者在论文里是这样描述的：“对照组里雄性和雌性大鼠的非正常死亡率分别是30%和20%，而这一数据在一些喂养转基因玉米的实验组里却达到了50%和70%。”这一描述看上去是正确的，的确，部分实验组的非正常死亡率达到了50%和70%。

但这一描述看上去说的是事实，却存在一个大问题，就是没有进行科学统计分析。在科学研究里，要比较两个实验组之间是否有显著的差异，需要进行统计分析，来检验这种差异不是随机发生的，而真正是两组之间的差异。利用统计软件，我们可以比较两组数据，并得出一个P值。P值越小，说明这个差异是随机发生的可能性就越小，而反映真实差距的可能性就越大。

一般而言，如果P值小于0.05，意思是差异是随机导致的概率小于百分之五，那么从科学统计上来说，这个差异是显著的。也就是说，P值为0.05，是统计学上判断差异是否显著的一道红线。

现在回到塞拉里尼的研究结果上来，在图一里显示的非正常死亡率上，对照组和实验组差异最大的出现在雌性大鼠对照组（20%，10只里有两只）和喂养22%含量的施加过除草剂的转基因玉米组（70%，10只里面有7只）。

20%和70%看上去是一个很大的差异，但如果用统计学软件来分析这一差异，它是否达到了显著的水平呢？答案是没有达到显著水平，因为P值是0.06，大于0.05这一红线。大概，这也是作者在文章里不提统计结果的原因。读到这里，有些读者可能要问了：70%比20%，有3.5倍的差别，为什么还不显著呢？答案是标本的数量太小，每组只有10只大鼠。如果每组有20只大鼠，而且比例还是70%和20%，那么就肯定显著了。

或许还有读者会问，P值为0.06和0.05不就是说明这个差异是随机导致的概率分别为6%和5%吗，它们之间为什么就有那么大的分别？这是一个好问题。一方面，因为上面提到的，5%是科学上认定是否显著的一道红线，只有低于5%才能被称为显著。所以，从这个意义上来说，是有很大的区别。

但另一方面，6%和5%之间的区别的确又不大，因为如果一个P值为0.06的差异在增加标本数量后还是有同样的趋势，那么它的P值就会变小，从而变得显著。所以，当一个科学家观察到一个P值为0.06的差异并认为这一差异很可能有生物学意义时，他一般会增加样本的数量去重复实验来再次检查这个差异是否能到达显著的水平。

最后，更重要的是，无论是0.05还是0.06的P值、显著还是近似显著，仅有一篇研究还很难给一个问题下定论。只有当这个结论被不同的研究都证明了，才能真正地被科学界接受。

体内肿瘤数目在实验组反而比对照组低。接下来是文章结果的第二部分，也是这篇论文的核心部分，就是肿瘤在这些大鼠中的发生情况。大鼠肿瘤的检测，作者使用了两种方法。一种是当大鼠还活着的时候用手去感触的方法，来检测可以感触到的大的肿瘤。

另外一种就是当大鼠死亡后，解剖尸体详细检查身体里的肿瘤发生情况。先说手能感触得到的肿瘤的发生情况，这类肿瘤一般发生在皮肤上，体内较大的瘤和雌性的乳腺瘤也能被触摸得到。作者在文章里这样描述：“到第二十四个月，30%的对照雌性大鼠患有可以触摸到的大肿瘤（主要是乳腺腺瘤），而在实验组这一数字在50%到80%之间。

对照组雄性大鼠这样大的可触摸的肿瘤的发生率只有雌性大鼠的五分之一左右（大约6%），而实验组雄性大鼠的这类肿瘤的发生率的平均值是对照组的两倍。”小鼠死亡后解剖学检测的肿瘤发生情况，作者用了一句很简短的话进行描述：“当最后把那些内脏器官里不可触摸感知的肿瘤也加入计算，得到的总的肿瘤的数目在对照组和实验组间没有什么区别。

”从这里便看得出来，作者想表达的意思是：实验组比对照组要更容易产生触觉可以感知到的肿瘤。但同样是统计的问题，这些可触觉感知的肿瘤的发生率在实验组和对照组间的差别是显著的吗？作者没有说明。如果用统计软件来替作者做这个统计，便会发现，这些差异也是不显著的。也就是说，“实验组比对照组要更容易得可以触觉感知的肿瘤”这一结论是不成立的。

另外，既然可触觉感知的肿瘤的发生率在实验组高于对照组，而总的肿瘤数上却没有区别，那说明在体内的不可触觉感知的肿瘤数目在实验组反而比对照组低了。而对于这一点，作者却没有提出来。

作者接下来给读者呈现的结果就集中到那几类在实验组比对照组看上去多发的肿瘤上，包括雄性大鼠的肝、消化道和肾里的肿瘤，以及雌性小鼠的乳腺和垂体的肿瘤。

文章的表二列出了这些肿瘤在各组小鼠里的发生情况，包括瘤的数目和携带肿瘤大鼠的数目。再一次，作者没有做统计分析，而是在文章里进行了这样的文字描述：“在雌性大鼠里，大多数的实验组中垂体瘤的数量是对照组的两倍左右。而在雄性大鼠中，实验组肝上的肿瘤的数量是对照组的2.5到5.5倍不等。”这种以“倍数”来描述结果的方式，给人印象很深刻，但在没有进行统计分析的情况下使用这种描述不仅不严谨，还有误导之嫌。

更有误导之嫌的是这篇文章的图三，也就是含有上面那幅大鼠肿瘤照片的图。作者想用这个图来展示一些有代表性的肿瘤的照片。说这个照片有误导之嫌，是因为这些照片并没有代表性。那么，什么照片才算有代表性呢？因为一般来说，一个实验组只会用一张照片来代表，所以有代表性的照片必须是能反映这个实验组真实情况的。另外，如果要用代表性的照片显示实验组和对照组的差异，前提必须是这两个组间有显著性的差异。

让我们回过头来看这个图，尤其是上面那个大鼠乳腺瘤的图。作者只显示了喂养了转基因玉米、施加过除草剂的转基因玉米、和除草剂的三实验组的大鼠照片，而没有呈现对照组的大鼠照片。这给人的印象是，对照组大鼠，也就是喂养了非转基因玉米的大鼠没有乳腺瘤。但实际上，在该论文的结果部分的表二里，作者给出的数据里明明白白地提到对照组大鼠同样有乳腺瘤。

就这样，一篇实验设计不严谨、没有科学统计的学术论文在一家正规的学术期刊正式发表了出来。

转基因食品的安全性在之前被世界各地不同科学家进行过多次研究，一致的结论是：没有证据表明转基因食品和非转基因食品在安全上有显著的区别。唯一的例外就是来自塞拉里尼的这个研究小组。早在2007年和2009年，塞拉里尼的研究小组就先后发表过两篇学术论文声称转基因食品可能对大鼠的健康有损害。

欧洲食品安全局也对这两篇研究进行了评估，得出的结论是这两篇研究的结论都不成立，因为作者的统计方法有问题。之前的两篇研究没有在社会上产生很大的影响，但2012年的这一篇因为首次把转基因和肿瘤联系到一起，所以立即在社会上引起了轰动。那么对这项引起了社会轰动但问题多多的研究，学术界进行了怎样的处理呢？请看下回分解。