我们在生活中要面对各种各样的决策。对哈姆雷特来说,活还是不活,这是个问题;包包买还是不买,救老妈还是救老婆,也都是难题。什么样的时候人们会做什么样的选择?好奇的科学家一直以来都对大脑的决策机制充满了兴趣。
所谓“同样的招式对圣斗士不能使用两次”,在面对挑战时,经验可以说是最为可靠的指导。然而,“不是我不明白,这世界变化快”,如果只是一味地墨守成规,经验有时又反而会成为生命不可承受的累赘。是从以往的过招经验中寻找对手破绽以求见招拆招,还是索性彻底抛弃一切章法以期“乱拳打死老师傅”?最近发表在《细胞》杂志上的一篇研究显示,我们的大脑中存在一种“开关”机制来决定我们究竟是去挖掘规律还是随机行事。
研究团队采用的实验动物是大鼠。“相比较于小鼠,大鼠拥有更复杂的大脑与更高的智商来处理复杂的任务。而较之灵长类,它们更为廉价,繁殖力也更强,从而可以轻易得到足够多的数量以积累更为可靠的数据。
”文章的通讯作者,霍华德·休斯医学研究所的阿娜·卡尔波娃(Alla Karpova)向果壳网介绍说,这一次他们给大鼠设计了一个类似于石头剪子布的博弈游戏:大鼠被安排站在一面有三个孔的墙前面,在游戏一开始,大鼠将它的鼻子对准中间的一个孔。之后,它可以选择将鼻子探向它左边或是右边的孔,与此同时,它的虚拟对手——一台电脑则会猜测它会探向哪一边。
如果电脑猜错了,比如说电脑猜它会探向左边的孔而它却探向了右边,那么这只大鼠将会得到一口美味的果汁作为奖励。
首先,卡尔波娃和她的团队为大鼠准备了一个比较简单的对手,我们就暂时称它为普通难度的电脑吧。这个虚拟对手可以根据大鼠之前的选择来归纳这只大鼠的选择规律,然后据此推测大鼠下一次的动向。
不过,就像一些学渣做选择题不知道该选啥的时候,就遵循“三长一短选最短,三短一长选最长,长度一样就选C”之类的模式一样,普通难度的电脑也会有类似的“固有选择模式”。
虽然大鼠们在刚面对这个对手的时候也被它虐得一败涂地,但是大鼠们普遍都表现得不屈不挠,不断改变着自己的选择模式,并慢慢总结出了对手的预测规律,最终成功逆袭——这些“经验丰富”的大鼠平均能达到60%的胜利率,不但大大高于它们一开始百分之四十多的胜率,也显著超出了完全随机选择的成绩。
然后,研究人员又设计了两个更强的对手,我们不妨称之为噩梦难度的电脑和地狱难度的电脑吧。噩梦难度的电脑在普通难度的算法基础上,尽量去除了那些容易被识破的“固有选择模式”;而地狱难度的电脑则干脆改用了一种非常复杂而强大的算法,要逃脱它的“洞察”是一件无比艰难的任务。在面对这些“高手”,尤其是地狱难度的电脑的时候,尽管大鼠们依然竭尽所能地去搜索电脑的破绽,但还是纷纷败下阵来。
面对这个无法战胜的对手,大鼠们最终改变了策略——它们放弃寻找对手选择规律的努力,转而采用一种完全随机的没有既定模式的“选择模式”,并且随着难度的增加,大鼠的选择模式就会变得更加随机。
为了确定大鼠确实是在做随机选择,研究人员们还在后面的研究中悄悄给地狱难度的电脑人为添加了一些隐藏的漏洞,比如说让它在连续猜两次左边后有很高的几率选右边。卡尔波娃说:“我们通过这个隐藏规律来检测大鼠是否真的采用了随机选择模式。如果大鼠还在采用总结规律的战术,那么它们一定能轻易发现这个新的隐藏规律;而相对地,如果它们决定随机选择的话就很难意识到这个提高胜率的机会。”
然而,在引入隐藏模式后,那些完全的新手或是只和普通难度的电脑过招过的大鼠可以迅速发现并利用这个规律,但那些开启随机模式的大鼠则依然继续做着随机选择。卡尔波娃说:“在面对对手的时候,大鼠有一种天然的总结对手弱点的倾向。如果对手很弱,它们就会借助经验来击败对手。只有当对手足够强大,以至于所有总结规律的努力都告失败的时候,大鼠才会转而采用随机策略。这实际上达成了博弈论的最优策略。
”从博弈论的角度来说,如果能预测对手的出招套路,自然能增加自己的胜算,但当对手强大到不可预测的时候,随机选择策略也至少能确保自己50%的胜率。
但大鼠显然没有接受过任何博弈论课程,它们只能依赖自己的脑子。为了一探大鼠决策时的脑部发生了什么,研究者进行了后续实验。
在神经科学研究中,要研究某个脑区的功能,最常用的方法就是先把这个脑区的功能给抑制住,看看行为会发生什么变化,然后再让这个脑区的功能恢复乃至变得比以前更活跃,看看那些变化是否会得到逆转。通过这种方法就可以获得比较可信的脑区和行为之间的联系,事实上,人类对于大脑中大部分脑区功能的理解都源于这类功能扰乱实验。
“前人的工作表明,前扣带回(anterior cingulate cortex,ACC)编码了动物对环境的认知模式。我们进而假设这种认知模式会影响动物所作出的决策,这可能是决定动物是否会切换到随机选择策略的关键所在。”卡尔波娃介绍说。
有鉴于此,他们首先通过一种精确度很高的颅内定点注射法向前扣带回脑区注射蝇蕈醇(muscimol)——这是一种短效神经阻断剂,可以暂时性地抑制前扣带回的活动,使之丧失功能。他们发现,在注射蝇蕈醇后,大鼠在面对普通和噩梦难度电脑的时候都能够更加执着地搜寻规律,预测对手的选择,并最终提高了自己的胜率;但是在面对地狱难度的电脑的时候,注射过蝇蕈醇的大鼠无论是行为模式还是胜率都没有什么明显的变化。
这说明,在采用总结规律策略的时候,前扣带回确实发挥了某种功能,而随机选择策略则并不需要前扣带回的直接参与。
前扣带回在两种策略中发挥的不同作用暗示它可能就是负责切换两种策略的开关,然而开关不会自己动,那只操纵它的手是什么?
“我们排查了多个既能作用于前扣带回又与决策相关的脑区,比如中脑腹侧被盖区(Ventral tegmental area,VTA)以及蓝斑(Locus Coeruleus,LC)等等,最终通过一些功能扰乱实验证明蓝斑才是我们要寻找的脑区。”卡尔波娃对果壳网说。蓝斑是一个位于脑干的神经核团,在整个脑中都有广泛的神经投射,几乎所有的脑区都会接受来自蓝斑的神经传入。
这样广泛的对外神经连接与蓝斑的功能密切相关:神经元与神经元之间的信号传导依赖于一类专门的化学物质:神经递质,而蓝斑正是大脑中最重要的神经递质之一——去甲肾上腺素(Noradrenaline)的合成中心。从蓝斑对外投射出去的神经元像遍布全脑的高速公路一样将它合成的去甲肾上腺素运输到整个脑中。
蓝斑中积累的大量去甲肾上腺素容易聚合成一种叫神经黑色素(Neuromelanin)的有色物质,从而让蓝斑在解剖上呈现出一种独特的青蓝色,因此被称为“蓝斑”。
卡尔波娃的团队随后借助于条件性转基因的方法在大鼠蓝斑向外投射的神经元上表达某些特殊的蛋白质,这些蛋白质像阀门一样,使研究人员能按照自己的需要来调节蓝斑向前扣带回的去甲肾上腺素输送量。
实验结果表明,提高蓝斑向前扣带回的去甲肾上腺素输送量,会导致大鼠更容易放弃总结规律;而减少去甲肾上腺素输送量则能让已经在与地狱难度电脑对决中进入随机选择模式的大鼠重新开始观察对手,并迅速发现研究人员新设置的隐藏规律。这些结果提示,是蓝斑对前扣带回的去甲肾上腺素输入水平决定了动物所采取的策略。
在这之后,“我们将从个体神经环路的层面来理解这些决策的神经学原理。” 卡尔波娃透露,“具体来说包括前扣带回的具体运作机制,负责随机选择策略与产生随机性的脑区,随机选择的信号是如何在下游脑区整合的等问题。”
“目前的研究表明,前扣带回活跃程度的变化会指导动物采用不同的决策以应对未知的环境和规则。”卡尔波娃说,“但有的时候,这些变化会失去控制,从而导致习得性无助乃至抑郁症等一系列不良反应。在这种时候,抑制前扣带回的去甲肾上腺素输入也许是一个有效的疗法。”(编辑:Calo)