什么是“纳什均衡”?电影《美丽心灵》完全搞错了!

作者: 果壳问答

来源: 果壳

发布日期: 2015-05-25

本文讨论了纳什均衡的概念,并通过具体例子说明了电影《美丽心灵》中对纳什均衡的误解。文章详细解释了纳什均衡的定义和应用,指出了电影中的情节与纳什均衡理论的不符之处,并探讨了纳什均衡在不同场景中的实际应用和局限性。

美国时间23日,数学家约翰·纳什与妻子阿莉西亚在新泽西乘出租车时不幸车祸身亡,一颗巨星就此陨落。我们常在著名概念“纳什均衡”中听到他的名字,但纳什均衡究竟是什么?大部分人都一知半解。下面这条问答就用最简明的例子来解读这个伟大的博弈论概念:问题:什么是纳什均衡?电影《美丽心

灵》里对纳什均衡的表述,是对的吗?

魏郎尔 回答:

因为美丽心灵这部电影,弄得好多人没有真的懂纳什均衡是在说啥……

电影里的大意是这样:四个朋友在酒吧里看上了一个美女,都想去搭讪,纳什说,如果我们按照亚当斯密的观点,每人都

只为自己着想,一上来就都去找她,就会互相干扰,最后谁也得不到。但是大家(按照纳什的观点)既考虑自己的利益,

又考虑整体的利益,分别各自去找她的同伴,结果就是大家都获益。

但是,这特么根本不是纳什均衡呀……

定义:

在非合作类博弈中,如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,

单方更改自己

的策略不会带来任何好处

(纳什证明了,如果允许混合策略,那么任何一个博弈,只要参与者数量是有限的、参与者可以选择的纯策略也是有限

的,那么这个博弈至少有一个纳什均衡。)

(另外,别把纳什均衡和囚徒困境混了。纳什均衡是个广泛得多的概念。)

例子:

打猎。

两个猎人出发去打猎。假设一头鹿有400公斤肉,但必须两人合作才能打到,一个人打什么都获得不了。同地区有一群兔

子,一共有200公斤肉,两人合作可以全部打完,但一个人打也可以获得100公斤肉。两个猎人各自都知道对方的平衡策

略,但不能通过任何方式影响对方的决策。最终的结果会怎样?

那么,

A 鹿 B 鹿: 200,200

A 鹿 B 兔: 0,100

A 兔 B 鹿: 100,0

A 兔 B 兔: 100,100

这里面有两个纳什均衡。

(1)两人都猎鹿:任何一人单方切换成猎兔子,都会让自己的收益从200跌到100。

(2)两人都猎兔子:任何一人单方切换成猎鹿,都会让自己的收益从100跌到0。

注意,这里面都是

单方更改

。要是双方同时从兔子换成鹿,都会更好——但纳什均衡不考虑这个。

这也造成了一个问题:纳什均衡从全局看起来不见得是“理性”的,不是看起来的最优解,

但是对每个人来说,它的确是在

别人不可控时自己的最优解

好了,我们回到开始的酒吧场景。

从纳什均衡的角度来看,电影里的“纳什”一开始的出发点就是错的呀。谁在乎什么全局最优、谁在乎什么亚当斯密的公众福利!

纳什均衡理论根本就没有考虑这些

。那归别的模型管。纳什均衡是每个人自己的最优解。酒桌上扯的那堆东西,和

纳什均衡毫无关联。

那么,这个策略是纳什均衡吗?

根本不均衡呀。

我们先假设有两个朋友,每人有两种策略:(1)找那个美女,(2)找她的同伴。每人自己会挑一个互不冲突的同伴。假

设找美女的“得分”是5,找同伴的得分是3,冲突的得分是0。

A 1 B 1: 0,0

A 1 B 2: 5,3

A 2 B 1: 3,5

A 2 B 2: 3,3

那么这里有两个纳什均衡:A1B2,A2B1。是的,所有人都去找同伴,这根本不均衡,因为任何一人切换成策略1都会更

好;得有一个人去找那位美女,才是均衡的。

如果朋友多了,也是一样。当且仅当有一个人去找美女剩下的人找同伴的时候,这才是真均衡。

所以实际上,酒吧间的场景用博弈论分析是这样的:

四个人有四种可能的均衡,每一种均衡都是一个人去找美女,剩下三人找同伴。

实际的决策当然不一定会形成均衡,因为现实中信息不那么透明,有可能大家各自做各自的选择结果撞了。

假如大家都能感知到别人的策略的话,那么就是

谁抢先,谁占便宜。

我抢在第一个选择策略1,那么剩下的人就只能选策

略2了。这是一个纳什均衡。

假如大家并不能感知到别人的策略,但大家都是聪明人,都是同步做出决策,那可能会出现好玩的场景:一开始所有人第

一反应是策略1,但大家会意识到别人的第一反应和自己一样,这样自己吃亏,我应该换策略2。但别人也是聪明人,我能

想到的他们也能想到,于是大家都会换策略2。但如果大家都会换策略2,那我改成策略1不就捡漏了吗?于是我应该改策

略1,但别人也会这么想,也会改回1……如此陷入死循环。

现实中死循环应该是不至于,但结果还是:

谁先敢于向同伴亮明自己选择了策略1,谁占便宜。

外一则:

纳什均衡、酒吧搭讪问题和囚徒困境是个什么关系?

囚徒困境是可以应用纳什均衡来解决的。背叛总比合作对自己更好,所以双方背叛是唯一的均衡。

奥妙在这里了:

囚徒困境里只有一个均衡,而打猎问题、酒吧搭讪问题和其他的场景里,均衡不只一个。

因为囚徒困境里均衡是唯一的,所以参与的囚徒双方不需要知道任何额外的信息,就能判断出对方的平衡策略是什么:肯

定是背叛。

但打猎问题有两个均衡,

酒吧问题

的均衡数和参与者人数相当,这怎么办?纳什均衡要求参与者必须知道别人的均衡策略,所以在平衡不止一种的时候,

需要额外的信息

。必须有人以某种方式声明

了信息,才能保证最后落入一个纳什均衡。不然真的有可能出现所有人都去追美女或者所有人都去追同伴的不均衡的场

景。

扩展阅读:

他是精神分裂的天才,他是世上唯一的诺贝尔奖、阿贝尔奖双料得主。他与妻子分分合合半个世纪,离婚又复婚,她始终

精心照顾着他,直到生命共同止步于2015年5月24日。他的兴趣从数学、经济学一直扩展到理论物理,为人类贡献了毕生

智慧,但他的学术生涯又不断地被精神疾病打断,再艰难重建。

小约翰·福布斯·纳什,享年86岁;阿莉西亚·纳什,享年82岁。

约翰·纳什:无常命运中的美丽心灵

本文为果壳网网友原创,谢绝转载。如有需要请联系media@guokr.com

阅读原文

UUID: 2a5fd380-bdf0-4c46-8f30-2a1c42c1491e

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/果壳公众号-pdf2txt/2015/2015-05-25_什么是“纳什均衡”?电影《美丽心灵》完全搞错了!.txt

是否为广告: 否

处理费用: 0.0057 元