纳什的议价问题(1950)

作者: J?rgen Veisdal

来源: 中科院物理所

发布日期: 2023-03-15 11:57:19

纳什议价问题是一个关于合作议价的研究,求证两人讨价还价问题的唯一解。纳什提出了四个公理条件,并证明满足这些条件的解可以最大化效用函数。文章还回顾了纳什的学术背景及其在普林斯顿大学的经历,以及他与冯·诺伊曼的交流。

他用“玩具,球拍,钢笔”发了一篇顶刊论文……J?rgen Veisdal 中科院物理所 2023-03-15 11:57:19 收录于话题 #翻译专栏 #00958C 认真阅读下面的文章,并思考文末互动提出的问题,严格按照互动:你的答案格式在评论区留言,就有机会获得由江苏科技出版社提供的优质科普书籍《重新发现太阳系:国家地理终极探索指南》。

小约翰·纳什(John F. Nash Jr.,1928-2015)最著名的突破是发现纳什均衡,但在这之前,他还针对另一个问题,纳什议价(讨价还价)问题撰写了一篇论文。纳什议价问题是一个关于合作议价的研究,求证两人讨价还价问题的唯一解(Nash,1950)。议价问题中的设定可以简单总结如下:两个玩家各自要求获得一些财物(一般是一些金钱)中的一部分。

如果两人索取的总和少于财物总额,那么两人都能如愿以偿;如果总和超过了财物总额,那么两人什么都没有。纳什对于后面这种情况提出了一个公理化的解决方法,本文就将介绍纳什刚涉足冯诺依曼和摩根斯坦新发现的博弈论领域时首先获得的成果,这为日后关于纳什均衡的工作提供了灵感。

1. 不变性:在议价前后效用函数随偏好的转变应保持不变。

2. 弱帕累托有效:如果有两人都能获益更多的结果s,那么玩家就不能同意另一种分配t。

3. 无关选择的独立性:如果玩家在两个解s和t中选择,其中s是首选;如果一个备选解r出现,那么除非r的偏好变化,t仍不会超过s被选择为解。

4. 对称性:如果玩家之间没有区别,那么他们之间达成协议不应有偏袒。

纳什证明,满足上述公理条件的解(x,y)正好可以使下面的表达式F取最大值:

(u(x) — u(d))(v(y) — v(d))

其中,u和v分别是玩家1和玩家2的效用函数,d则是无法达成协议的结果。这个解包含每个玩家获得当前收益(非合作收益)和合作收益。

背景在离开位于西弗吉尼亚布鲁菲尔德的家乡三年后,20岁的纳什进入了大学。1948年,当他还是卡耐基理工学院大三的学生时,就已经获得了哈佛、普林斯顿、芝加哥和密歇根大学,四个拥有美国顶尖数学项目的录取。

虽然纳什的首选是相对更有名、社会地位和师资力量更强的哈佛大学,但由于在备受推崇的普特南竞赛中表现平平,他在哈佛的奖学金略低于普林斯顿;同时,纳什在卡耐基的学术导师理查德·达芬(Richard Duffin,1909-1996)和约翰·辛格(John L. Synge,1897-1995)都力荐他选择普林斯顿大学,其中一位甚至称他为“小高斯”,认为普林斯顿是“纯数学(拓扑学、代数学和数论)家的摇篮”,与他完美契合(纳萨尔,1998)。

而普林斯顿这边,数学系主席所罗门·莱夫谢茨(Solomon Lefschetz,1884-1972)同样渴望说服纳什,最终开出了每年1150(相当于2021年的13200)美金的肯尼迪奖学金:我们喜欢把握住有前途的人,趁他们还年轻、思想开放。——莱夫谢茨给纳什的一封信

纳什在获得诺贝尔奖的自述中提到,靠近自己的家乡布鲁菲尔德也是选择普林斯顿大学的因素之一。于是由于种种原因,纳什在1948年的夏天离开了新泽西,带着卡耐基导师的鼓励和莱夫谢茨个人的强烈欢迎,选择了普林斯顿大学。达芬给莱夫谢茨的推荐信里只有一句描述纳什能力的话,后来变得非常有名:他是一个数学天才。

下展示了达芬和辛格的推荐信:左:纳什在卡耐基理工的论文导师达芬写的推荐信,寄至普林斯顿大学的所罗门·莱夫谢茨教授;右:任卡耐基理工数学系主任的辛格写的推荐信(图源:Princeton University Archives)。

普林斯顿大学就读时期(1948-1951)

纳什20岁离开家乡赴卡耐基上大学时,普林斯顿数学系充斥着聪慧的头脑,系主任莱夫谢茨和拉夫·福克斯(Ralph Fox,1913-1973)、诺曼·斯廷罗德(Norman Steenrod,1910-1971)带头在美国首先开展拓扑学研究;埃米尔·阿廷(Emil Artin,1898-1962)主攻代数;而莱夫谢茨的学生塔克(Albert W. Tucker,1905-1995)则主攻博弈论,这个学科在1944年冯·诺依曼(John von Neumann,1903-1957)和经济学家摩根斯特恩(Oskar Morgenstern,1902-1977)出版《博弈论与经济行为》一书后才刚刚兴起。

普林斯顿大学的数学系位于名为Fine Hall(直译为“好楼”)的大楼中,是40-50年代数学圈内传奇的代名词。如纳萨尔(Sylvia Nasar)在1998年所描述的:

(如一位欧洲裔所说,我想Fine Hall是用于数学研究的最豪华的建筑,是一个可以去度假的数学乡村俱乐部。它的基石由维布伦(Oswald Veblen)设计,装有着普林斯顿数学家们工作的副本和业内一些常用工具的铅盒:两只铅笔、一段粉笔,当然,还有一块橡皮。)

“它代表数学家们‘赖着不走’的圣所,暗色石头所包围构成的走廊既适合独自散步,也适合‘数学社交’。为高级教授准备的九个书房——注意不是办公室——有着雕刻的石板、隐藏式橱柜、黑板、东方地毯和厚重的软垫家具。”

“每个办公室都配有电话、盥洗室都配有阅读灯;三楼库存丰富的图书馆全天开放,拥有世界上最丰富的数学期刊和书籍;爱好网球的数学家们在回办公室前无需再回家一趟(附近有个网球场),因为它设有淋浴的更衣室。”——纳萨尔《美丽心灵》(1998)

纳什当时是一个由塔克领导的推进初期博弈论发展的学派成员之一,他们从纯数学意义出发,基本不关心研究内容在现实世界中的应用。

据经济学家、纳什的好朋友、摩根斯特恩的学生舒比克(Martin Shubik,1926-2018)所说:当时数学系的学生和职工都沉浸在研究博弈论的幸福中,完全没有意识到经济学系对此的态度,当然他们即使知道,也不会关心。在普林斯顿没待多久,经济学系和数学系之间鲜明不同的态度就根植在我心里了。

经济学系有一种培养常规博士工厂、一切照旧的保守主义氛围,其中不乏明星但毫无激情和挑战可言;而后者则被灵感和狩猎的纯粹乐趣所点亮。从心理学上来说,他们好像来自于不同的星球。

如果在下午茶时间,一个光着脚、穿着破烂牛仔裤的十岁大的流浪小孩带着一个非常有趣的理论走进Fine Hall,那一定会有人去听;但当冯·诺伊曼进行有关增长模型的研讨会时,除了少数几个例外,普林斯顿那一大群经济学家肯定会无聊到只打哈欠。”——舒比克(参考 Düppe and Weintraub, Finding Equilibrium*, 2014 p. 94)

而学派的领导人塔克,则继续指导普林斯顿未来的顶级博弈论学家,包括大卫·盖尔(David Gale,1921-2008)、2012年诺贝尔奖获得者罗伊德·沙普利(Lloyd Shapley,1923-2016),当然,还有纳什。

议价问题(1949)

在研究纳什均衡以前,纳什发表了他第一篇期刊论文——同样关于博弈论,将经典经济学问题视为议价过程。此前已经有不少学者(包括Cournot、Bowley、Fellner等人)从包括双边垄断调查等不同角度,对这个问题进行过研究。左:学生时期的纳什;右:纳什1950年的论文《议价问题》(The Bargaining Problem. Econometrica 18(2), pp. 155-162.)

纳什的文章描述了这样一种议价的情况:两个人都有机会互惠互利,但是没有一方可以在未经允许的情况下单方面影响另一方的牟利。类似于经典的“划分选择协议”的情况:两个人需要公平地分配一个蛋糕,那么其中一个人切蛋糕,另一个人可以优先决定自己想要哪一份,这就是无嫉妒蛋糕分配机制。纳什的论文就是基于这样的议价情况进行理论分析,同时在特定条件或其他“理想化条件下”给出确定的“解”,即确定满足个体期望的收益。

这样的理想化条件包括:假设两个个体是理性的,并可以对各种物品有着精确的偏好感知,具有相同的议价能力,以及完全了解对方的偏好信息。

纳什的解法采用了从冯·诺依曼和摩根斯特恩的书中发展出的效用的概念,也使用了期望的概念定义不同玩家在给定策略下认可的收益。在纳什的文章中,他假设有一个人小明,知道自己第二天会获得一百块钱,那么可以说他有“一百块的期望”;类似地,他也可以有“两百块的期望”。如果他知道,次日会通过抛一枚公平的硬币来决定他获得一百还是两百,那么可以说他有“50%一百和50%两百的期望”。

对于在这种情形下的单个个体效用理论,纳什提供了充分的假设,并对他在1944年发表的论文《博弈论与经济行为》中提出的情形进行区分。他认为,论文中并未分别对每个人参与博弈的价值进行估算,除非这个博弈是零和的(双方收益相加为零)。

于是对于双人的非零和博弈,纳什对参与玩家的预期值进行了推导:首先定义一个双人期望值为两个单人期望值的某种组合:如果有两位玩家,各自对未来的情形有准确的期望,且单人期望值可以构成双人期望,那么单人效用函数可以用于求双人效用函数的期望值。这样如果有两位玩家,各自对未来的情形有准确的期望,且单人期望值是构成双人期望的元素,那么我们可以将单人的效用函数以及各自的概率用于求双人的期望值:

如果 [A, B] 代表一个双人期望,且 0 ≤ p ≤ 1,那么 p[A,B] + (1 - p)[C,D]= [pA + (1-p)C, pB + (1-p)D]。

纳什定义了两个个体的效用函数为和,且将c(S)定义为包含原点的紧凸集合S内的解点。首先他提出了一些必要的假设,保证最大时的解落在第一象限:集合的紧性保证解存在,而凸性保证解唯一。图1来自纳什的论文《议价问题》,示意了玩家1和玩家2的效用集合S中唯一最优点。

议价问题实例(纳什,1950)

假设小明和小红两个很聪明的人,他们手上只有可以交换的货物,但是没有钱用来找零。为了简单起见,再假设一个人获得所有物品的效用是这部分中各货品对他的效用之和。下面的表格列出了每个物品的所属权和对每个人的效用,两个个人的效用函数单位是任意的。

小明拥有的货品:

小明的货品 小明的效用 小红的效用

书 2 4

鞭子 2 2

球 2 1

球拍 2 2

盒子 4 1

小红拥有的货品:

小红的货品 小明的效用 小红的效用

钢笔 10 1

玩具 4 1

小刀 6 2

帽子 2 2

这个议价问题的图像是一个凸多边形,其中效用乘积最大的点在一个顶点上,对应着唯一一个预期,其中:小明给小红:书、鞭子、小球和球拍;小红给小明:钢笔、玩具和小刀。纳什在论文中对此议价问题进行的作图实例:解点位于第一象限、矩形双曲线与可选集合的唯一切点上。

目前我们还不清楚纳什如何得出这样结果的过程,他要好的朋友,出版于2002年的纳什传记《The Essential John Nash》的作者之一——库恩(Harold Kuhn,1925-2014)回忆这篇论文时说:我记得(这篇文章)在纳什毕业后的第一年就送到了冯·诺伊曼手中,纳什当时还提醒了冯·诺伊曼(这篇文章的)存在。

如此看来,这篇文章应该是纳什还在卡耐基理工时上的唯一一门经济学选修课的课程论文。但他补充道:纳什的记忆与我有出入,他在1995年某次和罗杰·梅耶森的午餐中说到,他是到了普林斯顿之后才写的这篇论文。无论这篇文章的真实历史如何,其中的举例暗示写作的是个年轻人,因为物品包括球拍、球或是钢笔小刀之类的东西。可以确定的是,当时纳什还从未读过论文引文部分所提到的古诺、鲍利、廷特纳以及费尔纳的工作。——库恩

纳什20岁时到了普林斯顿大学,终于在1950年的时候在著名期刊《计量经济学》上发表了自己的论文《议价问题》:Nash (1950). The Bargaining Problem. Econometrica 18(2), pp. 155-162.

与冯·诺依曼的交流尽管纳什的推论在某种程度上与冯·诺伊曼和摩根斯特恩关于合作博弈论的工作相反,但他为非合作博弈理论打下的基础显然来源于前人工作。

也因为受到了这样的启发,纳什发现了纳什均衡,得以在1978年获得约翰·冯·诺伊曼理论奖。现存的文件中只找到了份记载纳什和冯·诺伊曼之间的交流,可以肯定的是其余多数都已经随着时间而丢失了。据纳萨尔回忆,纳什在1949年普林斯顿统考后没几天就与冯·诺伊曼进行谈话——在他发现纳什均衡之前:当时他骄傲地告诉秘书,他准备和冯·诺伊曼教授讨论一个能激起他兴趣的想法。

对于一个研究生来说,这是件相当大胆的事情……这当然像是纳什会做出的事情,毕竟他前一年还带着一个想法去见了爱因斯坦……他听得很认真,轻敲着手指,时不时还偏一偏头。纳什开始描述脑海中对超过两位玩家博弈的均衡的证明。

冯·诺伊曼在他说出更多杂乱的句子以前打断了他,突然对纳什未下定论的阐述说:“这没什么意思,只是个不动点理论罢了。”——纳萨尔《美丽心灵》(1998)

看起来冯·诺伊曼并没有在纳什讨论的非合作博弈论的概念中看到价值,但纳什随后便在给历史学家罗伯特·莱纳德的信中为这位伟人的反应辩护,他分析道:我当时在和冯·诺伊曼进行一场非合作博弈,而不只是寻求加入他的联盟;显然从心理学上说他不会对一个竞争的理论完全满意。

虽然如此,冯·诺伊曼和摩根斯特恩最终都给予了纳什有价值的指导,在纳什发表的论文中,对两人都进行了致谢:作者希望感谢冯·诺伊曼和摩根斯特恩教授的帮助,他们在阅读完论文的初稿后都提供了非常有帮助的建议。

UUID: 9c181bc3-48a9-4a7d-85db-62f55c77edc4

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中科院物理所公众号-pdf2txt/2023/中科院物理所_2023-03-15_他用“玩具,球拍,钢笔”发了一篇顶刊论文…….txt

是否为广告: 否

处理费用: 0.0278 元