221
博弈生存 ———社会现象的博弈论解读 潘天群

博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

书书书

博 弈 生 存

———社会现象的博弈论解读

潘 天 群

Page 2: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

书书书

再版前言

人是行动的动物,因而是策略选择的动物。我们每天的所见

所闻无时不体现出人行为的策略选择性。社会中的每个人都在

努力用自己的理性选择策略来达到自己的生存目的。这也是研

究多个理性人互动决策的博弈论能够用于解释社会现象的原因。

掌握了博弈论的理论,我们就能自觉地用它来分析我们所见到的

社会现象。我们熟知的是,革命导师马克思、恩格斯在《共产党宣

言》中号召无产阶级起来革命,他们豪迈地宣称:“让统治阶级在

共产主义革命面前发抖吧!无产者在这个革命中失去的只是锁

链,他们获得的将是整个世界!”如果用博弈论术语来分析,革命

导师是在告诉无产者:“革命”行动与“不革命”行动相比,“革命”

是“占优的”行动策略;“革命”将使无产者失去锁链并得到整个世

界,而如果“不革命”,无产者仍然是一无所有的奴隶!

当然,博弈论有它的局限。在某些博弈中,人的实际行为不

完全符合博弈论的理论结果(实验经济学力图用实验来验证博

弈论的演绎结果),它们之间的偏差有一些不能用理性的有界性

来解释,这使人们怀疑博弈论的理性人假设是否能够站得住脚。

许多哲学家认为 人 是 自 由 的,而 博 弈 论 专 家 假 定 人 是 理 性 的。

人是自由的还是受理性法则所支配?如果人是理性的,那么他

便不是自由的。理性人假设下的人是一个“机械装置”。一个博

弈是多个这样的装置的互动:对于某个博弈参与人来说,如果给

定他的策略空间、目 标 函 数 以 及 博 弈 参 与 人 的 个 数、信 息 分 布

等,他能够确定 自 己 的 最 优 策 略,或 者 至 少 能 够 排 除 掉 某 些 策

略。此时人便不是自由的————理性的行为选择预设了某个正

Page 3: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   2    

确的行动方向,而自由是不预设任何方向的。理性法则规定无

产者必须选择“革 命”,而 无 产 者 作 为 自 由 的 主 体,尽 管 他 知 道

“革命”的结果优于“不革命”的结果,也完全可以不选择“革命”,

如果他愿意做奴隶的话。

物理学是不完美的,这并不妨碍我们用它来观察和解释我

们周围的世界,博弈论的局限也并不妨碍我们用它来分析和解

释社会现象。《博弈生存》是一本深受读者欢迎的博弈论普及读

本,自出版以来在全国许多书店(包括网上书店)长期位于畅销

书排行榜之上,其畅销程度是本人写作时所未能料及的。本书

的读者群体非常广泛,从中学生到大学教授,其中大多数读者是

大学生。许多读者来信或来电,与本人探讨书中涉及博弈论的问

题,并提出一些建设性的意见……本人对读者的厚爱表示感谢。

鉴于《博弈生存》一书引起的广泛关注,以及博弈论本身的

重要意义,本人决定对原来的版本进行修订。最新的版本对第

一版的部分章节作了修改和删减,纠正了第一版中的错误和不

确切之处。同时,增加了“诸葛亮、周瑜的掌中之‘火’”和“将军

的困境”两小节,以及新的一章————“公平分配可能吗?”,并且

补充了附录————论述纳什均衡定义和纳什均衡存在定理。本

书力图通过比较浅显的例子普及博弈论的知识和方法,阐发博

弈论的思想,为普及博弈论作出绵薄之贡献,因而修订版仍保持

科普风格。如果读者想借用博弈论工具进行学术研究或解决实

际问题,请查阅有关的博弈论学术著作。

感谢中央编译出版社领导、编辑和发行人员,尤其是贾宇琰

编辑,感谢他们为本书的出版和发行所付出的辛勤劳动。

潘天群

2004年8月于南京

Page 4: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

书书书

目摇录!"#$%&$’

再版前言 1

导言 1

一、失火了,你往哪个门跑?———这就是博弈论 3

二、博弈论能解释所有社会现象吗? 6

第一章  博弈论基础知识 9

一、基本术语 11

二、博弈的类型 18

三、博弈案例 19

员援囚徒博弈与我国应试教育的困境 19

圆援斗鸡博弈与古巴导弹危机 21

猿援骑虎难下博弈与美苏武器竞赛 25

源援警察与小偷的故事———混合策略问题 28

缘援《三国演义》中的空城计与信息不对称的博弈 31

第二章  公共知识与行动均衡的打破 39

一、公共知识与博弈 41

二、一个寓言———村庄里的大屠杀 44

三、帽子:红色的还是白色的? 47

四、皇帝新装的新解读 51

五、“教—学”均衡的公共知识条件

———教育的知识结构分析 53

六、诸葛亮、周瑜的掌中之“火” 54

七、将军的困境 55

Page 5: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

第三章  你的权力有多大? 59

一、“独裁的”妻子 61

二、一个国家的权力分配故事 63

三、夏普里值与夏普里—苏比克权力指数 69

四、聪明的股东:班扎夫权力指数的应用 72

五、逻辑结构与投票影响度 76

六、民主社会中为什么很多人不投票? 80

七、一群体中有多少种可能的权力结构? 82

第四章  公平分配可能吗? 87

一、什么是公平分配? 89

二、8 个金币的故事 89

三、海盗分宝石:公平规则下的不公平 91

四、所罗门的智慧:公平不是平均 93

五、从分蛋糕到财产分割与边界争端的解决:

双赢的分配 95

第五章  信息、言语与行动 103

一、知识与博弈 105

二、信息与战争博弈 108

三、声称的策略与实际的策略:言语博弈问题 112

四、言语博弈中的“威胁”与“承诺” 115

五、空口声明博弈 119

第六章  博弈中的学习机制问题 121

一、明天太阳必然能升起吗?

———归纳推理的合理性问题 123

二、归纳的暴力:偷东西的人应该叫小偷吗? 128

三、行动中的两种推理:归纳与演绎 129

四、酒吧问题与“百花奖”的评选 132

Page 6: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

五、少数者博弈及其应用:股票买卖与交通拥挤问题 137

六、对称的人群为什么会出现破缺性的行动?

———盲目的学习 142

第七章  理性的界限 147

一、蜈蚣博弈的悖论 149

二、最后通牒博弈中理性的困境 151

三、陈水扁上台与民主选举的不可根除的缺陷 154

四、通过民主的方式能使少数人支持的候选人赢吗? 158

五、投票悖论与阿罗不可能性定理 162

六、革命:另外一种投票方式 166

第八章  集体行动的悲剧 171

一、哈定悲剧 173

二、中国北方草原荒漠化的问题 176

三、发展经济与对自然的破坏 177

四、光天化日之下的违法行为为什么总能成功? 179

第九章  集体行动悲剧的克服与文明 185

一、囚徒困境的消解与文明 187

二、一个关于猴子的故事 190

三、人类原初的状态就是囚徒困境 191

四、国家和道德是两种克服囚徒困境的机制 193

五、更为基本的道德调节 198

六、哪种策略更能赢? 200

七、道德作为“文化基因”的遗传与变异 202

八、国家的作用及其局限 206

九、文明新解 210

十、当前的悲剧与解决途径:

世界政府的可能性与可行性分析 212

Page 7: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

第十章  集体行动的未来能否预测? 217

一、弑父娶母的传说 219

二、我们不知道未来我们会知道什么 222

三、社会在什么意义上是可预测的? 225

四、社会科学研究的作用 226

附录 229

参考文献 230

Page 8: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!失火了"你往哪个门跑#

$$$这就是博弈论

二%博弈论能解释所有社会现象吗#

导 言

Page 9: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题
Page 10: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

失火了,你往哪个门跑?

Page 11: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

5    

的是使自己“赢”。奥林匹克运动会叫OlympicGames。在英文

中,game有竞赛的意思,进行game的人是很认真的,不同于汉

语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于

game的理论,即gametheory翻 译 成 博 弈 论 或 者 对 策 论,是 恰

当的。本书下面统称gametheory为博弈论。

博弈论的出现只有50多年的历史。博弈论的开创者为诺意

曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意

曼是著名的数学家,他同时对计算机的发明作出了巨大贡献,他

去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔

奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。

谈到博弈论,不能忽略博弈论天才纳什(JohnNash)。纳什的开创

性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给

出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一

个较完善的学科。

博弈论对于社会科学有着重要的意义,它正成为社会科学

研究范式中的一种核心工具,以至于我们可称博弈论是“社会科

学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是

研究理性的行动者(agents)相 互 作 用 的 形 式 理 论,而 实 际 上 它

正深入到经济学、政治学、社会学等等,被各门社会科学所应用。

甚至有学者声称 要 用 博 弈 论 重 新 改 写 经 济 学。1994年 经 济 学

诺贝尔奖颁发给三位博弈论专家:纳什、塞 尔 屯(R.Selten)、哈

桑尼(J.Harsanyi),而像1985年获得诺贝尔奖的公共选择学派

的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖

卢卡斯(Lukas),其 理 论 与 博 弈 论 都 有 着 较 深 的 联 系。现 在 博

弈论正渗透到各门社会科学,更重要的是它正深刻地改变着人

们的思维。

Page 12: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   6    

二、博弈论能解释所有社会现象吗?

社会由不同的人群的集合体所构成。不同的人群集合体形

成不同的 结 构,一 个 结 构 中 的 群 体 之 间 的 相 互 作 用(interac

tions)就构成一个博弈。这个博弈是广义上的。社会中有不同

的文化,人类有文明、道德,如果说文明、文化、道德是宏观的社

会现象,那么还存在着微观的社会现象,如:群体为什么有合作

又有不合作?为什么人群之间或集团之间有“威胁”或“承诺”?

这些都是博弈论研究的对象。本书下面将努力用博弈论的基本

思想来解释社会中的这些现象。

博弈论对人的基本假定是:人是理性的(rational)。所谓理

性的人是指行动者具有推理能力,在具体策略选择时的目的是

使自己的利益最大化。博弈论研究的是理性的人之间如何进行

策略选择的。

博弈论力图在这个最简单的假定下得到丰富的结论,正如

我们下面所看到的,它确实做到了。博弈论专家的这种做法如

同物理学家对自然的假定一样。大家知道,物理学家往往假定

几个最基本的假设,这最基本的假设构成公设,其余的结论由它

们推得,如爱因斯坦的狭义相对论只有两条假设:(1)物理定律

在所有参考系中不变;(2)在所有参考系中光速保持常数。多么

简单的公设!在这两个公设下得出了惊奇的结论,如运动的参

照系中尺子收缩,时钟变慢,等等。相对论的这两条公设改变了

物理学的整个构架,也改变了人们对自然的整个看法!

博弈论当然不是关于自然的,它是关于社会的,它不能构成

Page 13: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

7    

人们对自然看法的革命。博弈论的假定是非常简单的,它能得

出令人惊奇的结论吗?它能改变人们关于社会的看法吗?———

这些是伟大科学的要求!我们将发现,博弈论确实如此!

本书力图用“科学的”方法来解读社会现象。经济学是对社

会现象进行研究的科学,社会学、政治学等等也都是社会科学。

然而今天经济学已成了帝国主义,它的领域没有疆界。不仅仅

经济行为是它的研究领域,它的研究范围是“经济的”行为,在经

济学家看来人类的几乎所有社会行为都是“经济的”。这里我们

用“经济的”等同于“理性的”,也就是“计算的”,理性的人即是计

算的人。

本书的写作方式是科普式的(popularscience)。提到的理

论有时缺少来龙去脉的交代,也未对博弈论作系统的论述,如读

者对所涉及的理论感兴趣,请查找有关的书籍或资料。

这里讲一个小小的插曲。在与朋友聊博弈论时,他随意说

了一句话给我启发很深。他说,中国人研究其他学问难说,但研

究博弈论是有优势的。这句话是褒义,也是贬义。说它是褒义,

是因为中国古代有很多这方面的著述与实践,春秋战国时期七

国争雄,其实也是谋士之间的角逐,而罗贯中的《三国演义》在今

天看来就是一部博弈论教材!无论是兵书如《孙子兵法》、《三十

六计》,还是现代流行的所谓“商战策略”、“公共关系”以及所谓

“厚黑学”都是关于如何赢得与人交往的胜利的,或者说如何获

取成功的。说它是贬义,是因为,中国人走关系、相互算计是出

了名的,中国人对博弈论有天生的了解。正如中国人常说的“事

事洞明皆学问,人情练达即文章”,即是说人与人之间的关系、社

会交往均是学问。而中国很多“做人”的道理,道出了如何在人

与人的博弈中获取成功,如:在任何场合下都不要得罪人,不要

Page 14: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   8    

锋芒毕露(如“枪打出头鸟”),等等。不过,在中国文化传统中,

人与人之 间 的 所 谓 关 系 并 不 像 西 方 那 样 是 科 学,而 更 像 一 门

艺术。

本书下面将尝试着用博弈论解读人类的社会行动或集体行

动———这里的社会行动或集体行动意指互动的人群集合体。读

者将发现,原本复杂的人类社会的行动是容易得到理解的,并且

会发现其中蕴藏着的一些道理。

本书是解释社会现象的,其中的方法、理论与事例许多是经

济学中的,然而本书不完全是经济学的。如果是经济学的,必须

是用完善的经济学理论来阐述和分析确定的研究对象,必须讲

“供给”、“需求”、“价格”、“效用”、“边际”等概念及原理,否则是

对读者不负责的。本书力图用科学的方法,即对各种社会现象

作出解释。当然经济学也是科学的,但是经济学已经形成固定

的研究程式。我们这里只是告诉读者许多现象背后的东西。本

书有些地方是哲学的,有的地方是逻辑的。我想说的是,我们所

看到的社会现象其背后有着深刻的科学道理———本人认为这些

现象的背后是理性和逻辑。如果本书能给读者带来一些启发,

本人就满意了。

Page 15: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!基本术语

二!博弈的类型

三!博弈案例

!"囚徒博弈与我国应试教育的困境

#"斗鸡博弈与古巴导弹危机

$"骑虎难下博弈与美苏武器竞赛

%"警察与小偷的故事!!!混合策略问题

&""三国演义#中的空城计与信息不对称的

博弈

!

博弈论基础知识

第一章

Page 16: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

11   

第一章

 博弈论基础知识

一、基本术语

前面已经指出,博弈论研究的对象是理性的行动者或参与

者如何选择策略或如何作出行动的决定。理性的人是对现实的

人的基本假定,即假定参与者努力用自己的推理能力使自己的

目标最大化。“理性的”与“道德的”不是一回事,理性的与道德

的有时会发生冲突,但是理性的人不一定是不道德的。我们在

第八章会阐述理性的人怎么会产生道德的行为。

博弈涉及哪些内容呢?

第一,博弈涉及至少两个独立的博弈参与者(player)。

每个参与者通过采取行动,努力使自己的效用或利益最大

化。但是,他的行动的好处或支付的获得取决于另外的参与者。

下文有时将参与者称为行动者。

“囚徒博弈”或“囚 徒 困 境”是 一 个 被 广 泛 谈 论 和 研 究 的 博

弈。两个共同作案偷窃的小偷被带进警察局单独关押,如果一

方与警方合作,招认并供出自己与对方以前所做违法之事,而对

方不招认,招认方将不受重刑,无罪释放,另一方则会被判重刑

10年;如果双方都与警方合作共同招认,各被判刑5年;而如果

双方均不承认有罪,因警察找不到其他证明他们以前违法的证

据,则只能对他们的小偷行为进行惩戒,各判刑3个月。这两个

小偷如何作出选择?

在这个囚徒困境中,囚徒的最后结果———是当场释放还是

被判刑(10年、5年、3个月),不仅取决于该囚徒的决定,而且还

取决于另外一个囚徒的决定。

Page 17: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

囚徒困境

Page 18: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

13   

第一章

 博弈论基础知识

而在买卖的交换行为中,买东西的人要尽量以低的价格买到,但

是他是否能买到取决于卖者是否能卖;卖东西的人尽量想以高

的价格将东西卖出去,但价格太高,买者不接受,因此卖东西的

人能否将物品卖出去取决于买者。

第二,博弈涉及行动者存在着策略(strategy)选择的可能,

博弈论用策略空间来表示参与者可以选择的策略。

赤壁一战,曹兵大败,曹操落荒而逃,在选择是走通往华容

道的小路,还是 选 择 大 路 时,他 面 临 着 在 两 个 策 略 之 间 进 行 选

择。囚徒困境中的小偷面临着“不招认”还是“招认”的选择。每

个参与者从策略空间中选取他的策略,如果没有选择的可能,理

性的人是无法作出计算的,对自己的目标也就无能为力。从这

个意义上来讲,我国改革开放走向市场经济,就是使得每个经济

主体发挥其理性的作用,使之发挥主动性,而在计划经济下则没

有可选择的余地。

第三,参与者 在 不 同 策 略 组 合 下 会 得 到 一 定 的 支 付(pay

off)。

我们往往用支付矩阵来表示参与者在各种策略组合下的支付,

有时用函数来表示。囚徒困境的支付矩阵为:

甲乙 不招认 招认

不招认 各判刑3个月乙:判刑10年,甲:当场释放

招认甲:判刑10年乙:当场释放

各判刑5年

Page 19: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   14   

  我们再来分析一交易过程的支付矩阵。在一卖主甲和一买

主乙之间的“买—卖”博弈中———这是一讨价还价过程,假定通

过讨价还价后确定了一价格。在此价格下,卖者卖成后获得的

效用为6,卖不成的效用为0;买者买成的效用为4,买不成的效

用为0。而如果他们之间的 交 易 不 成 功,无 论 是 买 主 还 是 卖 主

都要等待和进行讨价还价,假定等待和讨价还价的成本均为1,

则支付矩阵为:

乙甲

买成 买不成

卖成 (6,4) (5,0)

卖不成 (0,3) (0,0)

第四,对于博弈参与者来说,存在着一博弈结果。

所谓结果是 参 与 者 最 终 对 策 略 的 选 择 造 成 的 确 定 性 的 支

付。如在曹操败走华容道的博弈中,诸葛亮在“埋伏大路”与“埋

伏通往华容道的小路”之间进行选择,而曹操在“走大路”和“走

通往华容道的小路”之间进行选择。在这个博弈中,双方猜测对

方的行为,看谁猜得准。博弈的最终结果是,诸葛亮派关羽埋伏

在通往华容道的小路,而曹操选择走小路,被诸葛亮抓住。这就

是曹操与诸葛亮之间的博弈的结果。

第五,博弈涉及均衡。

均衡是经济学中的重要概念。那么什么是均衡,它的含义

是什么?

均衡即是平衡的意思,在英文中是equilibrium。在经济学

Page 20: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

15   

第一章

 博弈论基础知识

中,均衡意即相关量处于稳定值。在供求关系中,如果在某一商

品市场的某一价格下,想以此价格买此商品的人均能买到,而想

卖的人均能将商品卖出去,此时我们就说,该商品的供求达到了

均衡。此时的价格可称之为均衡价格,产量可称之为均衡产量。

均衡分析是经济学中的重要分析。

那么什么是博弈论的均衡呢?所谓博弈均衡,它是一稳定

的博弈结果。均衡是博弈的一种结果,但不是说博弈的结果都

能成为均衡。博弈的均衡是稳定的,因而是可以预测的。

纳什均衡是一种最常见的均衡。它的含义是:在对方策略

确定的情况下,每个参与者的策略是最好的,此时没有人愿意先

改变或主动改变自己的策略。

在上面的“买—卖”的博弈中,(卖出,买进)是一纳什均衡,

这个博弈可以解释为什么在现实中讨价还价后买卖能做成,因

为这对双方来说都是最优选择。同时在“买—卖”博弈中,其均

衡对双方来说是全局最优的。

第六,重要的均衡———纳什均衡。

纳什均衡(NashEquilibrium)是 博 弈 分 析 中 的 重 要 概 念。

1950年身为研究生的纳什写了一篇论文———《n人博弈的均衡

问题》,该文只有短短一页纸,可就是这短短一页纸成了博弈论

的经典文献。在这篇论文中,纳什给出了博弈均衡的定义,这样

的均衡被人们称之为纳什均衡。

那么什么是纳什均衡呢?简单说就是,一策略组合中,所有

的参与者面临这样的一种情况:当其他人不改变策略时,他此时

的策略是最好的。也就是说,此时如果他改变策略,他的支付将

会降低。在纳什均衡点上,每一个理性的参与者都不会有单独

改变策略的冲动。

Page 21: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   16   

在囚徒困境中存在惟一的纳什均衡点,即两个囚犯均选择

“招认”,这是一稳定的结果。

有些博弈的纳什均衡点不止一个。如下述“夫妻博弈”(或

称性别之战)中有两个纳什均衡点。丈夫帕特和妻子克里斯商

量晚上的活动。丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两

人都希望在一起度过夜晚,双方的支付矩阵如下:

丈夫妻子

歌剧 拳击

歌剧 (2,1) (0,0)

拳击 (0,0) (1,2)

在这个“夫妻博弈”中有两个纳什均衡点:(歌剧,歌剧),(拳

击,拳击)。在有两个或两个以上纳什均衡点的博弈中,其最后

结果难以预测。在“夫妻博弈”中,我们无法知道,最后结果是一

同欣赏歌剧还是一起去看拳击。

是不是所有的博弈均存在纳什均衡点呢?不一定存在纯策

略纳什均衡点———所谓纯策略是指参与者在他的策略空间中选

取惟一确定 的 策 略。但 至 少 存 在 一 个 混 合 策 略(mixedstrate

gy)均衡点———所谓混合策略是指参与者采取的不是惟一的策

略,而是其策略空间上的一种概率分布。这就是纳什于1950年

证明了的纳什定理。我们下面将在“警察与小偷的故事”例子中

给出混合策略的说明。

我国研究纳什均衡的专家谢识予博士在《纳什均衡论》中用

通俗的话表达了纳什均衡含义:给定你的策略,我的策略是最

Page 22: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

夫妻博弈———拳击还是歌剧?

Page 23: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   18   

好的策略;给定我的策略,你的策略也是你最好的策略。这就是

说,双方在对方的策略下自己现有的策略是最好的策略。即:此

时双方在对方给定的策略下不愿意调整自己的策略。这里的策

略包括混合策略。

纳什均衡是博弈论中的重要概念,同时也是经济学的重要

概念。诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可

以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个

词:供给与需求。博弈论专家坎多瑞(Kandori)引申说:要成为

现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什

均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均

衡不仅对经济学意义重大,对其他社会科学意义同样重大。我

在书后的附录 中 用 数 学 语 言 给 出 了 纳 什 均 衡 及 纳 什 均 衡 存 在

定理。

二、博弈的类型

根据参与者能否形成约束性的协议,以便集体行动,博弈可

分为合作性博弈和非合作性博弈。纳什等博弈论专家研究得更

多的是非合作性博弈。

所谓合作性博弈是指参与者从自己的利益出发与其他参与

者谈判达成协议或形成联盟,其结果对联盟方均有利;而非合作

性博弈是指参与者在行动选择时无法达成约束性的协议。人们

分工与交换的经济活动就是合作性的博弈,而囚徒困境以及在

第八章讨论的公共资源悲剧都是非合作性的博弈。

博弈又分静态博弈和动态博弈。静态博弈指参与者同时采

Page 24: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

19   

第一章

 博弈论基础知识

取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人

不知道先采取行动的人采取的是什么行动。动态博弈指参与者

的行动有先后顺序,并且后采取行动的人可以知道先采取行动

的人所采取的行动。

从知识的拥有程度来看,博弈分为 完全信息博弈 和 不完全

信息博弈。信息是博弈论中重要的内容。完全信息博弈指参与

者对所有参与者的策略空间及策略组合下的支付有“完全的了

解”,否则是不完全信息博弈。严格地讲,完全信息博弈是指参

与者的策略空间及策略组合下的支付,是博弈中所有参与者的

“公共知识”的博弈。对于不完全信息博弈,参与者所做的是努

力使自己的期望支付或期望效用最大化。

这只是对博弈论的简单介绍。关于其中的详细内容,读者

需参阅有关书籍。

三、博弈案例

1囚徒博弈与我国应试教育的困境

囚徒困境可以用来说明许多现象。我国目前的应试教育就

是一个囚徒困境。

囚徒博弈是完全信息下的静态博弈,两个小偷各种策略组

合下的支付是他们之间的“公共知识”(我们在下一章中将讨论

什么是“公共知识”)。

我们上面已 经 分 析 了 囚 徒 对 局 下 各 个 策 略 下 的 结 果 或 支

付,以及它的均衡。它的均衡是双方均选择“招认”的策略。

可以这么说,最近10多年来,我国基础教育的问题是如何

Page 25: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   20   

摆脱应试教育的困境问题。目前给中小学生“减负”不仅是学生

家长的呼声,也是教育专家和教育管理部门的呼声,也可以说是

全社会的呼声。教育管理部门这几年做了一系列的工作,但收

效甚微,并没有从根本上解决问题。学校不断给学生增加负担

是目前教育的实际状况。

大家普遍认为应试教育是扼杀学生的创造性,无论是专家

还是家长,都在呼吁改变应试教育的模式。但是无论是专家,还

是意识到教育问题的普通老百姓以及没有意识到教育问题的老

百姓,其小孩都在接受着这种教育。

在现有的教育体制下,学生(或学生家长)有两个可选择的

策略:“减负”和“增负”。学生的精力是有限的,如果选择“减负”

策略,意味着学生有更多的时间学习课本以外的东西,这样学生

的素质得到提 高,因 此,“减 负”策 略 往 往 与 素 质 教 育 联 系 在 一

起;而如果选择“增负”策略,则意味着学生花大量的时间做大量

的习题,以“学透”、“学精”课本规定的东西,此时,学生没有时间

学习课本以外的没有规定的内容。“减负”的结果是学生的全面

发展;而“增负”的结果是学生获得高的分数。

在这样的博弈结构下,学生(或学生家长)如何选择呢?每

个学生这样想:其他人采取的是“增负”教育策略的话,如果我采

取“减负”教育策略,我的考试分数不如他人,在求学方面我会落

后,接受不了好的教育,在未来求职时我也赶不上他人。在他人

采取“增负”的策略下,我也应当采取“增负”策略。如果其他人

采取的是“减负”策略,我应当采取什么策略呢?还是应当采取

“增负”策略!因为,如果其他人采取的是“减负”策略的话,如果

我采取的是“增负”策略,我的考试分数会比其他人高,我会上好

的学校,在未来的职业竞争中我会处于优势。因此,无论其他人

Page 26: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

21   

第一章

 博弈论基础知识

采取的是什么策略,我采取“增负”策略都是最好的。当每个学

生都这样想的时候,全社会便进入了应试教育这样一个囚徒困

境之中。

如果我国现有的考试制度没有改变,现在假设所有的学生

都选择“减负”策略,即除了做少量的巩固性的作业外,不补课、

不做其他的练习题,情况会是什么样子?

假设这种状态会出现,我们说,这种状态会很快消失,而立

即会出现所有学生都进入“增负”的这样一个状态。可以说,均

选择“减负”策略的状态是不稳定的,而“增负”的状态是稳定的

均衡。原因就是,目前的教育的博弈结构规定了各种行动或行

为的收益或好处:获得高分的会进入好的初中、高中,进入好的

初中、高中的学生可以考高分进入好的大学。在这个博弈中,对

于教师来说,学生的升学率高意味着其成绩大、奖金高,对自己

的学生采取“增负”策略,对于自己而言是占优策略。

我国基础教育的博弈与囚徒困境有共同的结构,大家均选

择“增负”策略构成基础教育博弈的纳什均衡。纳什均衡是一个

稳定的博弈结果,这也是为什么我国目前的应试教育难以改变

的原因。

2.斗鸡博弈与古巴的导弹危机

试想有两只公鸡遇到一起,每只公鸡有两个行动选择:一是

退下来,一是进攻。如果一方退下来,而对方没有退下来,对方

获得胜利,这只公鸡则很丢面子;如果对方也退下来,双方则打

个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则

失败;如果两只公鸡都前进,那么则两败俱伤。因此,对每只公

鸡来说,最 好 的 结 果 是,对 方 退 下 来,而 自 己 不 退。支 付 矩 阵

Page 27: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   22   

如下:

鸡乙鸡甲

前进 后退

前进 (-2,-2) (1,-1)

后退 (-1,1) (-1,-1)

上表中的数字的意思是:两者如果均选择“前进”,结果是两

败俱伤,两者均获得-2的支付;如果一方“前进”,另外一方“后

退”,前进的公鸡获得1的支付,赢得了面子,而后退的公鸡获得

-1的支付,输掉了面子,但没有两者 均“前 进”受 到 的 损 失 大;

两者均“后退”,两者均输掉了面子,获得-1的支付。当然表中

的数字只是相对的值。

这个博弈有两个纳什均衡:一方前进,另一方后退。但关键

是谁进谁退?一博弈,如果有惟一的纳什均衡点,那么这个博弈

是可预测的,即这个纳什均衡点就是事先知道的惟一的博弈结

果。但是如果一博弈有两个或两个以上的纳什均衡点,则任何

人无法预测出一个结果来。因此,我们无法预测斗鸡博弈的结

果,即不能知道谁进谁退,谁输谁赢。

用这个博弈来解释20世纪60年代初发生在美苏两个超级

大国之间的一场导弹危机,是最合适不过的了。

Page 28: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

斗鸡博弈

Page 29: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   24   

  二战结束后,形成了对峙的两个超级大国,美国和苏联。这

两个超级大国是两个核心,在其周围有各自的盟友,它们一起组

成了两大敌对的 阵 营。1962年 赫 鲁 晓 夫 偷 偷 地 将 导 弹 运 送 到

加勒比海上的岛国古巴,卡斯特罗政权是苏联这个超级大国的

盟友,是美国的敌人。苏联的目的是将导弹部署在美国的眼皮

底下,以对付美国。然而苏联的行动被美国 的 U-2飞 机 侦 察

到了,美国发现古巴建立了导弹发射场。此事震动美国,肯尼迪

总统指责苏联,并发出严重警告,而苏联方面矢口否认。美国决

定对古巴进行军事封锁,派遣了舰艇、空军及航空母舰,并集结

了登陆部队。美国进入戒备状态,,美苏之间的战争一触即发。

面对美国的反应,苏联面临着是将导弹撤回国还是坚持部

署在古巴的选择?而对于美国,则面临着是挑起战争还是容忍

苏联的挑衅行为的选择?也就是说,这两只“大公鸡”均在考虑

采取进的策略还是退的策略?

  战争的结果当然是两败俱伤,而任何一方退下来(而对方不

退)则是不光彩的事。结果是苏联将导弹从古巴撤了下来,做了

丢面子的“撤 退 的 鸡”。美 国 坚 持 了 自 己 的 策 略,做 了“不 退 的

鸡”。当然,为了给苏联一点面子,同时也担心苏联坚持不退而

发生美苏战争———这是美国不愿意看到的,美国象征性地从土

耳其撤离了一些导弹。古巴导弹危机是冷战期间美苏两霸之间

发生的最严重的一次危机。

这就是美国与苏联在古巴导弹上的博弈结果。对于苏联来

说,退下来的结果是丢了面子,但总比战争要好;对美国而言,既

保全了面子,又没有发生战争。这就是这两只“大公鸡”博弈的

结果。

Page 30: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

25   

第一章

 博弈论基础知识

3.骑虎难下博弈与美苏武器竞赛

我们经常碰到的一类博弈是,行动者进也不是,退也不是。

笔者将这样的博弈称为骑虎难下博弈。

有一个拍卖,其规则是:轮流出价,谁出得最高,谁就将得到

该物品,但是出价少的人不仅得不到该物品,并且要按他所叫的

价付给拍卖方。

假定有两人竞价争夺价值100元的物品,只要双方开始叫

价,在这个博弈中双方就进入了骑虎难下的状态。因为,每个人

都这样想,如果我退出,我将失去我出的钱,若不退出,我将有可

能得到这价值100元的物品,但是,随着出价的增加,他的损失

也可能越大。每个人面临着两难:是继续叫价还是退出?

你会说,这个拍卖的规则不合理,在实际中这样的拍卖不会

出现。当然这只是一个模型,但我们经常会看到此类型的博弈

案例。①

在冷 战 期 间,美 苏 为 争 夺 霸 权 拼 命 发 展 武 器,无 论 是 原 子

弹、氢弹等核武器的研制,还是如隐形战斗机这样的常规武器的

研制,双方均不甘落后。20世纪80年代,里根在位时准备启动

“星球大战”计划,此举意味着两个超级大国的武器竞赛将进一

步升级。美苏之间的武器竞赛就相当于拍卖中轮番出价,双方

均不断出更高的价,如果一方没有出最高的价钱,退 了 下 来,即

① 这个博弈有一个纳付均 衡:第 一 个 出 价 人 叫 出100元 的 竞 标 价,

另外一个人不出价(因为在对方叫出100元 的 价 格 后,他 继 续 叫 价 将 是 不

理性的),出价100元的参与人得到该物品。

Page 31: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题
Page 32: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

27   

第一章

 博弈论基础知识

没有继续竞赛下去,那么意味着它在军备上的投入没有效果,而

对方将赢得整个局面。但如果继续竞赛下去,一旦支撑不住,损

失也就越大。

1991年苏联的 垮 台 在 一 定 程 度 上 是 军 备 竞 赛 的 结 果。苏

联将整个力量放 在 军 备 竞 赛 上,而 民 用 建 设 无 法 跟 上,国 力 不

济,最终退下阵来。里根的“星球大战”计划其目的就是要拖垮

苏联。

一旦进入骑虎难下的博弈,及早退出是明智之举,然而当局

者往往做不到,这就是所谓当局者迷。这种骑虎难下的博弈经

常出现在国家之间,也出现在企业或组织之间,当然个人之间也

经常碰到。20世纪60年 代,美 国 介 入 越 南 就 是 一 个 骑 虎 难 下

博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,也

是骑虎难下博弈,其实,赌徒进入赌场开始赌博时,他已经进入

了骑虎难下的状态,因为,赌场从概率上讲是肯定赢的。①

博弈论专家将 这 里 的 骑 虎 难 下 博 弈 称 为 协 和 谬 误。20世

纪60年代,英国和法国政府联合投资开发大型超音速客机,即

协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法

政府发现:继续投资开发这样的机型,花费会急剧增加,但是这

样的设计定位能否适应市场还不知道;而停止研制将使以前的

投资付诸东流。随着研制工作的深入,他们更是无法作出停止

研制工作的决定。协和飞机最终研制成功,但因飞机的缺陷(如

① 从理论上讲,赌徒与赌场 之 间 的 博 弈 如 果 是 多 次 的,那 么 赌 徒 肯

定输的,因为赌徒的“资源”与 赌 场 的“资 源”相 比 实 在 太 小 了。如 果 你 的

资源与赌场的资 源 相 比 很 大,那 么 赌 场 有 可 能 输 的;如 果 你 的 资 源 无 限

大,只要赌徒有非0的赢的可能性,那么赌徒肯定会赢的。因此,像葡京这

样的赌场要设定赌博数额的限制。

Page 33: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   28   

耗油大、噪音大、污染严重等等),它不适合市场,最终被市场淘

汰,英法政府为此蒙受很大的损失。在这个研制过程中,如果英

法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能

做到。

4.警察与小偷的故事———混合策略问题

纳什在《n人博弈的均衡点》这篇 论 文 中,给 出 了 均 衡 存 在

的简单证明,纳什说,在n个人的博弈中至少存在着一个均衡,

在这点上双方均不愿意先改变策略。这里的均衡点有可能是混

合策略点。人们称它为纳什定理。

什么是混合策略?

警察部门负 责 一 城 市 中 某 一 区 的 治 安。警 察 要 对 该 区 的

A、B两地进行巡逻。假定该区有一群小偷,要实施偷盗。警察

要防止小偷的偷盗,但因为设备有限,只有一部警车,因此,警察

只能一次在一个地方巡逻。而对于小偷而言,他们也只能去一

个地方。假定A地需要保护的财产价值为2万元,B地的财产

价值为1万元。若警察在某地进行巡逻,而小偷也选择了去该

地,因警察在场,小偷无法偷盗该地的财物;若警察没有去某地

巡逻而小偷选择了去该地,则小偷偷盗成功。警察怎么巡逻才

能使效果最好?

一个明显的做法是,警察对A地进行巡逻,小偷去B地,这

样,警察可以保住2万 元 的 财 产 不 被 偷 窃,小 偷 的 收 益 为1万

元。但是这种做法是警察的最好做法吗?有没有对这种策略改

进的措施?

我们可以将警察与小偷之间的这个支付写成如下的支付矩

阵。警察巡逻某地,偷盗者在该地无法实施偷盗,假定此时小偷

Page 34: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

29   

第一章

 博弈论基础知识

的得益为0(没有收益),此时警察的得益为3(保住3万元)。

这个博弈也是常和博弈,它没有纯策略纳什均衡点,而有混

合策略均衡点。这个混合策略均衡点下的策略选择是每个参与

者的最优(混合)策略选择。

小偷警察 盗窃A地 盗窃B地

巡逻A地 (3,0) (2,1)

巡逻B地 (1,2) (3,0)

对于这个例子,警察的一个最好的做法是,警察用掷骰子的

方法决定去A地 还 是B地。假 定 警 察 规 定 掷 到1—4点 去 A

地,掷到5、6两点去B地,这样警察有2/3的机会去A地进行巡

逻,1/3的机会去B地。

而小偷的最优选择是:以同样掷骰子的办法决定去A地还

是去B地偷 盗,只 是 掷 到1—4点 去B地,掷 到5、6两 点 去 A

地,那么,小偷有1/3的机会去A地,2/3的机会去B地。

此时警察与小偷所采取的便是混合策略。

假如按这种 办 法,警 察 此 时 的 期 望 得 益 是:7/3万 大 于2。

警察按此办法比只巡逻A地收益得到改进。

而小偷的收益是:一旦警察采取混合策略,小偷也采取混合

策略,其最优混合策略下的收益为2/3万元。

因为:当警察去A地巡逻时,小偷有13

的机会去A地,23

机会去B地,此时,警 察A地 的 得 益 为:613×3+23×2=

73

Page 35: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

警察与小偷———混合策略问题

Page 36: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

31   

第一章

 博弈论基础知识

元;当警察去B地时,同样小偷有13

的机会去A地,23

的机会去

B地,此时警察 A地的得益为:13×1+

23×3=

73

万元。警 察

总的得益为:23×

73+

13×

73=

73

万元。

同理,我们可得小偷的总的得益为23

万元。

警察与小偷之间的博弈,如同小孩子之间玩“剪刀—石头—

布”的游戏,在这样一个游戏中,不存在纯策略均衡,对每个小孩

来说,自己采 取 出“剪 刀”、“布”还 是“石 头”的 策 略 应 当 是 随 机

的,不能让对方知道自己的策略,哪怕是倾向性的策略。如果对

方知道你出其中一个策略的可能性大,那么你在游戏中输的可

能性就大。因此,每个小孩的最优混合策略是采取每个策略的

可能性是1/3。在这样的博弈中,每个小孩各取三个策略的1/3

是纳什均衡。

由此可见:纯策略是参与者一次性选取的,并且坚持他选取

的策略;而混合策略是参与者在各种备选策略中采取随机选取

的。在博弈中,参与者可以改变他的策略,而使得他的策略选取

满足一定的概率。

当博弈是零和博弈与常和博弈时,即一方所得是另外一方

的所失时,此时只有混合策略均衡。对于任何一方来说,此时不

可能有纯策略的占优策略。

5《三国演义》中的空城计与信息不对称的博弈

如果我们用博弈论的眼光看《三国演义》,三国演义完全是

一部记载着许 多 博 弈 案 例 的 著 作。当 然,罗 贯 中 不 可 能 用“博

Page 37: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   32   

弈”一 词。如 果 我 们 用 一 词 来 概 括《三 国 演 义》,这 个 词 就 是

“计”。计,即 计 策 或 策 略 也。用 计,即 用 策 略 赢 对 方。用 计 算

敌,不仅要自己选择恰当的计策,而且要算准对方用什么计策,

这不就 是 博 弈? 现 在 让 我 们 看《三 国 演 义》中 著 名 的 空 城 计

博弈。

诸葛亮误用马谡,致使街亭失守。司马懿引大军十五万蜂

拥而来。当时孔明身边别无大将,只有一班文官,五千军士,已

分一半先运粮草去了,只剩二千五百军士在城中。众官听得这

个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路

杀来。孔明传令众将旌旗尽皆藏匿,诸军各收城铺。打开城门,

每一门用二十军士,扮作百姓,洒扫街道。而孔明乃披鹤氅,戴

纶巾,引二小童 携 琴 一 张,于 城 上 敌 楼 前 凭 栏 而 坐,焚 香 操 琴。

司马懿自飞马上远远望之,见诸葛亮焚香操琴,笑容可掬。司马

懿顿然怀疑其中有诈,立即叫后军作前军,前军作后军,急速退

去。司马懿之子司马昭问:“莫非诸葛亮无军,故作此态,父亲何

故便退兵?”司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必

有埋伏。我兵若进,中其计也。”孔明见魏军退去,抚掌而笑,众

官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险;见如

此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之”,

我兵只有二千五百,若弃城而去,必为之所擒。

这就是为后人广为传颂的空城计。这是一个信息不对称的

博弈。

这里,司马懿不知道自己和对方在不同行动策略下的支付,

而诸葛亮是知道的,他们对博弈结构的了解是不对称的,诸葛亮

拥有比司 马 懿 更 多 的 信 息,当 然 有。这 种 信 息 的 不 对 称 完 全

Page 38: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

空城计博弈

Page 39: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   34   

是诸葛亮“制造出来的”。因此这是一个信息不对称的博弈。

在这里,孔明可以选择的策略是“弃城”或“守城”。无论是

“弃”还是“守”,只要司马懿明确知道他自己的支付,那么孔明均

要被其所擒。孔明惟一的办法就是不让司马懿知道他自己的策

略结果。他的空城计是降低司马懿进攻的可能收益,使得司马

懿认为,后退比进攻要好。

司马懿孔明

进攻 后退

守城 (被擒,大胜) (逃脱,不胜不败)

弃城 (被擒,大胜) (逃脱,不胜不败)

在信息不充分的情况下,博弈参与者不是使自己的支付或

效用最大,而是使自己的“期望支付(或效用)”最大。比如:如果

让你在“有50%的可能获得100元”与“有10%的可能获得200

元”两者之间进行选择,你当然选前者,因为前者的“期望所得”

为:50%×100=50元,而后者 为:10%×200元=20元。理 性

的人是选择前者的。

在孔明—司马懿的博弈中,孔明了解双方的局势,制造空城

假象的目的就是让司马懿感到进攻有较大的失败的可能。如果

我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻

失败的主观概 率。此 时,在 司 马 懿 看 来,进 攻 失 败 的 可 能 性 较

大,而退兵的期望效用大于进攻的期望效用。即:司马懿认为进

攻的期望效用低于退兵的效用。诸葛亮惟有通过这个办法,才

能让司马懿退兵。

Page 40: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

35   

第一章

 博弈论基础知识

司马懿想,诸葛亮一生谨慎,不做险事,只有设定埋伏才可

能如此镇定自若,焚香操琴。此时,司马懿觉得“退”比“进攻”更

合理,或者说期望效用更大。于是后军变前军,前军变后军,后

退而去。结果是诸葛亮得以逃脱。

司马懿对局势的判断不是没有道理的,他对诸葛亮的判断

是基于以前的认识,这就是“归纳法”,我们会在第六章中讨论归

纳法在博弈中的作用及其局限。

空城计博弈是不完全信息博弈,我们说过《三国演义》是一

本博弈实战教材,在该书中有完全信息博弈实例吗?当然,曹操

与诸葛亮的华容道博弈就是一个完全信息博弈。

曹操亲领八十万大军进攻东吴,孙权和刘备联合破曹,曹军

大败。曹操引兵而逃。经过一路厮杀,来到一处,军士报:前方

有两条道路,请问丞相走哪条路?曹操问:哪条路近?军士说:

大路稍平,却远五十余里。小路投华容道,却近五十多里。曹操

令人上山观望,回报:小路山边有数处狼烟,大路并无动静。曹

操叫走华容道。诸将问:烽烟起处必有军马,何故反走这条路?

曹操说:岂不闻兵书有云:“实则虚之,虚则实之”。诸葛亮多谋,

故使人于山僻放烟,使我军不敢从这条路走,他却伏兵于大路等

着。吾已料定,偏不教中他计。诸将皆曰:丞相妙算,人不可及。

遂曹兵走华容 道。但 关 羽 依 着 诸 葛 亮 的 妙 计 在 华 容 道 等 着 曹

操,于是关羽上演了一场“只为当初恩义重,放开金锁走蛟龙”的

捉放曹的义举。逃过华容道大难,曹操只剩二十七骑!

在曹操与诸葛亮之间的这一华容道博弈中,曹操的策略是

在走华容道还是走大路之间进行选择,而诸葛亮派关羽埋伏时,

要在埋伏在大路还是埋伏在通往华容道的小路之间进行选择。

Page 41: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

华容道博弈

Page 42: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

37   

第一章

 博弈论基础知识

曹 操

诸葛亮华容道 大路———0.1

华容道 (捉住曹操,被捉) (白等,逃脱)

大路 (白等,逃脱) (捉住曹操,被捉)

这个博弈如同猜硬币的游戏一样,是一“零和博弈”①,它没

有纳什均衡点。双方对博弈有完全的信息,各种策略下的博弈

支付是公共知识———我们下一章将说明什么是公共知识。但双

方无法知道对方的策略选择,而只能进行猜测。曹操要选择走

诸葛亮的军队不在的路,这是他的最优的结果。而诸葛亮的最

优结果是埋伏在曹操要走的路上。

诸葛亮制造埋伏在大路的假象,其实则派关羽埋伏在小路。

这里关键是谁能真正猜到对方的策略,谁就是赢家。诸葛亮胜

曹操一筹。这个博弈不存在纯策略纳什均衡点,博弈结果是:曹

操选择了走华容道,结果被抓;关羽在华容道守候,抓住了曹操。

① 所谓“零和博 弈”是 指 双 方 的 得 益 之 和 为 一 常 数 零,一 方 所 得 增

加,另一方所得便 减 少。而“变 和 博 弈”是 指 博 弈 双 方 的 所 得 之 和 为 一 变

数。

Page 43: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!公共知识与博弈

二!一个寓言"村庄里的大屠杀

三!帽子"红色的还是白色的#四!皇帝新装的新解读

五!$教%学&均衡的公共知识条件

%%%教育的知识结构分析

六’赤壁之战与诸葛亮!周瑜的掌中之(火&七’将军的困境

!

公共知识与行动均衡的打破

第二章

Page 44: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

41   

第二章

 公共知识与行动均衡的打破

一、公共知识与博弈

博弈专家们发现在博弈中存在着公共知识的问题。让我们

来看一下什么是公共知识。

要弄清什么是公共知识,首先要弄清什么是知识。

所谓知识是人对真的信念。知识是人们对自然中某个事实

的认识,我 们 说 某 人 拥 有 某 种 知 识,意 指 某 人 知 道 某 个 事 实。

“地球绕着太阳转”是个事实,但哥白尼之前的人们并不知道这

个事实,而今天这个事实已几乎被所有人熟知,并且人们相信这

个事实,于是“地球绕着太阳转”构成人们的知识。因此知识涉

及三个因素:

第一,人们了解的事实对象要是真的,假的事实不能成为知

识。人们可能相信虚假的东西,但它们不能构成相信它们的人

的知识。在偏僻的乡村,人们相信,人的病是由鬼怪引起的,巫

婆通过某些迷信活动能够驱除鬼怪从而达到治病的目的,这当

然只是错误的信念,而不是知识。再比如:在古代,中国人认为

雷电是由掌管雷电的雷公行云布雨的结果,这当然也不是真的

事实。假的信念有时对信念拥有者有一定的效果,但不构成相

信者的知识。

第二,某个人要知道这个真的事实。许多存在着的真的事

实我们并不知道,它们并不能构成我们(人类)的知识。我们常

说知识如大海一样,我们知道的只是知识海洋中的一滴水。我

们不知道的东西太多了。

Page 45: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   42   

第三,人们要相信他所知道的事实。如果他不相信某些事

实,尽管他知道,也不构成他的知识。哥白尼提出地球围绕太阳

转的日心说观点,那时许多人知道了这个事实,但并不相信,因

此“日心说”就不能构成他们的知识。

逻辑学家研究人的“知道”的结构,他们发现,当某人知道某

个事实时,这意味着:他知道他知道该事实,他知道他知道他知

道该事实……这是一个无穷的过程。将这个结构推广到某一人

群就构成公共知识的概念。

公共知识这个概念最初由逻辑学家刘易斯提出,之后由经

济学家阿曼等用于博弈分析。公共知识是一个群体人们之间的

对某个事实“知道”的关系。

假定一个人群由A、B两个人构成,A、B均知道一件事实f,

f是A、B的知识,但此时f还不是他们的公共知识。当A、B双

方均知道对方知道f,并且他们各自都知道对方知道自己知道f

……此时我们说,f成了A、B间的公共知识。

这个人群是由两个人组成,如果由多人组成,这不仅指任意

两个人这样一个双方“知道”的过程,而且指,其中任何一个人知

道其他人知道其他人知道……事实f。

因此,公共知识涉及一群体的对某个事实“知道”的结构。

在日常生活中,许多事实是公共知识,如:“所有人均会死”、

“所有鸟均能飞(鸵鸟除外)”,对于它们,所有人均知道(智力有

障碍者及婴儿除外),并且所有人知道其他人知道,当然其他人

也知道别人知道他知道……

有许多知识只有一些人知道。科学家知道的知识是其他人

所不知道的,而且科学家之中各个科学家知道的知识不同。可

Page 46: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

43   

第二章

 公共知识与行动均衡的打破

以这么说,知识的分布在各个人那里是不同的。

在博弈中,“每 个 参 与 者 是 理 性 的”,这 是 公 共 知 识。为 什

么?因为这是博弈前提———当然也是我们的假定。在具体博弈

中,参与者知道对方是理性的,同时知道对方知道自己知道对方

是理性的,等等。参与者知道自己是理性的,他知道自己知道自

己是理性的……同时参与者知道对方知道自己知道自己是理性

的……

对博弈来说,“参 与 者 是 理 性 的”是 起 码 的 公 共 知 识 要 求。

对于像囚徒困境这样的博弈,双方的不同策略下的支付也是公

共知识;曹操和诸葛亮在华容道上的博弈双方的策略下的支付

也是公共知识。

在有些博弈中,各种策略下的支付不能成为公共知识。比

如在商战中,相互竞争的双方不知道对方在各种产量下的利润,

此时,策略下的支付不是公共知识。

这里不分析 社 会 行 动 者 的 知 识 的 结 构,因 为 这 非 常 困 难。

只是想说明,知识的不同是非常重要的。

一个群体中的每个人的知识是其现实行动的因素。在社会

中知识分布决定了社会的结构,当然权力的分布和信息的分布

是另外的决定行动的因素。在一群体的行动中,公共知识改变

了,群体的均衡便发生了改变。

上述分析有些抽象,读起来令人乏味,现在让我们来看看公

共知识的具体应用例子,通过这些例子,读者就能明白什么是公

共知识,并且可以用它来分析身边的社会现象。

Page 47: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   44   

二、一个寓言———村庄里的大屠杀

在一个偏僻的山里,有一个村庄。这里是女人掌权,女人对

一切事务说了算。村里有100对夫妇。

在这个村里已经形成了约定俗成的规定。如果女人发现自

己的丈夫对自己不忠的话,就会毫不犹豫地将他杀死,而且就在

当天执行。当然,她必须有确切的证据来证明她丈夫不忠。由

于这个因素,某个女人发现某个男人不忠,她不会将之告诉那个

不忠男人的妻子。但是,她会告诉其他人的妻子,并且女人们会

相互传递这一信息,因此最后,一个男人不忠,除了其妻子不知

道外,其他女人都知道。

而事实上是,村子里的这100对夫妇的男人都不忠,但由于

女人不会将她知道的事实告诉不忠男人的妻子,每个女人都不

知道自己的男人不忠。因此,该村子一直很稳定,而没有发生妻

子杀死丈夫的行为。

村子里有一个辈份很高的老太太,她德高望重,诚实可敬。

每个人都向她汇报村里的情况,因此她对村里的情况了如指掌,

她知道每个男人都不忠,当然,其他女人不知道她所知道的。

一天,这位老人对这100个女人说了一句很平常的话:“你

们的男人当中至少有一个是不忠的。”于是,村里发生了这样一

个事情:前99天,村里风平浪静,但到了第100天,村里发生了

一场大屠杀,所有的女人都杀死了她们的丈夫。

故事就是这样的。

为什么会这样?

Page 48: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

一个寓言:村庄里的大屠杀

Page 49: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   46   

  这是一个推理和行动的过程。如果她的丈夫不忠的话,她

就杀死他;如果没有证据证明她的丈夫不忠的话,她便相信他,

不杀死他。这是女人的策略。

在老太太作了宣布之后的第一天,如果村里只有一个男人

是不忠的话,这个男人的妻子在老太太宣布之后就能知道。因

为,她会作这样一个推理:如果其他男人不忠的话,她应当事先

知道,既然不知道并且至少有一个男人不忠,那么这个不忠的男

人肯定就是她的丈夫。因此,村里如果只有一个男人不忠的话,

老太太宣布之后,当天这个男人就会被杀死。

如果村里有两个男人不忠,那么,这两个男人的妻子第一天

都不会怀疑到自己的丈夫,因为她知道另外一个女人的丈夫不

忠。但是当第一天过后她没有发现那个不忠诚的男人被杀死,

那么她会想,肯定有两个男人是不忠的,否则她知道的那个不忠

的男人会被他的妻子当天杀死的。既然有两个男人不忠,但这

两个不忠的男人的妻子想,她只知道一个,那么另一个不忠的男

人肯定是她的丈夫!……

事实上这个村子里的100个男人不忠,那么,这样推理会继

续到99天,就是说,前99天每个女人都没怀疑到自己的丈夫,

而当第100天的时候,每个女人都确定地推理出她的丈夫不忠,

于是村子里便发生了一场大屠杀,所有的男人都被他们的妻子

杀死。

这里,在老太太宣布“至少一个男人是不忠的”这样一个事

实时,每个女人 其 实 都 知 道 这 个 事 实(村 子 里 的 规 则 她 们 也 知

道),老太太对 这 个 事 实 的 宣 布 似 乎 并 没 有 增 加 这 些 女 人 的 知

识———关于村里男人不忠行为的知识。但为什么老太太的宣布

使得村里的女人产生了对她们丈夫的屠杀行为呢?这是因为,

Page 50: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

47   

第二章

 公共知识与行动均衡的打破

老太太的宣布使得这个群体里的女人的知识结构发生了变化,

本来“至少一个男人是不忠的”对每个女人都是知识,但不是公

共知识,而老太太的宣布使得这个事实成为公共知识。

所谓公共知识是指,一群体的每个人不仅知道这个事实,而且

每个人知道该群体的其他人知道这个事实,并且其他人也知道其他

的每个人都知道这个事实……这涉及一个无穷的知道过程。

在上述例子中,老太太未宣布之前,对村子里的女人来说,

“至少一个男人是不忠的”不是一个公共知识。设想一下,假定

共有3个女人A、B、C,那么在未宣布之前,A想:由于自己不知

道自己的丈夫不忠,其他两个女人B、C也 同 样 不 知 道,那 么 A

想B不知道C是否知道“至少有一个男 人 是 不 忠 的”。而 当 老

太太宣布了“至少一个男人是不忠的”之后,“至少一个男人是不

忠的”便成了A、B、C之间的公共知识。

在这个100人组成的小村里,老太太的宣布使得“至少一个

男人是不忠的”成了公共知识。于是,推理与行动便开始了。这

是大屠杀的原因!

三、帽子:红色的还是白色的?

与上述故事相同结构的一个事例是“帽子的颜色问题”。在

“帽子的颜色问题”中,同样是公共知识不断公布,推理不断进行

的过程。

有一群人围坐在一起,为了便于分析,假定只有4人(这与

人数多少无关,可作同样分析)。每个人头戴一顶帽子,帽子为

Page 51: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

红色的还是白色的

Page 52: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

49   

第二章

 公共知识与行动均衡的打破

红色和白色两种,每个人看不到自己帽子的颜色,但能看到别人

帽子的颜色。因此此时他不能判定出自己头上的帽子的颜色。

为了分析的方便,我们假定这4个人均戴的是红色的帽子。

这时候,一个局外人来到他们的群体当中,对他们说:“你们其中

至少一位头戴的是红色的帽子。”当他说了这句话后,他问:“你

们知道你们头上的帽子的颜色吗?”4个 人 都 说“不 知 道”;这 个

局外人第二次问:“你们知道你们头上的帽子的颜色吗?”4个人

又都说“不知道”。局外人第三次问:“你们知道你们头上的帽子

的颜色吗?”4个人又说“不知道”。局外人又问第四次:“你们知

道你们头上的帽子的颜色吗?”这时4个人均说:“知道了!”

你能知道为什么吗?

当局外人未宣布“至少一个人戴的是红帽子”时,这个事实

其实每个人都知道了,因为每个人看到其他3个人的帽子都是

红色的,但每个人不知道其他人是否知道这个事实,即这个事实

没有成为公共知识。而当这个局外人宣布了之后,“至少一个人

帽子是红色的”便成了公共知识。此时不仅每个人知道“至少一

个人的帽子是红色的”,每个人还知道其他人知道他知道这个事

实……

局外人第一次问时,由于每个人面对的其他3个人都是红

色的帽子,每个人当然不能肯定自己头上的帽子是什么颜色,于

是均回答“不知道”。此时,如果只有1个人戴红色的帽子,那么

这个人因面对3个戴白色的帽子,他肯定知道自己的帽子颜色。

因此,当4个人均回答“不知道”时意味着“至少有2人戴的是红

色的帽子”,而且这也是公共知识。

当局外人第二次问时,如果只有2人戴的是红色的帽子,这

Page 53: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   50   

2人就会回答说“知道”———因为他们各自面对的是1个戴红色

帽子的人。由于每个人面对的是不止一个戴红色帽子的人,因

此当局外人第二次问时,他们只能回答“不知道”。———此时的

“不知道”,意味着“至少3个人戴红色的帽子”,并且它成为公共

知识。

同样,局外人第三次问时,他们均回答“不知道”,意味着4个人

均戴的是红色的帽子。因此,当局外人第四次问时,他们就知道宣

布每个人头上均戴的是红色的帽子,于是,他们回答“知道”。

在这个过程中,当局外人首先宣布“其中至少一个人的帽子

是红色的”,以及第二、第三、第四次回答的时候,无论是回答“知

道”还是“不知道”———它们构成公共知识———构成所有人推理

的前提,在这个过程中,每个人均在推理。

这就是“帽子的颜色问题”。本人将这个问题简化了。原来

的问题比较复杂。它是这样的:

有一个游戏,有一个主持人和一群人(假定有n人),戴了两

种颜色的帽子,每个人的帽子的颜色或者是红色或者是白色,但

每个人不能看到自己的帽子的颜色却看得到其他人的帽子的颜

色。游戏的主持人说:“你们中至少一个人的帽子是红色的。”主

持人开始一次次地问:“你们知道不知道自己的帽子的颜色?”现

在的问题是:当主持人问到第几次时,才有人说“知道”?并且多

少人说“知道”?

据说,这个问题在20世纪曾风靡欧美。

Page 54: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

51   

第二章

 公共知识与行动均衡的打破

四、皇帝新装的新解读

我们都熟悉安徒生的童话《皇帝的新装》。

从前,一个皇帝爱穿漂亮的衣裳,有两个骗子对皇帝说,他

们能做出世界上最漂亮的衣服,这衣服不仅华丽,而且穿上它后

能知道谁是愚蠢的人,因为愚蠢的人是看不见这衣服的。皇帝

相信他们的话,给了他们许多金子,让他们开始织布。两个骗子

在织机旁煞有其事地忙碌着。皇帝派他的宠臣去看看工作的进

度,然而他们惊呆了:天啊,我什么也看不见!他们想,难道我是

愚蠢的人?我不胜任自己现有的权位?这是多么可怕的事啊!

但好在其他人不知道。于是他们装着看见的样子,称赞布是多

么多么的漂亮,骗子向他们描述衣服的色彩和图样,他们点头称

是。回去后,他们将骗子的话汇报给皇帝。皇帝亲自来看衣服

制作的进度,他也同样被眼前的情景惊呆了,因为他什么也没看

见!事实上确实什么也没有。皇帝也怀疑自己是愚蠢的人,但

他想,千万不能让别人知道我看不见衣服,千万不能让我的臣民

知道我是愚蠢的人,于是他也同样夸赞起衣服来。

全城庆典的那天,骗子装模作样地赶好了衣服,皇帝脱掉了

他原来的衣服,骗子做出给他穿衣服的样子。当骗子给皇帝穿

好所谓的“新衣服”后,皇帝步出宫殿向他的臣民致意。皇帝什

么也没穿,在大街上被他的臣子们簇拥着,他的臣民们都看着没

穿衣服的皇帝,然 而 他 们 不 敢 承 认,怕 别 人 知 道 自 己 是 愚 蠢 的

人,他们不说自己看不到皇帝的衣服。

Page 55: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   52   

这时,一个小孩突然说:“其实皇帝什么也没穿啊!”这一声

无疑是晴天霹雳。于是,老百姓私下传着这个天真无邪的小孩

的话,人们开始相信小孩说的话是对的。皇帝也知道了老百姓

们的窃窃私语,他想老百姓的话可能是对的,但他没办法就此回

头,他坚持把游行进行下去,于是他更加高傲地向前走去。

在这个童话中,骗子们所谓的皇帝的新衣服其实什么也没

有,每个人都知道这是事实。也就是说,对每个人来说,“皇帝什

么都没穿”是知识。但是,每个人不知道其他人是否知道这个事

实,即每个人不知道其他人拥有这个知识。同时每一个人知道,

只要他不说,其他人不知道他知道这个事实。即“皇帝什么都没

穿”不是皇帝、大臣及老百姓之间的“公共知识”。

这里有一个虚假前提:如果我没看见皇帝的新衣服意味着

我是愚蠢的。因此,每个人尽量地不让其他人了解自己没看见

皇帝的新装。此时,每个人,包括皇帝都在说着假话,硬说自己

看见了新衣服。每个人都在谎言下生活。这就是一个均衡,一

个大家都“说谎的均衡”。

然而,小孩说出“其实皇帝什么也没穿”,小孩意味着不会说

假话。当小孩的话传到每个人那里时,“其实皇帝什么也没穿”

便成了公共知识。原来的均衡打破了。安徒生的这个童话里让

小孩子说出真话有他的用意,小孩子是最真诚的和不受污染的。

这个故事中的说真话的小孩与村庄里的大屠杀里的老太太起着

相同的作用:使一个知识成为公共知识。

Page 56: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

53   

第二章

 公共知识与行动均衡的打破

五、“教—学”均衡的公共知识条件

———教育的知识结构分析

  我们每个人都有老师,上小学时有小学教师,中学有中学教

师,大学有大学教师,等等。并且在同一时候有不同的教师,如

在中学有数学教师、语文教师、物理教师、化学教师,等等。这是

众所周知的事情,没有什么特别的地方。

然而,如果我们对学生—教师的知识结构作一分析,我们会

发现,教育有着特别的知识结构。

教育有什么样的结构?我们每个人都知道,学校的教师知

道他或她应该知道的知识,学生知道他们的老师知道他们想学

的知识,老师也知道学生知道他或她拥有某些知识,即:老师知

道某些要求的知识是公共知识。我们用 K1 表示“教师知道某

些学科的知识”,K1 为公共知识。

同时,学生不知道教师知道的学科性知识,学生对这些知识

的无知也成为公共知识。即:教师知道学生对这些知识的无知,

成为学生和老师 间 的 公 共 知 识,同 时 也 是 全 社 会 的 公 共 知 识。

我们用K2 表 示“学 生 不 知 道 某 个 学 科 的 知 识”,K2 也 是 公 共

知识。

K1 和K2 不仅是老师和学生间的公共知识,同时也是社会

的公共知识。

因此,我们看到,之 所 以 教 师 站 在 讲 台 上,处 于“教”或“传

授”的位置,而学生坐在课桌前处于“学”或“聆听”的位置,就是

Page 57: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   54   

因为有这样的公共知识存在。“教—学”或“讲授—聆听”构成一

博弈均衡。如 果 没 有 这 样 的 知 识 构 成,“教—学”或“讲 授—聆

听”的均衡便不会形成。

这样的均衡何时会打破呢?

我们说,既然“教—学”的均衡依赖于公共知识K1 和K2,一

旦这样的知识构成被打破,“教—学”之间的关系将被终结。这

里有两种可能情况:一是K1 不是公共知识,或者因为教师不具

有这些知识,或者教师具有这些知识但没有成为公共知识,也就

是说学生或社会不知道。那么,“教—学”的均衡不能形成,这个

教师便不能站在讲台上。第二种情况是,通过一定时间的学习,

教师将知识教给 了 学 生,学 生 也 知 道 了 教 师 讲 授 的 东 西,此 时

“教—学”均衡也被打破了。

当然,K1 和K2 只是“教—学”均衡形成的必要条件,而非充

分条件。

六、诸葛亮、周瑜的掌中之“火”

《三国演义》描写了这样的故事:曹操带领大军进攻东吴,诸

葛亮来到东吴,劝说东吴与刘备一起抵抗曹操大军,都督周瑜向

诸葛亮请教如何破曹操的百万大军。周瑜说,我昨天察看曹操

水寨,极为严整、有章法,不是一般人所能够攻破的。我想了一

个计策,不知道是否可行,请先生为我决策。孔明则说:都督暂

不要说,我们各自写在手上,看一看是否一样。

Page 58: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

55   

第二章

 公共知识与行动均衡的打破

    瑜大喜,教取笔砚来,先自暗写了,却送与孔明;孔明亦

暗写了,两人 移 近 坐 榻,各 出 掌 中 之 字 互 相 观 看,皆 大 笑。

原来周瑜掌中 字,乃 一“火”字;孔 明 掌 中 亦 一“火”字。瑜

曰:“既我两人所见相同,更无疑矣。幸勿漏泄。”

在诸葛亮和周瑜未在掌中写出“火”字之前,或者尽管他们

在掌中写出“火”字但没有互相观看之前,火攻曹操为一个致胜

的妙计是他们两个人所知道的,但不是公共知识。因为周瑜不

知道诸葛亮知道这个策略。此时很有可能的是,诸葛亮知道周

瑜知道这个策略,但 周 瑜 以 为 诸 葛 亮 不 知 道 他 知 道 这 个 策 略。

而当两人在手中写出“火”字,并“互相观看”之后,这个策略可以

取胜为他们的公共知识。

诸葛亮与周瑜将“火”字写在掌中,并互相观看,这样的行为

使他们的知识结构发生变化。在这个过程,知识结构发生变化

的群体只有诸葛亮和周瑜两个人,而无其他人,“诸将皆不知其

事”。如果其他(尤其是曹操)知道火攻为诸葛亮和周瑜之间的

公共知识,那么火攻策略便不能战胜曹操,赤壁一战便会出现另

外的结果。知识的分布关系到战争的成败。

七、将军的困境

我们在生活中经常见到某些场合下,两个人为某件事情会

心一笑,此时两人达到了默契。

如果用公共知识的概念来解释,就是两人都知道 了 某 些 知

Page 59: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

将军的困境———协同攻击难题

Page 60: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

57   

第二章

 公共知识与行动均衡的打破

识,而且他们知道对方知道自己知道了该事情,即该事情是他们

的公共知识。他们不通过语言传达了这些信息。

两个默契的双方不用语言就可形成某个公共知识,而在有

些时候,即使用语言多次传递某个信息,该信息也难以成为公共

知识。我们看一个“协同攻击难题”。

两个将军各带领自己的部队埋伏在相距一定距离的两个山

上,等候敌人。将军A得到可靠情报说,敌人刚刚到达,立足未

稳。如果敌人没有防备,两股部队一起进攻的话,就能够获得胜

利;而如果只有一方进攻的话,进攻方将失败。这是两位将军都

知道的。A遇到了一个难题:如何与将军B协同进攻?那时没

有电话之类的通讯工具,而只有通过派情报员来传递消息。将

军A派遣一个情报员去了将 军B那 里,告 诉 将 军B:敌 人 没 有

防备,两军于黎明一起进攻。然而可能发生的情况是,情报员失

踪或者被敌人抓获。即:将军A虽然派遣情报员向将军B传达

“黎明一起进攻”的信息,但他不能确定将军B是否收到他的信

息。事实上,情报员回来了。将军 A又陷入了迷 茫:将 军B怎

么知道情报员 肯 定 回 来 了?将 军B如 果 不 能 肯 定 情 报 员 回 来

的话,他必定不会贸然进攻的。于是将军A又将该情报员派遣

到B地。然 而,他 不 能 保 证 这 次 情 报 员 肯 定 到 了 将 军 B那

里……

这就是“协同攻击难题”,它是由格莱斯(J.Gray)于1978年

提出。更为糟糕的是,有学者证明,不论这个情报员来回成功地

跑多少次,都不能使两个将军一起进攻。

问题在于,两个将军协同进攻的条件是:“于黎明一起进攻”

是将军A、B之间的公共知识,然而,无论情报员跑多少次,都不

Page 61: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   58   

能够使A、B之间形成这个公共知识!如果你是这两位将军中

的一个,你有什么办法?

Page 62: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!"独裁的#妻子

二!一个国家的权力分配故事

三!夏普里值与夏普里$苏比克权力指数

四%聪明的股东&班扎夫权力指数的应用

五%逻辑结构与投票影响度

六%民主社会中为什么很多人不投票’七%一群体中有多少种可能的权力结构’

你的权力有多大!

第三章

!

Page 63: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

61   

第三章

 你的权力有多大?

一、“独裁的”妻子

先看一个幽默。同事经常与一有“妻管严”的丈夫开玩笑,

同事逗他:“你家里谁拿主意?”“妻管严”笑着说:“一半一半。”同

事问他:“一半一半是什么意思?”他说:“当意见不一致的时候听

老婆的,当意见一致的时候听我的。”众人哈哈大笑。

在这个笑话中,当丈夫和妻子意见一致时听丈夫的,不一致

的时候听妻子的,这时候丈夫的权力是一半吗?显然,这时候丈

夫不能作出任何主张,我们说,他的权力为0。妻子是这个家庭

的“独裁者”。

在家庭中,这 个 妻 子 是 温 柔 的“独 裁 者”,而 丈 夫 是 幸 福 的

“被统治者”。但是如果在一个社会中,独裁者未必是温柔的,而

被统治的臣民也未必是幸福的。

在生活中你要作出许多决策,能作出决策构成你的权力。

比如,当你有一笔钱的时候,你对它有足够的使用权力:你

可以用它去买股票,你可以将之存在银行,也可以买房产。

当你决定去投资股票的时候,你面对的是几百种股票,你怎

么选择呢?你当然要分析这些股票所属的行业,是传统行业还

是高科技行业。你要看现有股价的高低,看它们每股收益多少,

是赢利还是亏损———股价与每股收益比决定市赢率,即你要看

市赢率是多少。你还要看流通股数量有多少。当然还要看有没

有炒作题材,有没有庄家在坐庄,等等。此时,无论你是股海畅

游的老手,还是偶尔在股海边忐忑不安,想一试身手的新手,你

的收益———赢还是 赔,赢 多 少 还 是 赔 多 少,完 全 取 决 于 你 的 选

Page 64: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   62   

择:买哪种股票,买多少,什么时候买,什么时候卖。

你有权决定买股票,你有权决定买什么股票,你有权决定将

它们卖掉。每种选择下,你都自己承受你自己作出的决定的结

果,这是你进 入 股 票 市 场 的 前 提。在 计 划 经 济 下,没 有 股 票 市

场,即使你有钱,你也无法作出买股票的选择。你没有选择的自

由,你也没有选 择 的 快 乐 和 痛 苦,你 当 然 也 不 必 承 担 选 择 的 结

果,因为没有结果。

你对股票可以选择买和卖,而且有绝对的选择权。但是你

对决定你单位的领导、对决定省市及国家的领导人有多大的权

力呢?显然,任何人都没有绝对的决定权。

在独裁制度下,人民对自己的命运也有一定的选择权,但许

多权力掌握在独裁者手中,更不用说对国家的重大决策了。独

裁者可以对任何人的命运说“死”或“生”,你如果要得出与独裁

者作出的决定相反的结果,那么只有一条路,那就是造反。公元

前209年陈胜、吴广作为屯长,带领900人充军渔阳,因大雨道

路不通,无法 按 规 定 时 间 到 达,而 逾 期 当 斩。陈 胜、吴 广 商 议:

“今亡亦死,举大计亦死,等死,死国可乎?”逃亡也是死,起义也

是死,同样都是死,为国家反抗暴政死不是值得吗?造反也是一

种表达方式,它是人民在迫不得已的情况下对暴政表达不同看

法的方式。

在民主制度下,人们可以表达自己的想法,可以参与决策。

在民主程序下,人们可以选择他们的领导人,当然这并不表明每

件重大事情的决策都是采取民主的方式,因为民主选举上去的

领导人可以是独裁的,但如果可以民主地将独裁者选举下去,这

才是真正的民主选举结构。

选举只是按民主决策机制进行的全民决策问题,像东帝汶

Page 65: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

63   

第三章

 你的权力有多大?

1998年通过“全民公决”,以 确 定 留 在 印 尼 还 是 独 立,是 另 一 种

全民性的民主决策议题。民主的决策程序是所有人均能表达自

己的看法。

但是,民主的决策结构、群体人数的多寡以及每个人所在的

位置,决定着每个人在这个民主决策程序下其说话的分量。间

接选举制和直接选举制是不同的民主选举制度,它们的结构是

不同的。只有在同一种结构下,处于相同位置上的人才有相同

的说话分量。

同时,在民主的结构下,人数如果多到一定程度,处于决策

底层的人,因认为他的决策对全局影响甚微,而常常不表示看法

或不投票,这就是搭便车效应。因此,在一个社会中,理性的人

对身边的事物往往不会“偷懒”,他会主动表达自己的意见或作

出选择,而对离自己较远的事物则会出现“偷懒”行为。

由此可知道,行动者的策略选择取决于群体的逻辑结构。

二、一个国家的权力分配故事

有一个国家,名叫Saha国,该国有六个按地理的自然疆域

划分的省份,它们是Alice,Bline,Cinda,Duhe,Eho,Frida。① 该

国实行代议制民主政治,所有立法决策由这些省份的代表来实

施。由于这些地区的人口数量不同,它们按人口分配了不同比

例的票数。票 数 分 配 为:Alice:10,Bline:9,Cinda:7,Duhe:3,

Eho:1,Frida:1。总票数为31张。

① 这是本书虚构的一个故事。

Page 66: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   64   

该国的法律规定:如果一项决议拥有半数以上的票数即获

得通过。即:如果一项决议获得31票中的16票或16票以上,

那么就获得通过。总统选举也一样,如果在两位候选人之间进

行选举,那么谁获得16张或以上的票即当选。

该国这样的 政 治 体 制 运 行 了 很 多 年,一 直 良 好 地 进 行 着。

但是Duhe,Eho和Frida的人民总觉得有点问题。于是他们请

来了法律专家班扎夫(John.F.BanzhafⅢ)来 分 析 一 下 该 国 的

政治体制。通过分析,班扎夫发现,尽管Duhe,Eho和Frida分

别有3票、1票和1票,但实际上,这三个省份在表决时,在任何

情况下都不起作用!

他们向总统反映了这个情况,要求总统提请修改票数分配

的议案。总统不明白:“这是怎么一回事?”

班扎夫向总统解释说:“每个决策者在决策时的权力体现在

他在形成的获胜联盟中是作为‘关键加入者’。如果决策者是作

为‘关键加入者’而出现的,那么他的权力大,反之则小。我们可

以把一个决策者作为‘关键加入者’的个数称之为‘权力指数’。”

班扎夫接着 说:“在 贵 国 的 政 治 体 制 中,Alice,Bline,Cinda

三个省份垄断 了 所 有 的 权 力,而Duhe,Eho,Frida三 个 省 份 在

现有的体制下,不是任何获胜联盟的‘关键加入者’。即Duhe,

Eho,Frida三个省份的权力指数为0。”

“什么是获胜联盟的‘关键加入者’?能不能举个例子?”总

统问。

班扎夫举例说:“比如联盟‘Alice-Bline’就 是 一 个 获 胜 联

盟,它们两者加 起 来 的 票 数 为19,大 于16张 票,因 而 Alice与

Bline均是获胜联盟‘Alice-Bline’的关键加入者。”

Page 67: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

总统———参议院———众议院

Page 68: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   66   

  “‘Alice-Bline-Duho’也是一个获 胜 联 盟,但 是Duho不

是关键加入者,是不是?那我明白了。你能不能帮我具体算一

下各个省份现有的权力指数?”

“可以。贵 国 现 有 的 决 策 体 制 可 以 记 为(16;10,9,7,3,1,

1)。前面的16为获胜联盟至少要获得的票数,后面的数字为各

个地区的票数。”班扎夫说:“这个投票体制的权力指数可见这样

一个表。”班扎夫拿出一张纸给总统看。

表3-1(16;10,9,7,3,1,1)体制下Saha国各省权力指数

地区 票数 权力指数 权力指数(%)

Alice 10 16 33·3

Bline 9 16 333

Cinda 7 16 333

Duho 3 0 0

Eho 1 0 0

Frida 1 0 0

“权力指数比是什么?”总统问。

“是这样:如果我们用百分比来分析投票过程中各投票者的

权力所占的比 例。对 于n个 人,每 人 的 权 力 指 数 为c1,c2……

cn,则投票者j的权力指数比为:

rj=cj/(c1+c2+……cn)

由上面这个 公 式 我 们 就 能 算 出 各 个 投 票 者 的 权 力 指 数 比

例。一个极端的情况是,如果一投票者拥有51或以上的股份则

他拥有100%的权力,而其他投票者拥有的权力为0%。”班 扎

Page 69: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

67   

第三章

 你的权力有多大?

夫说。

“哦,原来是这样。这确实不太公平。有什么办法改变这样

的状况?”总统问。

“可以的,总统先生。”班扎夫说,“您有什么具体要求?”

“首先,人数多的地区,权力要大些;其次,人数少的地区也

能有一定的权 力。当 然,最 好 不 要 作 太 多 的 修 改,否 则 很 难 实

施。大致是这些吧。”总统想了想说:“不过现在首要的是要增加

人数少的三个地区的权力。否则太不公平了。”

“要绝对公平很难,重新分配票还要经过各省份之间进行平

衡和争吵。”班 扎 夫 边 说 边 思 考,“这 样 吧,我 给 出 一 个 简 单 的

方案。”

班扎夫考虑了一下说:“多给Alice地区两张票吧。这样就

能使得其他票数不变的情况下增加三个弱小地区的权力。”

“这样行吗?”总统怀疑地说。

“可以的,”班扎夫解释说,“原来的总票数为31,获得16张

票就赢。而现在的 总 票 数 为33,获 得17票 才 能 赢。这 样 权 力

指数就发生了变化。”

“怎么个变化法?”

“让我计算一下。”

班扎夫掏出笔认真地计算起来,以确保无误。过了一会儿,

班扎夫说:“这个方案看样子能行得通。”说着,他拿出计算结果

给总统看:

Page 70: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   68   

表3-2(17;12,9,7,3,1,1)体制下Saha国各省权力指数

地区 票数 权力指数 权力指数(%)

Alice 12 18 34615Bline 9 14 26923Cinda 7 14 26923Duho 3 2 3846Eho 1 2 3846Frida 1 2 3846

总统看着班扎夫给他的各省份权力指数的结果,自言自语

地说:“对 于Frida来 说,它 在‘Alice-Duho-Eho-Frida’和

‘Bline-Cinda-Frida’两个联盟中起关 键 作 用,即 它 的 加 入 能

使这两个联盟获胜,若背离则使得它们落败。因此它的权力指

数为2。Duho和Eho和Frida都得到了改进。”

他对班扎夫说:“它确是一个改进了的可行的方案。但不知

道能不能说服国会给以通过。我试试办吧。谢谢你了。”

在Saha国的权力分配故事中所提到的权力指数,是班扎夫

于1965年提出的。他是根据博弈论专家夏普里提出的所谓夏

普里值而提出他的权力指数的,这个权力指数被学术界称为班

扎夫权力指数。

班扎夫的权力指数的意思是,投票者的权力体现在他能通过

自己加入一个要失败的联盟而使得它获胜,这同时也意味着他能

背弃一个本来要胜利的联盟而使得它失败。这就是说,他是这个

联盟的“关键加入者”,而他的权力指数就是他是关键加入者的获

胜联盟的个数。

考虑这样一个例子。有A、B、C三个人,A有两票,B、C各

Page 71: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

69   

第三章

 你的权力有多大?

有一票,这三个人组成一个群体,对某项议题进行投票,假定此

时赢的规则服从“大多数”规则,即若获得3票,即得到通过。他

们各自的权力有多大?

对各自的权力指数进行分析时,起作用的是获胜联盟的“关

键加入者”。对于 该 问 题,获 胜 的 联 盟 有:AB,AC,ABC。而 对

于这三个可能获胜的联盟来说,A在AB、AC和ABC中均是关

键加入者,所 以 他 的 权 力 指 数 是3。而 对 于B来 说,他 是 联 盟

AB的关键加入者,所以他的权力指数为1。而对于C来说,他

与B一样只是一个联盟的关键加入者,即联盟AC,他的权力指

数是1。因此A、B、C的权力指数之比是3∶1∶1。

在前面“独裁的”妻子的幽默中,如果用权力指数来分析,获

胜联盟有两个:妻子—丈夫;妻子。而在这两个联盟中,妻子是

这两个联盟的关键加入者,即 她 的 权 力 指 数 为2。丈 夫 不 是 任

何联盟的关键加入者,他的权力指数为0。

由这两个例子看,权力指数和票数不是一回事,票数只是一

个虚假的指标而已。在设计具体的投票制度时票数的分配要考

虑权力指数,合理的选举制度应当是:票数的安排要使得权力指

数与人数成一大致相同的比例。这才能使得选举具有民主性。

三、夏普里值与夏普里—苏比克权力指数

夏普里—苏比克权力指数是最早提出的一种权力指数,它

是夏普里和苏比克在1954的一篇文章“评价委员会中权力分布

的一个方法”中 提 出 的,而 该 权 力 指 数 是 基 于“夏 普 里 值”之 上

的。如果说纳什均衡是非合作博弈中的核心概念的话,那么我

Page 72: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   70   

们可以说,夏普里值(ShapleyValue)是合作博弈(或联盟博弈)

中的最重要的概念。

考虑这样一个联盟博弈。有一个三人财产分配问题:假定

财产为100万 元,假 定 这100万 元 在 三 个 人 之 间 进 行 分 配。a

拥有50%的票力,b拥有40%的票力,c拥有10%的票力。规则

规定,当超过50%的票认可了某种方案时,才能获得整个财产,

否则三人将一无所获。

我们看到,任何单独一个人的票力都不超过50%,从 而 不

能单独决定财产的分配。要超过50%的票力必须要形成联盟。

也就是说,在这个例子中任何人的权力都不是决定性的,也没有

一个人是无权力的或权力为0。

此时财产应当按票力分配吗?如果是的话,即a,b,c的财

产分配为:50%,40%,10%。但如果这样分配的话,c可以提这

样的方案,a:70%,b:0,c:30%。这 个 方 案 能 被a,c接 受,因 为

对a,c来说这是一个比按票力分配方案有明显的改进的方案,

尽管b被排除出去,但是a,c的票力构成大多数(60%)。

在这样的情况下,b会向a提出这样一个方 案:a:80%,b:

20%,c:0。此时a和b所得均比刚才c提出的方案要好,但c成

了一无所有,但a、b票力总和构成大多数(90%)

……

这样的过程可以一直进行下去。

在这个过程中,理性的人会形成联盟ab,ac或abc。但哪个

联盟能够形成呢?最终的分配结果应该是怎样的呢?

夏普里(L.S.Shapley)提出了一种分配方式,根据他的理论

求得的联盟者的先验实力被称为夏普里值(ShapleyValue)。

夏普里,一个在二战中与中国人民并肩与日本侵略者作战

Page 73: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

71   

第三章

 你的权力有多大?

的老兵,对中 国 人 民 有 深 厚 的 感 情。1944—1945年,他 随 美 军

部队转战于中国西南地境,笔者在2001年的一次国际博弈论大

会上与他聊天时,他神秘地谈起40多年前他在中国的情形,他

还记得当年 学 的 许 多 中 国 话,如“美 国 兵”、“你 好”、“谢 谢”,等

等。二战结束后,他回到美国接受高等教育,并从事数学研究。

他于1953年提出的夏普里值随着合作博弈在博弈论中的地位

的提升而日显重要。

夏普里值是这样的一个值:在各种可能的联盟次序下,参与

者对联盟的边际贡献之和除以各种可能的联盟组合。

在财产分配 问 题 上,我 们 可 以 写 出 各 种 可 能 的 联 盟 顺 序。

而边际贡献 就 在 于 在 这 个 顺 序 中 谁 是 这 个 联 盟 的“关 键 加 入

者”。如果是关键加入者,那么他的边际贡献就为100万元。

表3-3:财产问题中各种排列下的关键加入者

次序 abc acb bac bca cab cba

关 键加 入者

b c a a a a

由表3-3,我们得出a、b、c、的夏普里值分别为:

Φa=4/6,Φb=1/6,Φc=1/6

夏普里值是先验实力的一种度量,我们可以根据夏普里值

来划分财产。按照夏 普 里 值 我 们 可 以 将 财 产 分 为a:2/3,b:1/

6,c:1/6,单位为百万元。

根据夏普里值定义,所有排列的顺序是等可能的。而在每

一个排列下,每 个 参 与 者 对 这 个 排 列 的 联 盟 有 一 个 边 际 贡 献。

在投票博弈中,这个值反映的是参与者与其他参与者结成联盟

Page 74: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   72   

的可能性,因此夏普里值反映的是参与者的“权力”。

夏普里值用于权力分析时,便得到了夏普里—苏比克权力

指数。

据夏普里与苏比克的分析,美国总统与参议院及众议院的

权力指数之比为2∶5∶5,而总统与一个参议员、一个众议员的权

力比为:350∶9∶2。就是说,美国总统的权力几乎是一位参议员

的权力指数的40倍,是众议员的175倍。

四、聪明的股东:班扎夫权力指数的应用

在战场、商场上,因自己的行动策略选择与自己的切身利益

密切相关,人们的才智得到充分的发挥。现在让我们看一个商

场上的例子。

有一个股份公司,有5个股东,他们是A、B、C、D、E。在公

司重大决策上,公司法规定,遵循“一股一票原则”———即每个股

东的票数与他所持的股数相等,“大多数原则”———某项决议能

否通过取决于是否得到51%或以上的票数(或股数)的同意。5

个股东均同意这两个原则。

5个股东在公司成立时均拥有相同的股份20%,随着经营

的变化,股东的想法出现分化。B、C、D、E想逐渐减持股份,而

A想多拥 有 一 些 股 份。而B、C、D、E又 不 想 让 A完 全 控 制 公

司———根据“大多数 原 则”拥 有51%或 以 上 的 股 份 即 有 绝 对 的

说话权。

B、C、D、E各减持了3个百分点,A增加了12个百分点。此

时A、B、C、D、E拥有的股份分别为32%、17%、17%、17%、17%。

Page 75: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

聪明的股东———权力指数的应用

Page 76: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题
Page 77: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

75   

第三章

 你的权力有多大?

表3-5股份与权力指数比:股权情况2

股东 股份(%) 权力指数 权力指数比(%)

A 32 6 20

B 17 6 20

D 17 6 20

E 17 6 20

表3-6股份与权力指数比:股权情况3

股东 股份(%) 权力指数 权力指数比(%)

A 36 14 63636

B 16 2 9091

C 16 2 9091

D 16 2 9091

E 16 2 9091

从表3-4至表3-6可见,在5个股东之间平均持股的情

况下,即均持有20%的 股 份,权 力 指 数 也 是 平 均 的。当 股 份 发

生偏离时,如股东A持有的股份 多 几 个 百 分 点、其 他 股 东 仍 持

同样的股份,权力指数比还不发生变化。从表3-5可看到,当

A拥有32%的股份时,权 力 指 数 还 是 平 均 的,在 这 种 股 权 结 构

下,对A来说是最不公平的,他拥 有 的 股 份 是 其 他 股 东 的 近 两

倍,但权力却一样!

Page 78: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   76   

  但是当A的股份再有所增加,而其他每个股东降低一个百

分点时,权力指数比发生突变。A的权力指数一下子由6增加

到14,权力指数比由20%增加到63.636%,而其他股东的权力

指数由6降低到2,权力指数比则由20%降到9.091%。

A此时虽然不能拥有51%的股份或以上而有100%的决策

权,但由于他在决策时作为高获胜联盟中的关键加入者,要比其

他4个股 东 的 权 力 指 数 高 得 多,因 此 他 的 权 力 比 其 他 股 东 大

得多。

五、逻辑结构与投票影响度

为什么在上面“丈夫—妻子”的例子中丈夫与妻子不拥有相

同的权力呢?为什么Saha国原来的投票体制(16;9,7,3,1,1)

拥有的票数分别为3、1、1的三个省不具有权力呢?上面通过指

出投票者在形成获胜联盟中作为“关键加入者”的个数,得出他

权力的大小。而这也可从整个群体决策的逻辑结构中分析。

假定妻子是A,丈夫为B,在上述幽默中,对事 情 决 定 的 逻

辑式是:

F=AB+A珟B (3-1)

这里,“F”表示表决结果,“F=1”表示得到通过,“F=0”表

示没有通过。“AB”是丈夫B与妻子A意见相同的逻辑项,A珟B

是他们意见不同的逻辑项。表面上两者有相同的权力,其实(3

-1)等值于下式:

F=A (3-2)

Page 79: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

77   

第三章

 你的权力有多大?

  从(3-2)中可以看到,妻子是“独裁者”,在现实中这个丈夫

是幸福的“被统治者”。但是在政治生活中,如果出现这样的独

裁的行动结构,独裁者有绝对的说话权力,而被统治的人民则没

有任何发言权,被统治者则是不幸的。

(3-2)是独裁的一般的表达式,A是独裁者对某项事情进

行表决的值,“A=1”表示他“同意”,“A=0”表示“不同意”。

例如,假定这个社会由3个人组成:A、B、C,其中A是独裁

者。我们可以将B、C表示进独裁社会的F=A的逻辑式中,尽

管B、C在其中对F的值没有影响:

F=A

A(B+珟B)(C+珟C)=ABC+AB珟C+A珟BC+A珟B珟C (3-3)

变化后的式子尽管复杂,然而B、C根本不起作用。

3个人的民主社会的逻辑式是什么样的呢?假定这3人决

定服从“大多 数 原 则”,即 对 一 项 决 定 有 二 人 同 意 即 通 过,假 定

“F=1”表示 通 过,“F=0”表 示 否 决。“1”表 示 决 策 者 表 示“同

意”,“0”表示“不同意”。那么民主的逻辑结构是:

F=AB+AC+BC (3-4)

要说 明 的 是,“AB”、“AC”、“BC”的 意 思 是“逻 辑 乘”,如

“AB”的取值是:A、B均等于1时取1,A、B有一个取0就得0。

而“+”为“逻辑和”,如“A+B”的取值为:只要A、B有一个取值

为1就为1,A、B取值均为0时为0。

(3-4)与(3-2)完全是不同的。对于(3-4)这样的结构,

每个人对结果没 有 绝 对 的 控 制 权,而 只 有 部 分 决 定 权,A、B、C

每个人的权力是均等的。

民主的社会是所有投票者都能影响表决结果的社会,不过

不同的民主方式,群体的大小不同,每个投票者在里面的影响程

Page 80: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

三个人的民主

Page 81: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

79   

第三章

 你的权力有多大?

度不同。

在Saha国,我们分别用A、B、C、D、E、F代表Alice、Bline、

Cinda、Duhe、Eho、Frida六个省份。在原有的投票体制(16;10,

9,7,3,1,1)下,获胜的最小联盟为:AB,AC,BC。

在本人看来,用最小获胜联盟来衡量个体在集体投票行动

或博弈中的权力可能更合适,因为在最小获胜联盟中,每个投票

者都是关键加入者,计算此时每个参与者作为关键加入者的个

数是合理的,而在非最小获胜联盟中某个非关键加入者对联盟

没有贡献,应当将它删去。

最小获胜联盟可用逻辑的方法来表示,各个最小联盟的“逻

辑和”构成一个投票博弈的结构。Saha国原来的投票体制(16;

10,9,7,3,1,1)的逻辑结构为:

F=AB+AC+BC (3-5)

它与三个人的投票体制的逻辑结构是一样的。而在新的投

票体制(17;12,9,7,3,1,1)下,最小的获胜的“逻辑和”为:

F=AB+AC+BCD+BCE+BCF (3-6)

从逻辑结构的角度来看,原有的投票体制中,D、E、F三 省

不存在任何权力。新的体制下,D、E、F的权力得到改进。

我们可以用一个决策者说“是”和说“不”时议案获得通过的

概率之差来反映它的权力。这个值反映了他对整个行动决策的

影响程度,我们可称之为“投票影响度”,它的大小构成投票者权

力的大小。某个投票者的投票影响度d(A)的公式是:

d(A)=p(A=1)-p(A=0)

其中,p(A=1)和p(A=0),分别为A“同意”和“不同意”时

整个决议得到通过的概率。

在这里,我们 假 定 其 他 投 票 者 的 概 率 为1/2,这 个 假 定 是

Page 82: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   80   

说,每个投票者对某项决议事先的态度居于“中位”,或者说平均

而言是1∶2,也可以认为是“先验概率”。

在(16;10,9,7,3,1,1)投票体制下,我们可以算出这六个省

份的影响度为:d(A)=d(B)=d(C)=1/2;d(D)=d(E)=d

(F)=0。

而在(17;12,9,7,3,1,1)投票体制下,投票影响度d(A)=

17/32;d(B)=d(C)=15/32;d(D)=d(E)=d(F)=7/128。

此时权力之比为:68∶60∶60∶7∶7∶7。

这种方法的结果与权力指数的计算结果差不多。

六、民主社会中为什么很多人不投票?

投票者可以通过判断群体决策的结果对自己的有利程度来

投票,即判断F=1与F=0给他 带 来 的 好 处 来 决 定,因 此 他 的

选择是较简单的:如F=1对 自 己 有 利 就 选 择“同 意”(1),否 则

就“不同意”(0)。

但是,在互动过程中,投票者要考虑的另外一个重要的问题

是他的投票对决策的影响程度。如果他对整个社会或集体的决

策影响大,他的权力大,他的积极性就高,反之他的积极性就低。

而权力反映在上面所说的投票影响度上。

在一个群体中,一个人对一项决策可以完全由他决定,那么

他就是独裁者,独裁者的投 票 影 响 度 为1。而 独 裁 制 度 下 的 臣

民对投票结果的影响程度 为0。在 民 主 制 度 下,每 个 投 票 者 对

结果的影响程度肯定是介于0和1之间的一个值。

在一个人数很多的采取民主投票的群体中,投票者由于考

Page 83: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

81   

第三章

 你的权力有多大?

虑到他对投票结果的影响程度低,投票不积极,或者说,干脆不

投票。让我们分析这个情况。

在3个人组成的群体中,“大多数原则”下逻辑式为(3-4),

每个人的投票影响度可求得为:d(n=3)=1/2。

通过数值计算我们求得:

d(n=10)=0.246

d(n=50)=0.112

d(n=100)=0.0796

如果我们用一个百分比来衡量影响程度,投票者投票的“影

响比率”为:

投赞成票时提案通过的概率-投反对票时提案通过的概率投反对票时提案通过的概率 ×100%

通过计算我们可得:

r(n=3)=300%

r(n=10)=96.9%

r(n=50)=28.9%

r(n=100)=18.8%

由此可见,随着人数的增加,影响比率在降低。当人数达到

上千万上亿的时候,每个投票者对投票结果的影响度近于0,即

几乎没有影响,它反映的是在人数很多的情况下,人们的权力太

小了,几乎是0。这也就是为 什 么 在 民 主 社 会 中 许 多 选 民 不 投

票的原因。

因此,对于一个有很多人组成的社会,尽管在“大多数原则”

下民主投票是揭示群体偏好的一个好的方法,它是“正义的”,但

Page 84: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   82   

在进行民主投票表决时,每个人有充分的投票意识是至关重要

的。虽然个人的投票对选举结果影响不大,但他要意识到,投票

不仅仅是他神圣的权利,更重要的是他为社会所尽的义务。只

有这样才能摆脱民主中投票存在的不投票的问题。

七、一群体中有多少种可能的权力结构?

我们已经说 明:投 票 是 揭 示 群 体 各 投 票 者 的 偏 好 的 方 式。

但是投票结果取决于逻辑结构。在上面的例子中我们已经表示

了“独裁的”和“大多数原则”的民主方式。这只是投票博弈的两

种方式,只是权力分配的两种方式。一般地说,对于n人组成的

社会有多少种可能的权力结构呢?

在A、B两人 组 成 的 最 简 单 的 群 体 中,从 逻 辑 可 能 性 的 角

度,A、B之间有16种可能的决策结构,但有以下4种决策方式

是常见的,或者能在现实中找到意义的。它们是:

(1)F=A,(2)F=B,(3)F=A+B,(4)F=AB。

在(1)和(2)中 分 别 是 A、B说 了 算 的 独 裁 式 的 决 策 结 构。

在(3)、(4)中A与B有相等的决策权力,但是在(3)中,只要有

一个人同意就通过,在(4)中要 A、B两人同时同意才行。因此

在方式(3)中的决策比方式(4)中的决策要容易。

夫妻间的决策是现实的例子。他们间的决策无非是这4种

方式。也许在民主的夫妻间,重大的决策采取的是(4),即夫妻

均同意才去做,如:夫妻商量着决定买房、孩子上学,等等。对一

些小事或者一些临时碰到的事情则可能采取的是(3),比如每天

买什么菜这样日常生活或工作中的小事。读者不妨想一想是不

Page 85: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

夫妻间决策的方式

Page 86: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题
Page 87: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题
Page 88: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   86   

相互牵制的。也可以这么说,参与者的权力是牵制的权力,这如

同美国司法、立法、执法三个独立的权力机构,没有一个机构有

绝对的权力,三者的权力是相互制衡的。

Page 89: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!什么是公平分配"二!! 个金币的故事

三!海盗分宝石#公平规则下的不公平

四!所罗门的智慧$公平不是平均

五%从分蛋糕到财产分割与边界争端的解决$双赢的分配

公平分配可能吗!

第四章

!

Page 90: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

89   

第四章

 公平分配可能吗?

一、什么是公平分配?

分配是任何时代、任何社会的重要问题。在中国传统中有

这样的思维:“不患贫,而患不均”,即是说,人们能够忍受贫穷,

而不能忍受社会财富分配的不均等。微观经济学通常涉及三个

方面的内容:“生产什么”、“如何生产”以及“如何分配”,即:分配

是经济学的一个重要内容。

公平分配是人们追求的目标。然而,什么是公平的分配?

首先要确定一个分配的公平标准,某种分配符合这个标准,

它就是公平的,否则便是不公平的。

公平的并不是平均的,尽管有时是平均的。一个公平的分

配是,各方之所得是其“应该”所得的。但什么是“应该”所得的?

作为理性人,每个人均想多分配一点。现实中的许多争吵,

大到国家间的领土争端,小到人与人之间的鸡毛蒜皮的小事,很

大一部分是由于分配不公平造成的。这种争吵或者由于一方认

为不公平造成的,或者由于双方均认为不公平造成的。

二、8个金币的故事

有这样一个故事。

约克和汤姆结对旅游。约克和汤姆准备吃午餐。约克带了

3块饼,汤 姆 带 了5块 饼。这 时,有 一 个 路 人 路 过,路 人 饿 了。

Page 91: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   90   

约克和汤姆邀请他一起吃饭。路人接受了邀请。约克、汤姆和

路人将8块饼全部吃完。吃完饭后,路人感谢他们的午餐,给了

他们8个金币。路人继续赶路。

约克和汤姆为这8个金币的分配展开了争执。汤姆说:“我

带了5块饼,理应我得5个金币,你得3个金币。”约克不同意:

“既然我们在一起吃这8块饼,理应平分这8个 金 币。”约 克 坚

持认为每人各4块金币。为此,约克找到公正的夏普里。

夏普里说:“孩子,汤姆给你3个金币,因为你们是朋友,你

应该接受它;如果你要公正的话,那么我告诉你,公正的分法是,

你应当得到1个金币,而你的朋友汤姆应当得到7个金币。”

约克不理解。

夏普里说:“是这样的,孩子。你们3人吃了8块饼,其中,

你带了3块饼,汤姆带了5块,一共是8块饼。你吃了其中的1/

3,即8/3块,路人吃了你带的饼中的3-8/3=1/3;你的朋友汤

姆也吃了8/3,路人吃了他带的饼中的5-8/3=7/3。这样,路

人所吃的8/3块饼中,有你的1/3,汤姆的7/3。路人所吃的饼

中,属于汤姆的是属于你的的7倍。因此,对于这8个金币,公

平的 分 法 是:你 得1个 金 币,汤 姆 得7个 金 币。你 看 有 没 有

道理?”

约克听了夏普里的分析,认为有道理,愉快地接受了1个金

币,而让汤姆得到7个金币。

在这个故事中,我们看到,夏普里所提出的对金币的“公平

的”分法,遵循的原则是:所得与自己的贡献相等。

这就是夏普里值的意思。

Page 92: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

91   

第四章

 公平分配可能吗?

三、海盗分宝石:公平规则下的不公平

有这样一个分配故事:5个海盗抢到了100颗宝石,他们决

定对这100颗价值一样的宝石进行分配。分配规则是:(1)抽签

确定分配的顺序;(2)由抽到1号签的海盗提出分配方案,然后

5人(包括提出方案的1号)进行表决,当且 仅 当 半 数 和 超 过 半

数的人同意时,按 照 他 的 提 案 进 行 分 配,否 则 将 被 扔 入 大 海 喂

鱼;(3)如果第1号被扔到大海后,再由2号提出分配方案,然后

剩余4人进行表决,当且仅当超过半数的人同意时,按照他的提

案进行分配,否则将被扔入大海喂鲨鱼;(4)依此类推。

每个海盗都是绝顶聪明的,都能够进行充分计算而作出策

略选择。问题是:抽到1号的海盗提出怎样的分配方案才能够

既不使自己被扔到海里,又能使自己得到最多的宝石?

假设海盗已经确定的顺序为(1,2,3,4,5),1号提出的方案

要使其余4个人中至少2个人同意才能获得通过,因此,1号要

分析,他要使两个人同意的条件是,他给这两个人的宝石要多于

假若1号被抛进大海后其他人给他们的分配,即这两个人如果

不同 意 他 的 方 案,得 到 的 宝 石 更 少。同 时,1号 为 了 自 己 的 利

益,他要笼络的两个人是处于劣势的人,即在其他情况下,得到

珠宝最少的两个人。现在,我们来看一下,1号是怎样提出分配

方案的。

根据规则,假 设 前3个 人 均 被 抛 下 了 海,只 留 下4号 和5

号,4号提出100∶0方案,表决时4号同意,5号无法改变表决结

果,所以,在只有4号和5号时,分配方案是(0,0,0,100,0)。这

Page 93: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   92   

个分配结果是任何理性人均能够预测到的。

当只有3、4、5号时,如3号提出99∶0∶1方案,表决时,3

号和5号必定 同 意。因 为5号 知 道,若 不 同 意,将3号 抛 下 海

后,他将一无所得。3号知道5号所作的分析,所以他提出这样

的方案,3号自己当然是同 意 的。因 此,此 时 分 配 方 案 是(0,0,

99,0,1)。这个结果也是理性能够预测到的。

我们再往前推。当 有2、3、4、5号 时,2号 预 测 到 若 他 被 抛

下海后,分配方案将是(0,0,99,0,1)。因此,2号提出的最好的

分配方案是:98∶0∶0∶2,即 给 自 己 留98颗,给5号2颗。5

号会想,若我不同意,将2号抛下海后我得到的将是1颗宝石,

因此,我应当同意2号给我的2颗的分配。此时,2号和5号同

意该方案,尽管3号和4号不同意,但2号笼络了5号。此时分

配方案为(0,98,0,0,2)。

现在我们 来 看1号 的 最 优 方 案。1号 被 淘 汰,则3号 和4

号一颗也得不到———这是所有海盗均能够预测到的。所以1号

方案是给3号和4号各1颗,即方案为98∶0∶1∶1∶0。对该

方案进行表决时,3号、4号和1号均同意,这个方案获得通过。

因此,最 终 的 分 配 方 案 为(98,0,1,1,0),1号 海 盗 获 得 了

98颗!

在这个分配案例中,我们假定了海盗是理性的,他们每人均

有很强的分析能力,能够作出我们上述的分析。若不如此,海盗

们会不满意上述的分配方案而大打出手。

海盗分宝石的规则貌似公平:抽签决定分配顺序似乎表明

每个海盗的机会相等,提出的分配方案通过表决来进行,看起来

也挺民主。而分配结果则出人意料,最多的为98颗,最少的为

0颗!

Page 94: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

93   

第四章

 公平分配可能吗?

公平规则下出现了不公平。

四、所罗门的智慧:公平不是平均

所罗门是历史上以色列国的国王,是大卫王的二儿子。他

十分具有智慧。

据传说,有两个妇人争夺一个孩子,让所罗门王来裁决。所

罗门王说:“既然你们都说,孩子是自己的,然而你们均没有足够

的证据证明孩子确实是自己的,那么就将孩子劈 成 两 半,你 们

一人一半,这样不就公平了?”所罗门的话是严肃的。此时,所罗

门的手下要执行所罗门的命令。其中一个妇人同意这个分法,

认为所罗门王英明;而另一个妇人大哭,说:“亲爱的所罗门王,

我不要孩子了。整个孩子归她吧。”此时,所罗门对大哭的妇人

说:“你才是孩子的母亲。母亲是爱孩子的,宁愿不要孩子,也不

要孩子死啊。”所 罗 门 命 令 手 下 把 那 个 争 孩 子 的 假 母 亲 抓 了 起

来,重重惩罚。

这里,结果是公平的———孩子归他的母亲,而获得这个结果

的方式则是充满智慧的。

所罗门王所用的策略是不可重复的,这只有在特殊情况下

才能得到:那两个妇人均是在不知道所罗门王的真正意图的情

况下表达出自己的偏好的:真母亲首先希望孩子活着,其次才是

孩子回到自己的身边;假母亲首先关心的是不要输掉官司,孩子

的归属是次要的。

我们看到,这里的公平的分配不是指平均的分配,也不是双

方均满意的分配,而是合理的分配。

Page 95: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

分小孩———公平不是平均

Page 96: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

95   

第四章

 公平分配可能吗?

五、从分蛋糕到财产分割与边界争端的解决:

双赢的分配

  两人分一个蛋糕,用什么方法才能分配得公平?一个公平

的分法是:由其中一人持刀来分,分者后取。这样,分的人因担

心后取而吃亏,他所能采用的最好办法是尽量将蛋糕分平均,即

使他后拿,也不会吃亏。

分蛋糕只是对同质的东西所进行的一个简单的分配,对不

同质的东西能否建立一个像“你分我先取”分蛋糕那样的一个程

序,从而做 到 公 平 分 配 吗? 美 国 纽 约 大 学 政 治 系 的 勃 拉 姆 兹

(S.Brams)教授给出了肯定的回答。他提出了一个“双赢”的分

配办法。

我们来看一 下 一 个 离 婚 的 财 产 分 割 的 例 子。假 定 一 对 夫

妇,安娜和汤姆,感情破裂,不想在一起过日子了。他们到法院

进行财产分割。

法官看了他们的财产:冰箱、电脑、缝纫机、烟斗、自行车、书

桌。一共有6件。法官叫他们对这6件物品进行轮流选择,所

选择的归其所有。当然是女士先选。选择顺序是:安娜,汤姆,

安娜,汤姆,安娜,汤姆。

选择的结果是什么呢?我们假定安娜与汤姆对不同物品的

偏好不同,比如,安娜作为家庭主妇最喜欢冰箱,认为它也最值

钱;而汤姆由于工作的关系更喜欢电脑,认为它更有用。他们对

物品的“评价”见表4-1。

Page 97: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

离婚分东西

Page 98: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

97   

第四章

 公平分配可能吗?

表4-1

排序 安娜 汤姆

1 冰箱 电脑

2 缝纫机 烟斗

3 自行车 书桌

4 书桌 自行车

5 电脑 冰箱

6 烟斗 缝纫机

于是,选择的结果是:安娜选了冰箱、缝纫机和自行车,而汤

姆选了电脑、烟斗和书桌。

安娜得到了6件物品中她认为价值最高的3件物品,汤姆

同样得到了他希望得到的价值在前3位的物品。两人对分配均

满意。

这是一个双赢分配。

这里所实现的“双赢”分配,其基础是:我们假定了他们对不

同的物品的估价“差别较大”,或者说不同物品在不同的人那里

其“效用”是不同的。为了分析这里的分配是双赢的结果,我们

设定他们对每件物品进行打分,假定满分为100分,安娜和汤姆

分别将这100分分配给不同的物品。见表4-2:

Page 99: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   98   

表4-2

排序 安娜 汤姆

1 冰箱 28 电脑 30

2 缝纫机 22 烟斗 25

3 自行车 20 书桌 20

4 书桌 15 自行车 15

5 电脑 10 冰箱 5

6 烟斗 5 缝纫机 5

这样,安娜总共得到了70分,而汤姆得到了75分。两人分

配得到的结果大大超过了50分。① 如此看来,这样的分配确实

是双赢的。

在上述的分配中,我们假定了安娜和汤姆对不同物品的估

价或者排序是不同的。如果他们的估价差不多,情形又将如何?

假定安娜和汤姆对不同物品估价后进行的排序为表4-3。

与前面一样,同样是安娜先选择,然后是汤姆,接着是安娜……

在这样的选择中,如果每个人进行的选择是诚实的,即每个

人进行选择时,都是从剩下的物品中选择自己认为价值最高的

物品,那么结果是:安娜选择了冰箱、自行车和缝纫机;而汤姆选

择了电脑、烟斗和书桌。

① 勃拉姆兹在《双赢解》一 书 中 还 提 出 了 分 配 的“无 嫉 妒 原 则”。这

里,安娜的所得为70分,汤姆的所得为75分。安娜嫉妒汤姆,认为他的所

得超过自己。勃拉姆兹提出,可以让汤姆补给安娜2.5分值的东西,这样,

安娜的心理就平衡了。此时双方都不会产生嫉妒心理。

Page 100: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

99   

第四章

 公平分配可能吗?

表4-3诚实的选择

排序 安娜 汤姆

1 冰箱 电脑

2 电脑 烟斗

3 自行车 书桌

4 书桌 自行车

5 缝纫机 冰箱

6 烟斗 缝纫机

在这个分配中,安娜获得了她认为的价值“第一”,“第三”和

“第四”的物品,而汤姆获得了他认为价值“第一”、“第二”和“第

六”的物品。

这样的分配对双方来说,虽然不是最好的结果,但是双方应

该对这个分配结果感到满意的。

在这 个 例 子 中,聪 明 的 读 者 会 想 到:安 娜 第 一 次 不 选 择 冰

箱,而先选择电脑,情形会怎样呢?即:安娜的选择是策略性的,

而不是诚实的。因为,安娜知道在汤姆那里电脑排第一,而冰箱

排倒数第二。安娜第一次选择了电脑,轮到汤姆选择时,汤姆不

会选择冰箱,而选择了烟斗。结果见表4-4。

在表4-4中,安娜得到了她认为的最值钱的前三位东西。

汤姆得到了他认为的第二、第三及第六位价值的物品。

Page 101: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   100  

表4-4策略选择

排序 安娜 汤姆

1 冰箱 电脑

2 电脑 烟斗

3 自行车 书桌

4 书桌 自行车

5 缝纫机 冰箱

6 烟斗 缝纫机

在这个例子中,如果汤姆对自己的分配所得的结果不满意,

他同样可以采取策略行为。当他看到安娜采取策略性行为而选

择了电脑时,论到他选择时,他先选择冰箱!尽管冰箱在他看来

价值最低,但他知道冰箱在安娜那里价值最高,当他选择了冰箱

后,他可以用它与安娜交换电脑!这样一来,情形就较复杂。读

者不妨自己分析此时的结果。

如果双方对物品的估价一样,此时的分配便无法做到双赢

了。这样的分配问题演变成一个“常和博弈”:双方所得之和为

一个常数,一方如果分配所得多了,另外一方的所得便少了。我

们这里不对这个问题进行探讨。

有意思的是,勃拉姆兹教授认为,他的这种方法可以用于解

决南沙群岛争 端 问 题。勃 拉 姆 兹 首 先 将 南 沙 争 端 各 方 分 成 两

方:以中国(包括中国台湾)为一方,以声称拥有主权的东盟四国

(越南、菲律宾、马来西亚、文莱)为一方。然后将超过230个小

岛和暗礁分成“南部”、“西南部”、“中南部”、“东部”和“中北部”

五部分,让双方就“政治利益”、“军事重要性”和“经济利益”给出

Page 102: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

101  

第四章

 公平分配可能吗?

分值,然后进行分配,这样可以实现双赢。本人在纽约大学做访

问学者时,他问:“你 看 这 个 方 法 能 够 解 决 南 沙 争 端 吗?”我 说:

“不可 能!”他 问:“为 什 么?”我 说:“每 个 国 家 都 希 望 得 到 更

多!”他说:“只要各方理性地坐下来谈,这便是一个双赢的分配

方案。”对勃拉姆兹的解决有兴趣的读者请参见勃拉姆兹1999

年出版的《双赢解》(TheWinWinSolution)。

Page 103: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!知识与博弈

二!信息与战争博弈

三!声称的策略与实际的策略"言语博弈问题

四!言语博弈中的#威胁$与#承诺$五%空口声明博弈

信息!言语与行动

第五章

!

Page 104: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

105  

第五章

 信息、

言语与行动

一、知识与博弈

对一博弈来说,肯定存在着某些公共知识,均衡的产生依赖

于这些公共知识的条件,只不过不同博弈的公共知识是不同的。

如:“参与者是理性的”是公共知识,“博弈结构或支付函数”是公

共知识。

新的公共知识的出现会使原来的均衡打破,而形成新的均

衡,如“村庄里的大屠杀”中的“至少有一个男人是不忠的”,“皇

帝的新装”中的“皇帝没有穿衣服”,成为公共知识后,原来的均

衡便打破了。

然而在一博弈中,公共知识不是参与者知道的惟一知识,也

就是说,对参与者来说,存在着非公共知识。即:有些知识不是

公共知识。

这里有两种情况,一是有些知识,博弈双方知道,但不知道

对方知道不知道,当然也不知道对方是否知道自己知道不知道,

最明显的例子是小孩说出真相之前每个人都知道“皇帝没有穿

衣服”。这时也形成均衡。

第二种情况是,有些知识是博弈的一方知道的,而另外一方

不知道,即一方拥有的知识多一些,而另外一方拥有的知识少一

些。现在的问题是,拥有知识多的一方更有利还是拥有知识少

的一方有利?

惯常的想法是知识越多越好,事实是不是这样呢?让我们

看一个例子。

假定同一种商品只有两个商家生产,它 们 构 成 寡 头 垄 断。

Page 105: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

商家博弈

Page 106: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

107  

第五章

 信息、

言语与行动

它们之间面对同一个市场,它们要决定生产多少。有很多经济

学家在研究这个问题,而且有很多模型,如库若模型、斯坦伯格

模型,等等。这个问题是西方经济学家关心的问题。

我们这里不用模型来分析(有兴趣的读者可找有关文献),

只是定性地给予解释。

在双方互相不了解对方的情况下,每个商家力图调整自己

的产量以使得自己的利润最大,在调整的过程中我们会发现对

方也在调整,当对方调整时自己还得调整……这是一个动态的

过程。理性的厂商会这样想:我何不预测对方在我调整时将得

出的产量?双方都这样想,这就是博弈过程。或者碰巧猜测对

了对方的产量,或者真的了解了在自己产量给定的情况下对方

的最优产量。这时,纳什均衡产量就达到了。这时双方对对方

的支付结构都不了解。这里,“无知”是对称的。

在这个调整过程中假定一方通过某种方法了解到对方的调

整策略,这个方法或者是从调整中得来的,或者通过商业间谍获

悉的,或者两种并用。此时,我们可以说,知识是非对称的,一方

比另外一方拥有更多的知识。拥有更多的知识将处于有利的局

面:它因为准确预测对方的产量而可以确定使自己利润最大的

产量。这也可以解释企业为什么尽量获取对方内部的信息,而

尽量不让对方了解自己内部的信息。这也就是商业间谍存在的

原因。由此可见,商战的双方感兴趣的不仅仅是对方的技术机

密,企业产量与 利 润、成 本 之 间 的 关 系 均 是 战 略 决 策 的 决 定 因

素。商业间谍侦查和反侦查是商场上竞争的手段,它决定着商

战的成功。

Page 107: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   108  

二、信息与战争博弈

国际上国与国之间外交上的较量何尝不是这样呢?国与国

之间的外交行为是地地道道的博弈行为,而战争是一种特殊的

博弈。为了达到本国的利益,其策略选择要使自己的目的最大

化,然而任何国家在决定自己的策略时要充分考虑对方的行为,

间谍的目的之一就是弄清对方变动的可能性。因此,信息在博

弈中发挥着重要的作用。

我们可以用一个例子来说明。

二战结束后,朝鲜沿三八线被划分为南北朝鲜。1951年南

北朝鲜发生战争,美国介入。对于美国来说,它预计中国不会介

入到朝鲜战争 中 去。因 为,在 美 国 看 来,新 生 的 共 和 国 刚 刚 成

立,内战消耗太大,经济百废待兴,不可能卷入战争。并且美国

认为,美国武器装备优良,军费充足,即使中国参战,也无力与之

抗衡。因此美国得出结论:朝鲜战争因美国的介入很快就会结

束,而中国不会介入。当时美国有一家叫德林的咨询公司,在美

国未出兵之前,深入地研究了中国的情况、朝鲜与中国的关系,

研究的结论是:如果美国介入到朝鲜战争中去,中国将出兵。他

们想将研究报告以500万美元卖给政府,而美国政府未予理睬。

最终,美国这个军事大国在朝鲜战场上丢了脸面,损失的财产以

几百亿美元计,伤亡数十万人,

各国均有派往他国的间谍,间谍的信息可供本国的决策者

作出利己的决策。而为了自己在决策中的胜利,反间谍是一国

安全的 主 要 内 容。因 此 间 谍 与 反 间 谍 是 国 与 国 之 间 永 久

Page 108: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

109  

第五章

 信息、

言语与行动

的话题。

冷战时期,美国与苏联的间谍战已众所周知,驱逐间谍和交

换间谍也是常有的事情。苏联解体后,俄罗斯与美国之间的敌

对关系不存在了,取而代之的是战略伙伴关系。然而间谍战并

没有因此而消失。

那么,他国间谍的存在对自己本国的战略全是坏事情吗?

未必。为什么这样说?获取情报是间谍的任务,而足够的

情报是战争胜利的保证,因此间谍的存在是胜利的条件。但是

一场战争只能有一方胜利,如果了解到对方足够的情况而知道

自己肯定会输的话,该国还能打吗?此时战争还能打得起来吗?

战争胜败大体上取决于实力、信息、战略与人心。如果其中

一方各方面均优于另外一方,并且弱的一方知道的话,理性的弱

者是不会参与战争的,此时战争便打不起来。间谍就具有传递

这个信息的作用。

应当说,双方之间若要进行战争,足够理性的双方应当知道

谁会胜利,谁会失败。这是惟一确定的。因此很多情况下,国与

国之间的战争往往是由于不完全了解局势造成的。如果不考虑

战争的所谓正义与非正义———因为这个问题是伦理学的内容,

而不是科学的考虑对象,应当看到,有足够理性的双方之间是不

可能发生战争的。

一般来说,战争是两败俱伤的,尤其是双方力量对比差不多的

时候。战争往往是双方没有足够的信息造成的。当然现实中很难

做到信息充分,因而战争也不可能未打之前就能定胜负。弱者可以

胜强者,以弱胜强的例子太多了,中国共产党的军队在解放战争期

间打败无论是军队的装备上还是军队的数量上均居于优势的国民

党军队。尽管毛泽东对自己的才能及自己的军队有足够的自信,然

Page 109: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

间 谍

Page 110: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

111  

第五章

 信息、

言语与行动

而在1945年重庆谈判时未必能预知他的军队能这么快就胜利。而

蒋介石更不知道他会失败,否则他在谈判桌上不会毫无谈判诚意,

不让共产党有生存空间,并且边谈判边开战。

从理论上讲,具有足够理性和具有足够知识与信息的人能

预知战争的结果。但现实中的人或者因为没有足够的知识和信

息,或者不具有足够的理性(或算计)的能力,而往往不能做到这

一点。战争的结果不能预知,这也是战争的魅力所在。

一般来说,获取对方的信息而不让对方知道己方的情况是

合理的。然而这不是绝对的。

如果一方要将虚假信息传递出去,对方间谍的存在是最好

的。另一方面,如果弱小的一方因不了解对方的情况而开战,则

对双方都是不利的。强国也不愿意发生战争,它通过媒体表达

自己的态度,然而弱小的一方会以为对方是因弱而害怕,更加大

了开战的决心。此时,强国最好的办法是将自己的情况让对方

的间谍知道。当弱势方知道对方的真实情况时,一场对谁都不

利的战争便避免了。

其实,早在2000多年前我国著名的《孙子兵法》中就强调了

间谍的作用。在第13篇《用间篇》中讨论了间谍的种类、作用及

用法。

“先知者不 可 取 于 鬼 神,不 可 象 于 事,不 可 验 于 度,必 取 于

人,知敌情者也。”了解敌情不能求神问鬼,不能类推,不能臆测,

只能从知道敌情的人那里获得。孙子提出五间:乡间———利用

敌方的本地人做间谍;内间———用地方的官吏做间谍;反间———

迫使敌方的间谍为我所用;死间———散布假情报并通过我方的

间谍告诉敌方;生间———让我方的间谍回来报告情报。而五间

中,孙子认为,关键是反间。

Page 111: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   112  

孙子说:“故 三 军 之 事,莫 亲 于 间,赏 莫 厚 于 间,事 莫 密 于

间。”军队的各种事务中,最亲信的是间谍,赏赐最多的是间谍,

行动最机密的还是间谍。由此可见,信息在战争博弈中的作用。

三、声称的策略与实际的策略:言语博弈问题

有些博弈是“无声的”,而有些博弈是“有声的”。这有声的

博弈可称之为言语博弈。如各国的外交声明,战争中或战争之

前各方发布的真假策略(如在海湾战争中,伊拉克对美国说:如

果你打我们的话,我 们 将 向 以 色 列 发 射 导 弹),都 是 言 语 博 弈。

在博弈论中有学者称之为信号博弈。

言语博弈涉及实际的策略决定和声称的策略决定。

如:当 有 人 说“人 不 犯 我,我 不 犯 人;人 若 犯 我,我 必 犯 人”

时,这含有什么意思呢?

如果“别人犯我,我不犯别人”的话,别人会不断地犯我,我

将不断地受到侵犯———这是我所不希望的;如果“别人不犯我,

我犯别人”的话,我不犯人的时候别人也会来犯我———这也不是

我所期望的。因此,“人不犯我,我不犯人;人若犯我,我必犯人”

的策略是我的好的策略。其价值是由理性的我出于利己的动机

来规定的。这是策略决定。

同时,这个策略的说出本身有“传达”的功能:你不要犯我,

否则我肯定犯你;你不犯我,我也不会犯你。语言哲学中有人认

为,语言本身就是行动(speechact)。这里行动者就是将行动的

可能策略告诉对方,目的是使双方避免出现不希望的结果,而首

先是为了自己的目的。

Page 112: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

人不犯我,我不犯人;人若犯我,我必犯人

Page 113: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   114  

  如美国声称,如果中国武力攻打台湾的话,美国将介入。这

是美国声称的策略。美国通过这言语上的声明,目的是为了恐

吓中国政府。而中国政府同样以言语回击:是否以武力收复台

湾是中国的内 政,美 国 无 权 干 预。言 下 之 意,如 果 美 国 干 预 的

话,美国和中国将发生战争。如果中国政府真的武力攻打台湾

以实现国土统一,美国真的会介入吗?这是中国政府所要考虑

的问题,即要弄清美国届时实际的策略是什么。而美国也要考

虑,一旦战争打起来,美国如果干预的话,中国会向美国开战吗?

因此要分清行动者真正的策略决定与声称的策略决定。真

正的策略决定,我们说是规定真的,因为它是行动者从利己的角

度确定的,行动者没有理由确定对自己不利的策略决定。而声

称的策略决定本身也是一种策略,或者说本身是一种决定了的

行动。行动者通过这个行动来达到某种目的。

可以这么认为:“人不犯我,我不犯人;人若犯我,我必犯人”

是一种声称的策略决定。而“如果天下雨,我将带伞”则是真正

的策略决定。

怎么区分这两种决定呢?

声称的策略决定首先是一种语言行动,而真正的策略决定

不是一种语言行动。声称的策略决定是行动者向其他行动者说

出去的一种行为,它是行动者的一种行动。而真正的策略决定

是不是需表达出来的,其他行动者有可能知道也有可能不知道,

并且有时这种真正的策略决定是保密的。

其次,声称的策略决定与真正的策略决定可以相同也可以

不同。行动者的真正的策略决定是利益最大化得来的,只要社

会的逻辑结构或博弈结构给定,行动者就会有自己的策略决定。

囚徒困境中,被警察抓到的囚徒———行动者或博弈方,在警察给

Page 114: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

115  

第五章

 信息、

言语与行动

了他们的支付矩阵后,他们就会分析出自己的策略决定,即:无

论对方招认还是不招认,他的最优策略是招认。

四、言语博弈中的“威胁”与“承诺”

在现实中,我们经常看到声称的策略决定,但是这些声称的

策略可信吗?

声称的策略包括“威胁”与“承诺”。美国和中国在台湾问题

上的言语博弈就是威胁的。而在国际核武器问题上,我国及其

他一些国家承诺“不首先使用核武器”就是一种言语承诺。

博弈论中,经 常 用“可 置 信”和“不 可 置 信”的“威 胁”或“承

诺”来区分行动者说出来的策略,我们在对动态博弈的分析中会

分析什么样的策 略 是 可 置 信 的,什 么 样 的 策 略 是 不 可 置 信 的。

而分析“威胁”或“承 诺”是 可 置 信 的 还 是 不 可 置 信 的 方 法 是 倒

推法。

倒推法(backwardinduction)也 叫 逆 向 归 纳 法。那 么 什 么

是倒推法?

要理解什么是倒推法,先来看一下商界里经常见到的博弈。

在某个城市假定只有一家房地产开发商 A,我们知道任何

没有竞争下的垄断利润是很高的,假定A此时每年的垄断利润

是10亿元。

现在假定有另外一个企业B,准备从事 房 地 产 开 发。面 对

着B要进入其垄断的行业,A想:一旦B进入,A的利润将受损

很多,B最好不要进入。所以A向B表示,你进入的话,我将阻

挠你进入。假定当B进入时A阻挠的话,A的利润降低到2,B

Page 115: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   116  

的利润是-1。而如果A不阻挠的话,A的利润是4,B的利润

也是4。这样一个博弈可用下图表示:

进入

阻挠

A:2;B:-1

不阻挠

A:4;B:4

不进入

A:10;B:0

上图称之为博弈树。由上图可见,这个博弈有两阶段构成。

我们称之为动态博弈,或者两阶段的动态博弈。博弈树是表示

动态博弈的一个好方法。

现在让我们回到房地产开发商之间的博弈问题。A的最好

结局是“B不 进 入”,而B的 最 好 结 局 是“进 入”而 A“不 阻 挠”。

这两个最好的结局不能构成均衡。那么结果是什么呢?

A向B发出威胁:如果你进入,我将阻挠。而对B来说,如

果进入,A真的阻挠的话,它将受损失-1(假定-1是它的机会

成本),当然此时A也有损失。对于B来说,问题是:A的威胁

可置信吗?

B通过分析得出:A的威胁是不可置信的。原因是:当B进

入的时候,A阻挠的收益是2,而不阻挠的收益是4。4>2,理性

人是不会选 择 做 非 理 性 的 事 情 的。也 就 是 说,一 旦B进 入,A

的最好策略是合作,而不是阻挠。因此,通过分析,B选 择 了 进

Page 116: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

117  

第五章

 信息、

言语与行动

入,而A选择了合作。双方的收益各为4。

在这个博弈中,B采 用 的 方 法 为 倒 推 法,或 者 说 逆 向 归 纳

法,即:当参与者作出决策时,他要通过对最后阶段的分析,准确

预测对方的行为,从而确定自己的行为。

在这里,双方必须都是理性的。如果不满足这个条件,就无

法进行分析了。

这个例子只是简单的两阶段博弈,而三阶段或更多阶段的

博弈,可用同样方法加以分析。

在动态博弈中,涉 及“威 胁”与“承 诺”是 不 是 可 信 的 问 题。

静态地看,一博弈存在许多均衡。

上述“进入—阻挠”问题的博弈树可用支付矩阵表示:

AB 进入 不进入

阻挠 (2,-1) (10,0)

不阻挠 (4,4) (10,0)

在这个矩阵中,纳什均衡点有两个:(合作,进入)和(阻挠,

不进入)。我们可以验证,在这两点上谁都不愿意改变策略。然

而(阻挠,不进入)这个均衡是达不到的。因为这是动态博弈,在

这个动态博弈中,存在 着 先 后 策 略 选 择 顺 序。对 于 A来 说,为

了阻止B进入,他发出威胁的信号“如果你进入,我将阻挠”;对

B来说,如果B进入,A真的阻挠,B就 会 有 损 失———这 个 损 失

我们可认为是机会成本或者是对抗成本。然而B想:A的威胁

是可信的吗?即:如 果 我 真 的 进 入,A真 会 阻 挠 吗?此 时B会

这样思考:如果我进入而A阻挠的话,A的损失很大,而不阻挠

Page 117: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   118  

他的损失会小。理性的人是不做不理性的事情的,因此,A的威

胁是不可靠的。

因此,阻挠,不进入的纳什均衡点得以淘汰,在动态博弈中

一个新的均衡———子博弈精练纳什均衡———得以实现。子博弈

精练纳什均衡的定义及分析,归功于另一位诺贝尔经济学奖获

得者塞尔屯(Selton)。

这里分析的是完全且完美信息下的动态博弈。所谓完全信

息是指:博弈的支付函数是“公共知识”(我们在第一部分叙述了

公共知识的含义)。本书中未涉及不完全信息的博弈问题,如囚

徒困境这样的静态博弈也是完全信息博弈。完美信息是针对动

态博弈而言的,指参与者知道博弈的所有历史。

倒推法是动态博弈中有用的工具,它可以说是理性的人自

然的推理方式。然而倒推法面临着一个困难,这就是蜈蚣博弈

的悖论。(参见第六章)

上面我们分析了“威胁”是否可信,下面我们可分析“承诺”

是否可信。“不首先使用核武器”的承诺可信吗?这个承诺是针

对常规战争而言的,即:只要大家都运用常规武器进行战争,那

么承诺者将不首先使用核武器。在常规战争下不涉及国家生死

存亡的时候,这个承诺是可信的。因为如果承诺者首先使用核

武器,将使他国也对它使用核武器,这样一来,它会因首先使用

核武器而带来更大的灾祸。但是,如果在常规战争中某国面临

着被消灭的危险时,它还不首先使用核武器吗?在这种情况下,

使用核武器有可能挽救这个国家,而不使用,则该国肯定灭亡,

即使用的好处大于不使用的好处。因此,这个承诺在一个国家

面临灭亡的时候将是不可信的。

Page 118: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

119  

第五章

 信息、

言语与行动

五、空口声明博弈

在博 弈 论 中 存 在 另 外 一 种 言 语 博 弈,英 文 叫cheeptalk。

cheeptalk可翻译成“空口声明”,它是一口头表态,发话者说出

某些话语无需某些成本,也无须承担某些责任,它不是“威胁”也

不是“承诺”,但发话者说出它是有目的的。听者要分析他话中

的含义,即要分析cheeptalk是真还是假。

如:某人应 聘 某 职 位 时,他 会 说“我 的 能 力 很 高”,这 就 是

cheeptalk。他的目的是为了能应聘得上或者说 是 为 了 获 取 高

工资,他说出这 样 的 话 是 无 需 成 本 的,每 个 应 聘 者 都 可 以 这 么

说。而雇主则要弄清这些应聘者的cheeptalk中哪个是真的哪

个是假。

Page 119: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!明天太阳必然能升起吗"#$$归纳推理的合理性问题

二%归纳的暴力&偷东西的人应该叫小偷吗"三%行动中的两种推理&归纳与演绎

四%酒吧问题与’百花奖(的评选

五%少数者博弈及其应用&股票买卖与交通拥挤问题

六%对称的人群)为什么会出现破缺性的行动"###盲目的学习

博弈中的学习机制问题

第六章

!

Page 120: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

123  

第六章

 博弈中的学习机制问题

一、明天太阳必然能升起吗?

———归纳推理的合理性问题

  人有两种推理方式:一是演绎的,二是归纳的。

由前提真必然地推出结论真就是演绎推理。这是逻辑或传

统逻辑研究的对象。古希腊哲学家亚里士多德确定了三段论推

理形式如:

大前提:所有人皆要死;

小前提:张三是人;

结论:张三要死。

再比如:

大前提:所有的爬行动物是用肺呼吸的。

小前提:蛇是爬行动物。

结论:所以蛇是用肺呼吸的。

只要前提真,推理过程无误,演绎推理的结论就是真的。演

绎推理是由某个普遍性的原理推出某种特殊的结论。这个结论

其内容不会超过前提蕴含的内容。数学就是演绎性的。

不仅有演绎推理,同时还有归纳推理。如:

前提1:张三要死;

前提2:李四要死;

结论:所有人都要死。

又如:

前提1:蛇是用肺呼吸的;

Page 121: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

归纳推理的合理性问题

Page 122: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

125  

第六章

 博弈中的学习机制问题

  前提2:鳄鱼是用肺呼吸的;

结论:所有的爬行动物都是用肺呼吸的。

这种由个别性的真的现象或前提推导出普遍性的结论就是

归纳推理。

归纳出来的普遍性的结论不是必然真的,而是归纳真的,或

者说是“或然真的”,即:结论可能是真的,也可能是假的。

归纳推理是跳跃的,结论的内容超出前提的内容。当然,这

种跳跃性的过程是可质疑的。大哲学家休谟批判人们的归纳没

有合理性,只是人的习惯联想而已。因为没有逻辑的理由来证

明归纳法。

演绎与归纳在人的认识与行动中起着重要作用,哲学家在

研究它们的作用。

人的行动很大一部分建立在归纳推理之上。那么什么是归

纳推理呢?

我们每天看到太阳从东方升起而得出结论说“太阳每天从

东方升起”,我们看到了几只天鹅是白色的,我们说“所有的天鹅

是白色的”。

归纳推理就 是 从 少 数 的 观 测 的 事 例 中 概 括 出 普 遍 性 的 命

题。如果用逻辑 学 的 话 语 说,就 是 从 特 称 命 题 得 出 全 称 命 题。

所谓全称命题 是 指 这 样 的 命 题 形 式:“所 有 的……具 有 某 种 性

质”,而特称命题是指“某某具有什么性质”。当然这是一种不严

格的说法。今天非经典逻辑的归纳逻辑就是研究证据与全称命

题之间的支撑关系的。

从特称命题到全称命题的过程是归纳过程,这个过程中存

在着跳跃。这样的跳跃合理吗?

归纳法是科学家的常用工具,而对归纳法的合理性哲学家

Page 123: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   126  

一直在探讨。培根说过“知识就是力量”,他竭力倡导归纳法,认

为知识的来源是经验。

知识来源于经验,这不容怀疑。然而人们通过经验得出知

识的方法令人怀疑。18世纪英国哲学家休谟认为,归纳法其实

是人的习惯联想。

我们怎么从过去每天观测的太阳从东方升起得出“太阳将

每天从东方升起”的结论?根据休谟的看法,答案只能是习惯联

想。我们以前观测到甲现象出现时,乙现象也出现,当我们以后

看待甲现象时,我们便期待着乙现象出现,并且我们把甲现象称

之为原因,把乙现象称之为结果。然而我们的结论合理吗?甲

与乙之间的所谓因果联系是必然的吗?休谟的回答是否定的。

我们可设想一下:主人每天给猪喂食,当猪看到主人来时,

意味着食物送来了,然而猪不能必然性地得出,主人来必然给它

喂食物。因为,很可能的是,一天主人拎着刀杀它来了。这就是

归纳法的困难。

哲学家无法证明归纳法的绝对合理性,如果要证明,肯定要

引入其他的假定,假定自然是有规律的,但是这样的假设是无法

证明的。

虽然归纳法的合理性存在疑问,但归纳法在科学中的作用

则不可低估———当然这不是我们上面所举的例子中的简单的枚

举归 纳 法,以 至 于 有 人 说,归 纳 法 是 科 学 家 的 荣 耀,哲 学 家 的

耻辱。

尽管 如 此,人 们 在 日 常 生 活 中 也 是 用 归 纳 法 来 生 活、工 作

的,归纳法是很有用的工具。如当我们看到有乌云时,我们会想

到要下雨了,因为以前有这样的现象,然而是否肯定下雨,则难

Page 124: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

主人必然是来喂食吗?

Page 125: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   128  

说,但下雨的概然性大,对我们来说,这就足够了。因此,归纳法

是我们思 维 工 具 箱 中 的 一 个 非 常 有 用 的 工 具,尽 管 不 能 时 时

有效。

归纳法在人的互动行动中作用如何呢?这是我们下面要讨

论的问题。

二、归纳的暴力:偷东西的人应该叫小偷吗?

对事物规则性的归纳得出的结论叫规律,规律以所谓命题

的形式出现———所谓命题即是有真假的句子。命题与事实的关

系是上世纪哲学研究的一个重要内容,上面对归纳法的怀疑是

对得出真命题的方法的怀疑。这里我们不讨论这个问题。我们

来分析人们是如何用归纳法对人的行动进行归纳从而决定自己

的行动的。

在现实中人们经常用归纳法来对人下结论。如果我们看到

某人几次做出同样的错事,我们肯定会认为他的能力有问题;如

果我们看到某人做出几件不好的事情,我们很容易怀疑他的道

德。对他人归纳性的看法会得出对方在同样的情形下会做出同

样的事情的结论,因而我们会制定出自己的策略。但是,我们这

样做往往陷入误区。

不能说偷过东西的人永远会偷东西,因而叫他们是小偷或

贼是不正确的,犯了错误的人不一定永远犯错误。但我们往往

这么思维。我们把偷了东西的人叫小偷的话,那么这种称呼本

身就将他们归类,他们成为另类,这样称呼本身就等于我们用语

言在他们与我们之间划了一条横沟,因而,此时语言成了一种不

Page 126: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

129  

第六章

 博弈中的学习机制问题

道德的暴力。从这一点来讲,我们的语言是不宽容的,或者说我

们的语言存在着问题。

我们这里的讨论带有思辨的特点,然而我们在社会中确实

是这样使用语言和思维的。我们正是通过对认识的人的几次接

触而对他们得出一个结论的,这个结论构成我们对之采取“回应

行动”的基础。这个回应行动包括“友好相处”、“防范对方的侵

犯”、“追求从而成为恋人”、“冷漠”,等等,并根据不同情况将周

边的人分类成:可以成为朋友的、有可能成为敌人的、可以成为

恋人或情人的、没 有 任 何 交 往 的,等 等。这 样 的 归 纳 会 发 生 错

误,随着交往的深入,归纳会发生改变。当然有些归纳因某种现

实的或偶然的原因而永远得不到改变。

一个群体在长时间的交往接触中,分化出各种固定的关系

来,有些成为固定的朋友,有些成为一般的朋友,有些成为永远

的敌人,当然也会出现恋人或爱人,还有一些形同陌路。即一均

衡态出现了:周边的人基本上被定了位,形成了固定的关系。而

这一切从归纳开始,并且在不断的交往中对所归纳的看法给以

改正。这是一个博弈,在这个博弈中存在着一个对周边的人不

断认识的过程,在博弈中称之为学习过程。

三、行动中的两种推理:归纳与演绎

博弈论是研究人的行为的,在博弈论中参与者一方面猜测

其他参与者的策略,同时计算各种策略可能性下的支付(得益)。

然而在实际中,一般情况下,人们是很难计算得益的。此时人们

往往准备了各种备选策略,当其他参与者采取一确定策略时,自

Page 127: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   130  

己将决定采取某种策略。

“人不犯我,我不犯人;人若犯我,我必犯人”。这是毛泽东

的外交方针。一旦别人采取某种策略,如敌人采取侵犯的策略,

根据这个方针,可以推理出“我”将采取“犯”的策略。这就是逻

辑推理与行动之间的关系。

我们经常用逻辑推理的方法来确定自己的行动。

“如果天下雨,我将带伞”,这是我们日常的行动决定;“如果

上证指数跌破1500点,我将大量买进股票”,这是股民的决定,

当然具体的股民的方案是不同的;而外交方面更是靠逻辑推理

来确定自己的行为,如:我国在台湾问题上采取“如果其他国家

和台湾建交,中国政府将强烈抗议并与之断交”的策略。因此,

逻辑推理在社会行动中是确定策略的工具。

其实参与者在计算支付时,也是一样确定自己的策略,即确

定:一旦别人 采 取 什 么 策 略,我 将 采 取 什 么 策 略 更 好———支 付

更大。

“如果天下雨,我将带伞”,“人不犯我,我不犯人;人若犯我,

我必犯人”,这些是行动者制定的行动规则,它们构成行动推论

的大前提。如:

前提1:如果天下雨,我将带伞;

前提2:今天下雨;

结论:我要带伞。

又比如:

前提1:人不犯我,我不犯人;人若犯我,我必犯人。

前提2:张三犯我。

结论:我犯张三。

这两个推理是演绎的。

Page 128: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

131  

第六章

 博弈中的学习机制问题

通过分析,我们看到,在人的行动中演绎推理发挥着重要作

用。因此我们可以认为,逻辑是社会行动的基础。这也是我们

为什么分析社会行动主题的原因。

然而,行动中 逻 辑 推 理 与 认 识 中 的 逻 辑 推 理 的 关 系 如 何?

行动中的演绎推理的结论肯定是真的吗?

在上一部分中我们说了,演绎性推理只要前提是真的,推理

形式正确,结论肯定是真的。我们并没有说,演绎推理分行动的

和认识的两种。所以这个看法在行动的推理中同样正确。

然而人们的行动中的推理前提其正确性如何呢?这是问题

所在。我们认为,人的认识中普遍性的命题是真的,逻辑就是揭

示这些普遍性的命题与个别性结论之间的关系。而人的行动中

的前提是“某种条件下的策略决定”,它为真吗?如果为真的话,

是什么意义上的真?

这就涉及社会行动的本质问题。

首先,决定行动者的行动的前提是真的吗?如:“如果天下

雨,我将带伞”是 真 的 吗?对 于 这 个 命 题,其 真 值 取 决 于“天 下

雨”与“我带伞”两个命题的值的组合,当“天下雨,我没有带伞”,

此时命题就假了。然而天下雨与我带伞之间的联系是由行动者

“我”来规定的。因此我们可以说,前提真是“规定真的”。

当然,这里的“规定的真”不是没有理由的,它是由行动者的

理性与行动结构所决定的,如果是博弈的话,这个结构就是博弈

的结构。一旦行动者的结构给定了,理性的行动者的策略决定

就确定了。

对于日常非博弈的情况,理性的行动者总是最大化自己的

利益而制定策略的。试想一下,下雨时在不带雨伞与带雨伞之

间,行动者会选择后者,如果没有其他方便的避雨的手段的话。

Page 129: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   132  

因为,不带雨伞会使自己淋湿———被淋湿是任何人所不希望的。

四、酒吧问题与“百花奖”的评选

酒吧问 题(barproblem),是 美 国 人 阿 瑟(W.B.Arthur)

1994年在《美国经济评论》发表的《归纳论证 和 有 界 理 性》一 文

中提出的,后来在1999年的著名的《科学》杂志上发表的《复杂

性和经济学》一文中阐述了这个博弈。

阿瑟是斯坦福大学经济学系教授,同时是美国著名的圣塔

菲研究所(SantaFeInstitute)研究人员。他不满意经济学中认

为的,经济主体或行动者(agent)的行动是建立在演绎推理的基

础之上的,而认为其行动是基于归纳的基础之上的。酒吧问题

就是他为了说明这个问题而提出的。

该博弈是说:有一群人,比如总共有100人,每个周末,均要

决定是去一酒吧活动还是呆在家里。酒吧的容量是有限的,比

如空间是有限的或者座位是有限的,如果人去多了,去酒吧的人

会感到不舒服,此时,他们留在家里比去酒吧更舒服。我们假定

酒吧容量是60人,或者说座位是60个,如果某人预测去酒吧的

人数超过60人,他的决定是不去,反之则去。这100人如何做

出去还是不去的决策呢?

假定每个参与者或决策者面临的信息只是以前去酒吧的人

数,每个参与者 只 能 根 据 以 前 去 的 人 数 的 信 息 归 纳 出 策 略 来。

没有其他信息,他们之间更没有信息交流。

这是一个典 型 的 动 态 博 弈 问 题,这 是 一 群 人 之 间 的 博 弈。

如果许多人预测去酒吧的人数多于60,而决定不去,那么,酒吧

Page 130: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

133  

第六章

 博弈中的学习机制问题

的人数将很少,这时候作出这些预测则错了。如果有很大一部

分人预测去酒吧的人数少于60,因而去了酒吧,则去的人很多,

多过60,此时他们的预测也错了。因此一个作出正确的预测的

人应该能知道其他人如何作出预测的。但是在这个问题中每个

人的预测的信息来源是一样的,即都是过去的历史,而每个人不

知道别人如何作出预测,因此,所谓正确预测是没有的。每个人

只能根据以往历史“归纳地”作出预测,而无其他办法。阿瑟教

授提出这个问 题 也 是 强 调 在 实 际 中 归 纳 推 理 与 行 动 之 间 的 重

要性。

因此,对于这样的博弈的参与者来说,问题是他如何才能归

纳出合理的行动策略。

例如,如果前面几周去酒吧的人数如下:

44,76,23,77,45,66,78,22

不同的行动者可作出不同的预测,例如预测:下次的人数将

是前4周的平均数(53),两点的周期环(78),与前面隔一周的相

同(78)。

这样的预测种类会很多。在2000年9月中国科技大学主

办的一个“经济物理学”国际讨论会上,香港中文大学物理系的

许伯铭博士说,他讲了这个问题后,叫研究生回去写出能想到的

策略,研究生写出了400多条策略!

行动者根据这些预测来行动,然而这些预测是归纳性的。

通过计算机的模型实验,阿瑟得出一个有意思的结果:不同

的行动者是根据自己的归纳来行动的,并且,去酒吧人数的数字

没有一个固定的规律,然而,经过一段时间以后,去酒吧的平均

人数很快达到60。即经过一段时间,这个系统中去与不去的人

数之比是60∶40,尽管每个人不会固 定 地 属 于 去 酒 吧 或 不 去 酒

Page 131: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   134  

吧的人群,但这个系统的这个比例是不变的。阿瑟说,预测者自

组织地形成一个生态稳定系统。

这就是酒吧问题。对于下次去酒吧的确定的人数,我们是

无法作出肯定的预测,这是一混沌现象。

首先,混沌系统的行为,是不可预测的。对于酒吧问题,由

于人们根据以往的历史来预测以后去酒吧的人数———我们假定

这个过程是这么进行的,过去的人数历史就很重要,然而过去的

历史可以说是“任意的”,未来就不可能得到一个确定的值。

其次,这是一个非线性过程。所谓非线性的过程是说,系统

未来对初始值有强烈的敏感性。这就是人们常常说的“蝴蝶效

应”:在北京的一只蝴蝶煽动了一下翅膀,美国的华盛顿下了一

场大暴雨。

在酒吧问题中,同样有这样的情况。假如其中一个人对未

来的人数作出了一个预测而决定第n天去还是不去酒吧,他的

行为反映在下次去酒吧的人数上,这个数目对其他人的预测及

第n+1天去和不去的决策造成影响,即第n+1天中去酒吧的

人数中含有他第n天的决策的影响。而他对第n+2天人数的

预测要根据n+1的人数,这样,他第n天的预测及行为给其他

人造成的影响反过来又对他第n+2天的行为造成影响。随着

时间的推移,他的第n天的决策的效应会越积越多,从而使得整

个过程是不可预测的。

人们总是根据过去的经验来归纳从而得出策略,这没有错,

因为人们没有其他办法,在实际生活中人们确实是这样的。我

们在第一节分析过,归纳法在认识中是没有绝对合理性的,即没

有任何 办 法 来 证 明 它。在 人 们 的 行 动 中 归 纳 法 又 是 怎 么 样

的呢?

Page 132: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

135  

第六章

 博弈中的学习机制问题

归纳法在对人的行动的预测中更是没有合理性可言。尽管

有很多预测办法,但没有理由认定其预测是在合理的基础之上

的。现在问题还没有结束。如果说,预测的办法没有合理的基

础,那么存在一个合理的学习机制吗?也就是说,错误的预测不

要紧,但有没有办法改进这个预测,以至于下次能作出更好的预

测?在酒吧问题上,可以说没有这样的一个改进机制。

酒吧问题所反映的是这样一个社会现象,正像阿瑟教授说

的那样,我们在许多行动中,要猜测别人的行动,然而我们没有

更多关于 他 人 的 信 息,我 们 只 有 通 过 分 析 过 去 的 历 史 来 预 测

未来。

生活中有很多例子与这个模型是相同的。比如社会上经常

举行的所谓大众评选活动,如全社会进行的“十佳运动员”评选

活动,电影爱好者的“百花奖”的评选活动。在这些投票过程中,

对于每个投票 者 的 激 励 是:他 如 果“正 确 地”选 中 某 些 人,比 如

“十佳运动员”的评选,不仅要选中10个人,而且顺序也要正确,

那么投票者将获得某种奖励。但是如何才能选中“正确的”人选

呢?有“正确的”人 选 吗? 得 票 多 的 就 是“正 确 的”吗? 严 格 地

说:得票最多的是第一名(比如“十佳运动员”中的第一),得票次

之的是第二名(如“十佳”运动员中的第二名),等等。因此,投票

者能够选中的话,或者说被他提名的能够当选的话,关键是猜测

到别人的想法。猜测对了,你就能获奖;猜测错了,你则不能获

奖。在这里,我们可以看到没有正确与否,或者谁应该选上、谁

不应该选上的问题,而是投票的人相互猜测的结果(在这个过程

中当然舆论的导向作用是很大的,它似乎告诉人们某某人是其

他许多人所要选的)。这个例子与酒吧问题的结构是

Page 133: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

大众评选活动

Page 134: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

137  

第六章

 博弈中的学习机制问题

  一样的,只不过在评选上是一次性的,没有过去的历史让我

们来归纳而已。这明显是博弈问题。另外一个例子是,每年高

校招生或研究生报名都呈现出混沌现象,考生通过各种渠道弄

清以往专业的报名情况,因为一个简单的道理是:如果报名的人

太多,竞争太强,被录取的可能性就低。考生一般根据以往几年

的情况来推测当年报名的情况,然而这会造成不准确预测。当

考生看到以往几年报名的人很多时,他会想下次人还很多,因而

他不敢报名。一旦大多数考生这么想,下次报名的人反而少了;

反之,则又多。这与酒吧问题有一致的结构。

五、少数者博弈及其应用:

股票买卖与交通拥挤问题

  在本书的导言中我们给出了少数者博弈(MinorityGame)

的简单模型:失火时面对两个门,你将如何选择。现在我们来介

绍这个模型。

少数者博弈是改变了形式的酒吧问题,是由一位定居瑞士

的名叫张翼成的中国人在1997年提出的。张教授祖籍河南,科

大毕业后80年代初去了瑞士,现在瑞士的弗莱堡大学(Univer

sityofFribourg)任教。他提出的少数者博弈影响很大,现在很

多物理学家、博弈 论 专 家 研 究 这 个 问 题。比 如,2000年9月 在

中国科技大学召开的“经济物理学高级研讨班及金融复杂性国

际学术讨论会”上许多学者作的报告就是围绕这个问题的。

这个博弈是这样的:

有一群人,比如n人,n为奇 数。这n人 被 告 知,决 定 站 在

Page 135: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   138  

A边或站在B边———在 导 言 中 我 们 是 假 定 失 火 时 逃 生 者 决 定

跑向两个门中的哪个门。如果你选择的是少数人选择的,你就

赢了;反之,就输了。这样的游戏重复进行,参与者努力使自己

赢更多的次数。

当每个人独立地作出决定是跑往A门还是B门时,跑往少

数的那边就赢了。博弈者是根据过去 A或B赢和输的历史记

录作出选择,而过去的记录是公共知识。过去的记录只是跑往

哪一个门赢了,而不像酒吧问题中有具体数字。这样一来,可以

用一个2值序列来表示结果序列:1表示选A,0表示选B,1表

示A赢的一边,0表示B赢的一边。

同时我们假定,参与者分析的能力是有限的,参与者的记忆

空间是有限的。他们只能记住最近的m个结果的历史,并对它

们进行分析以作出决策。这样一来,每个人有一有限的行动策

略———在给定的过去的记录下决定是选A(1)还是选B(0)。如

果人的记忆长度为3(m=3)的话,那么,一个可能的 策 略 如 下

表,在表中记录和决定之间存在确定的关系:

表6-1:一个可能的策略

记录 决定

000 1001 0010 0011 1100 1101 0110 1111 0

   注:决定是根据以往的3个记录来 作 出 的。行 动 者 根 据 这 个 策 略 就

能在不同情况下作出具体决定。如:记 录 为“001”,决 定 为“0”,意 即:当 决

Page 136: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

139  

第六章

 博弈中的学习机制问题

策者观察到最近3次的赢的一边分别是:最近的一次为选A门赢,最近的

第二次为选B门赢,最近的第三次为选B门赢,那么他将选择B门。

表5-1只是某一个行动者可以选取的一个策略。不同的

行动者根据记录有不同的决定方式,这样便有不同的策略。在

这个例子中,记录有8种(2m=8),而每个记录下的决定一发生

变化,就形成一区别的策略,如表5-1是一个可能策略,而当记

录为000,下次可以决定为0,而其他记录下的决定不变,此时构

成一个新的策略。这样,我们可得出,共有256(28)种策略!当

记忆很长时,策 略 便 多 得 惊 人。当 m=5时,策 略 总 数 有225

=655362。

物理学家感兴趣的是一群人(人数为n)的记忆即m相同的

时候,重复这个“逃跑”的游戏,但n、m发生变化的时候,会有什

么样的结果。同时他们也在研究当不同记忆长度的人混合在一

起时,“逃跑”这个游戏,会有什么结果。

当然,不可能真的让人来做这个“逃跑”的游戏。并且也无

法让人来进行这个博弈(比如,无法确定一个人的记忆长度m)。

物理学家是通过计算机模拟的办法来研究这个博弈的,即让计

算机来模拟这个过程,从而找寻其中的规律。

有物理学家用计算机进行数值模拟,人数为101人的群体,

记忆长度分别有m1=3,m2=6,给出的初始的策略为2时,数值

模拟出两个结论:(1)将 记 忆 长 度 长 的 人,即 m2=6的 人,加 入

记忆长度短(m1=3)的 群 体,对 群 体 将 有 改 进,即 有 更 多 的 人

赢;(2)记忆长度长的人(m2=6)有 优 势,即 他 赢 的 机 会 大 于 记

Page 137: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   140  

忆长度短的人(m1=3)。但是这个结论不具有普遍意义。①

少数者博弈可以运用于股票市场。每个股民都在猜测其他

股民的行为而努力与大多数股民不同。如果多数股民处于“卖”

股票的位置,而你处于“买”的位置,股票价格低,你就是赢家;而

当你处于少数的“卖”股票的位置,多数人想“买”股票,那么你持

有的股票价格将上涨,你将获利。而股民采取什么样的策略则

多种多样,而策略的得出完全是根据他们以往的经验归纳出来

的,因而类似于这里的少数者博弈的情况。但是物理学家对少

数者博弈研究的结论能否用来指导股民在股票市场上搏杀,本

人不得而知。

不过本人认为,少数者博弈中一个特殊的结论不具有普遍

意义,即:记忆长度长的人未必一定具有优势,因为,如果确实有

这样的方法的话,在股票市场上,人们利用计算机存储的大量的

股票的历史数据就肯定能够赚到钱了。但是,这样一来,人们将

争抢着去购买存储量大即硬盘空间大以及计算速度快的计算机

了,在实际中人们还没有发现这是一个炒股票必定赢的方法。

交通拥挤问题的模型也是一个少数者博弈的问题。城市的

交通越来越拥挤,选择行车路线也是不断的博弈过程。在交通

高峰期间,司机面临两条路的选择时,往往要选择没有太多车的

路线行走,此时他宁愿多开一段路程而不愿意在塞车的地段焦

急地等待。司机只能根据以往的经验来判断哪条路更好走,而

所有司机都不愿意在塞车的道路上行走。因此每一个司机的选

择必须考虑其他司机的选择。这 也 是 一 个 少 数 者 博 弈 问 题。

① 对该问题有研究兴趣的读 者 可 去 下 列 网 址 查 阅 有 关 资 料:www.unifr.ch/econophysics。

Page 138: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

司机行车的博弈

Page 139: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   142  

  当然在司机行车的少数者博弈问题中,司机经过多次的选

择和学习,许多司机往往能找到规则性,这是以往成功和失败的

经验教训给他的指引,但这不是必然有效的规则性。在这个过

程中,司机的经验和司机个人的性格起作用。有的司机因有更

多的经验而更能躲开塞车的路段;有的司机经验不足,往往不能

有效避开高峰路 段;有 的 司 机 喜 欢 冒 险,宁 愿 选 择 短 距 离 的 路

线;而有的司机因为保守而宁愿选择有较少堵车的较远的路线,

等等。最终的路线的拥挤程度就由不同特点和不同经验的司机

的选择所构成。

六、对称的人群为什么会出现破缺性的行动?

———盲目的学习

  人们拥有的知识是其行动的基础。在上面的酒吧问题中,

每个行动者面对的信息是一样的,但每个人所用的预测方法是

不同的,即他们所归纳出的预测公式是不同的(这也就是为什么

我们说这种归纳没有合理的基础的原因)。然而,尽管如此,对

整体人群来说,平均去酒吧的人数占总人数的60%。对每个人

来讲,他的预测与行动独立于其他人将要作出的选择———因为

假定他们之间没有信息交流。可以这么说,60%两边是对称的。

还有另外一种非对称的情况。我们假定,人们没有足够的

知识以支撑自己的行动。如果对可选择的策略或行动没有任何

知识,此时行动者的行为就会出现盲目性。但是由于人本身具

有学习的天性,快速的学习过程就发生了。让我们看一个例子。

这是一个心理学上的例子:有一群人鱼贯进入一个房间,拿

Page 140: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

143  

第六章

 博弈中的学习机制问题

一瓶饮料喝。在他们面前有多种饮料,假定是3种,房间很黑,

每个人无法通过视觉判定饮料的质量,当然更无法看清品牌,也

就是说,3种饮料给他们呈 现 的 是 同 样 的 视 觉 图 像。此 时 的 选

择会是怎样的结果呢?

通过实验发现,人们会将特别“偏爱”一种饮料,即几乎所有

人都选择一种饮料,而不是3种饮料平均被选取。这里他们所

“偏爱”的并非是特定的,在不同的人群中做同样的实验,出现的

情况是一样的,只 不 过 每 一 次 被 大 多 数 人 选 取 的 饮 料 会 不 同。

此时被选取的饮料具有非对称性。

按通常的情况,假定饮料给每个人呈现同样的视觉图像,人

群会出现对称性选择,即每个人会在所给定的几种饮料中随机

选取。而 由 于 群 体 的 存 在,即 使 不 同 的 人 对 某 种 颜 色 有 偏

爱———我们假定人们可看到颜色,每个人的偏爱也会被抵消掉。

对群体来说,每种饮料被选取的可能性是一样的。

出现选择的非对称性完全是由于人们的选择行动之间的相

互作用。其实这是微妙的,同时是不合理的学习过程。第一个

人选取饮料可以说是随机的,在备选的几种饮料中选取完全是

任意的,但是接着的人对饮料的选取则不是任意的。由于看到

第一个人选择了某种饮料,他会认为第一个人的选取是有根据

的,从而也会选择第一个人所选取的饮料。后面的人也会这样

想。于是第一个人对某种饮料的选取会传递下去,并且这个过

程中越到后面的人越有理由相信选择该种饮料是有根据的。这

就是为什么所有的人都倾向于选择一种饮料。

这就是为什么出现非对称的选择结果了。这种传递不是通

过语言,而是通过对前面人的选择行动的观察。这 是 一 个 学 习

Page 141: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

盲目的学习

Page 142: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

145  

第六章

 博弈中的学习机制问题

过程,并且是一个没有理由的学习过程,也就是说这样的学习过

程是没有根据的。

这个心理学上的实验。反映了人们之间互动的情况。这个

盲目的 跟 随 现 象 或 者 说 盲 目 的 学 习 现 象 在 现 实 生 活 中 处 处

可见。

Page 143: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!蜈蚣博弈的悖论

二!最后通牒博弈中理性的困境

三!陈水扁上台与民主选举的不可根除的缺陷

四!通过民主的方式能使少数人支持的候选人赢吗"五!投票悖论与阿罗不可能性定理

六!革命#另外一种投票方式

理性的界限

第七章

!

Page 144: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

149  

第七章

 理性的界限

一、蜈蚣博弈的悖论

倒推法是分析完全且完美信息下的动态博弈的有用工具,

在第四章我们分析言语博弈中“威胁”或“承诺”是否可信时,已

给出了一个 倒 推 法 例 子。我 们 看 到,倒 推 法 符 合 我 们 的 直 觉。

然而,通过下面的蜈蚣博弈的悖论,我们将看到倒推法存在致命

的缺陷。

蜈蚣博弈是 由 罗 森 塞 尔(Rosenthal)提 出 的。它 是 这 样 一

个博弈:两个参与者 A、B轮流进行策略选择,可供选择的策略

有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接

着是A,如此交替进行。A、B之间的博弈次数为有 限 次,比 如

100次。假定这个博弈各自的支付给定如下:

   合作   合作      合作   合作   → →A B A…… → →A B (100,100)  背叛 背叛 背叛 背叛 (1,1)  (0,3) (2,2) (99,99) (98,101)

现在的问题是:A、B是如何进行策略选择的?

这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。

这个博弈的奇特 之 处 是:当 A决 策 时,他 考 虑 博 弈 的 最 后

一步即第100步;B在“合作”和“背叛”之间作出选择时,因“合

作”给B带来100的收益,而“不合作”带来101的收益,根据理

性人的假定,B会选择“背叛”。但是,要经过第99步才到第100

步,在99步,A考虑到B在100步时会选择“背叛”———此时A

Page 145: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   150  

的收益是98,小于B合作时的100,那么在第99步时,他的最优

策略是“背叛”———因为“背叛”的收益99大于“合作”的收益98

……如此 推 论 下 去,最 后 的 结 论 是:在 第 一 步 A将 选 择“不 合

作”,此时各自的收益为1,远远小于大家都采 取“合 作”策 略 时

的收益:A:100,B:100-99。

根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法

是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取

不合作的策略获取的收益只能为1,而 采 取 合 作 性 策 略 有 可 能

获取的收益为100。当然,A一 开 始 采 取 合 作 性 策 略 的 收 益 有

可能为0,但1或者0与100相比实在是太小了。直觉告诉我们

采取合作策略是好的。而从逻辑的角度看,一开始A应取不合

作的策略。我们不禁要问:是倒推法错了,还是直觉错了?

这就是蜈蚣博弈的悖论。

什么是悖论?悖论(paradox)来源于希腊语,para意即“超

越”,doxos的意思是“相信”。Paradox的意思是:本来可以相信

的东西不能相信,而有的东西看起来不可信但是反而是正确的。

悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一

类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝

诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖

论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发

师悖论或罗素悖论,等等。这些悖论在历史上对于逻辑和数学

的发展起了巨大的作用。

对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方

有研究博弈论的专家做过实验[目前通过实验验证集体的交互

行为已成时尚,正 如 博 弈 论 专 家 英 国 的 宾 莫(KenBinmore)所

言,诺贝尔奖也无疑在考虑这方面的先驱者],实验发现,不会出

Page 146: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

151  

第七章

 理性的界限

现一开始选择“不合作”策略而双方获得收益1的情况。双方会

自动选择合作性策略,从而走向合作。这种做法违反倒推法,但

实际上双方这样做,要好于一开始A就采取不合作的策略。

倒推法似乎是不正确的。然而,我们会发现,即使双方开始

能走向合作,即双方均采取合作策略,这种合作也不会坚持到最

后一步。理性的人出于自身利益的考虑,肯定在某一步采取不

合作策略。倒推法肯定在某一步要起作用。只要倒推法在起作

用,合作便不能进行下去。

这个悖论在现实中的对应情形是,参与者不会在开始时确

定他的策 略 为“不 合 作”,但 他 难 以 确 定 在 何 处 采 取“不 合 作”

策略。

二、最后通牒博弈中理性的困境

有这样一个博弈:

两人分一笔总量固定的钱,比如100元。方法是:一人提出

方案,另外一人表决。如果表决的人同意,那么就按提出的方案

来分;如果不同意的话,两人将一无所得。比如A提方案,B表

决。如果A提的方案是70∶30,即A得70元,B得30元。如果

B接受,则A得70元,B得30元;如果B不同意,则两人将什么

都得不到。

A提方案时要猜 测B的 反 应,A会 这 样 想:根 据 理 性 人 的

假定,A无论提出什么方案给B———除了 将 所 有100元 留 给 自

己而一点不给B留这样极端的情况,B只有接受,因为B接受了

还有所得,而 不 接 受 将 一 无 所 获———当 然 此 时 A 也 将 一 无 所

Page 147: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   152  

获。此时理性的A的方案可以是:留给B一点点比如1分钱,

而将99.99元归为己有,即方案是:99.99∶0.01。B接受了还会

有0.01元,而不接受,将什么也没有。

这是根据理 性 人 的 假 定 的 结 果,而 实 际 则 不 是 这 个 结 果。

英国博弈论专家宾莫做了实验,发现提方案者倾向于提50∶50,

而接受者 会 倾 向 于:如 果 给 他 的 少 于30%,他 将 拒 绝;多 于

30%,则不拒绝。

这个博弈反映的是“人是理性的”这样的假定在某些时候存

在着与实际不符的情况。

理论的假定与实际不符的另外一个例子是“彩票问题”。

我们说理性的人是使自己的效益最大,如果在信息不完全

的情况下则是使自己的期望效益最大。但是这难以解释现实中

人们购买彩票的现象。

人们 愿 意 掏 少 量 的 钱 去 买 彩 票,如 买 福 利 彩 票、体 育 彩 票

等,以博取高额的回报。在这样的过程中,人们自己的选择理性

发挥不出来,而惟有靠运气。在这个博弈中,人们要在决定购买

彩票还是决定不买彩票之间进行选择,根据理性人的假定,选择

不买彩票是理性的,而选择买彩票是不理性的。

彩票的命中率肯定低,并且命中率与命中所得相乘肯定低

于购买的付出,因为彩票的发行者早已计算过了,他们通过发行

彩票将获得高额回报,他们肯定赢。在这样的博弈中,彩票购买

者是不理性的:他未使自己的期望效益最大。但在社会上有各

种各样的彩票存在,也有大量的人来购买。可见,理性人的假定

是不符合实际情况的。

当然我们可以给出这样一个解释:现实中人的理性的计算

Page 148: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

买彩票的博弈

Page 149: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   154  

能力往往用在 不 符 合 实 际 情 况 的“高 效 用”问 题 上,而 在“低 效

用”问题上,理性往往失去作用,对于人来说,存在着“低效用的

区决策陷阱”。在购买彩票问题上,付出少量的金钱给购买者带

来的损失不大,损失的效用几乎为零,而所能命中的期望也几乎

是零,这时候,影响人抉择的是非理性的因素。比如,考虑到如

果自己运气好的话,可以获得高回报,这样可以给自己带来更大

的效用,等等。彩票发行者正是利用人存在着“低效用区的决策

陷阱”而寻求保证赚钱的获利途径。

三、陈水扁上台与民主选举的

不可根除的缺陷

  蜈蚣博弈的悖论反映了单个参与者博弈的困难,个体难以

在“利己”和“利他”之间找到一个合理的策略。蜈蚣博弈悖论是

单个决策者的决策悖论,它反映了个体理性的局限。

在集体进行 决 策 时 同 样 也 面 临 着 理 性 的 局 限。2000年 台

湾所谓“总统”选举可以说是中国发生的一件大事。对于中国大

陆来说,谁来做台湾新的领导人意味着台湾的未来走向,即:独

立还是统一。而对于台湾人民,新的领导人的未来政策意味着

给他们带来灾难还是福祉。

选举的结果是民进党的陈水扁上台,陈水扁成了台湾第一

任“民选总统”,国民党自1949年逃到台湾51年后,终于交出了

政权。现在大家不禁要问:作为台湾第一大党的国民党为什么

输给了弱 小 的 民 进 党? 陈 水 扁 上 台 真 的 意 味 着 台 湾 的“民

意”吗?

Page 150: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

155  

第七章

 理性的界限

大家知道,这次选举的结果是李登辉“弃连保扁”的阴谋得

逞。李登辉是国民党主席,国民党跑到台湾,其政治主张是一个

中国,长期抱着反攻大陆的思想。随着共产党在大陆的渐渐强

大,国民党认识到反攻大陆是不可能的,然而有大陆情结的国民

党虽然与共产党势不两立,一山不能容纳二虎,但因其坚持“一

个中国”的立场,所以国民党执政期间,不存在台独泛滥问题。

然而到了李登辉时代,情形发生了变化,在国民党内部分裂

成主张统一的“统一派”和主张独立的“独派”。骨子里主张台独

的李登辉,由于是国民党主席,无法施展他内心的政治主张。他

只能从所谓理论上“论证”台湾与大陆的不同、台湾独立的合理

性,这就是臭名昭著的“两国论”、“七国论”。在理论上他要阐述

他的“政治思想”,以成为台湾所谓的“国父”;在行动上他找到了

与他内心政治主张一致的人,这就是主张台湾独立的民进党主

席陈水扁。因而作为国民党主席的李登辉,在实际行动上支持

陈水扁。

可以说,国民党被李登辉“玩残”,他真独立的主张使国民党

发生分裂。主张统一的宋楚瑜被李登辉开除出党。宋楚瑜原来

是李登辉政治上坚强的合作伙伴,因为他的资历,他得到大批的

国民党党员的拥护。李登辉与宋楚瑜分道扬镳使得宋楚瑜另立

山头,成立了新党。国民党被李登辉肢解。

此次台湾选举 是 所 谓 的“民 主 选 举”,各 党 派“平 等 竞 争”。

从理论上讲,弱小的党派获得选举胜利可能吗?我们将在下一

节从理论上简单地阐述这是可能的,但是需要一定的条件。我

们先来看一下陈水扁是如何上台的。

李登辉推出连战作为国民党的“总统”候选人,但是身为国

民党主席却在不同场合下支持陈水扁,使得民进党得以快速发

Page 151: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

总统上台

Page 152: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

157  

第七章

 理性的界限

展。“总统”的竞争最后在宋楚瑜、陈水扁、连战以 及 独 立 候 选

人李敖四者之间角逐。最后,陈水扁以微弱优势获胜,而宋楚瑜

和连战均告失败。

大家想一想,如果李登辉不耍“弃连保扁”的政治伎俩,或者

维护国民党的统一而不使其分裂,使得国民党只有一人参加竞

选,那么支持宋楚瑜加上连战的总票数肯定超过陈水扁。

另外一种情况是,假如台湾选举不是直选,选举规则是先角

逐出两个而不是多个候选人,然后再在这两个候选人之间进行

竞选,会出现什么结果呢?我们可以看一下,假定陈水扁能顺利

过第一关而成为两个候选人之一,而宋楚瑜、连战有一个成为候

选人,假定是连战,在连战与陈水扁之间的最后角逐中,支持宋

楚瑜的选民这次会支持连战———因他们的政治主张相近,那么

连战获胜的机会肯定大于陈水扁。但是事实上不是这样,选举

中各候选人同时竞选,国民党因分裂而使陈水扁得以上台。

现在我们来 看 一 下 中 国 申 办2000年 奥 运 会 失 败 的 例 子。

北京1992年开始大张旗鼓地申请主办2000年奥运会的工作。

申办奥运会的投票规则是逐步淘汰制,具有投票权的委员在参

加申请的城市里进行投票,得票最少的城市便被淘汰。前两轮

投票中北京一直领先。经过两轮投票,最后剩下3家:德国的柏

林、澳大利亚的悉尼以及中国的北京。在第三轮投票时,北京获

得最多的票,悉尼第二,柏林第三。

这一轮投票结束后,柏林被淘汰掉。如果就这一次投票,北

京就获胜。但问题是还得再投一次票。当在北京与悉尼之间角

逐时,北京肯定会再次获得胜利吗?

事实是,北京输了,悉尼获得了举办2000年奥运会的主办

权。为什么会这样?原来支持柏林的投票人大多数转而支持悉

Page 153: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   158  

尼。这就是悉尼获胜的原因。

由此看来,民主投票不能得出惟一的结果,其选举结果取决

于民主投票的程序安排以及每次确定的候选人的多少,即投票

规则。不同的投票规则将得出不同的选举结果。这就是说,民

主投票有内在的缺陷。我们将用著名经济学家阿罗提出的“不

可能性定理”来说明,民主制度存在着缺陷。

四、通过民主的方式能使少数人

支持的候选人赢吗?

  读者会问,能不能通过所谓民主选举而得出任意结果呢?

可以这样说:假定一次性选举时所有人都选某一个人,那么

在任何的选举规则下,即通过任何的选举(无论独裁的还是不同

民主规则下的选举),这个人肯定当选。在这种极端情况下,无

论什么制度对选举人都一样,独裁制度也会得出这个结果。当

然如果所有人都不选某一个人,什么制度的设计也都一样,无论

是民主的还是独裁的都会得出同样的结果,并且无论设计什么

样的规则,结果都一样。这就是为什么历史上的独裁者认为,他

是人民的代表,他的决定代表着民意,因为代表着民意意味着你

们对所有的决定不要再表达自己的意见了,我的意见就是你们

的意见,即使通过民主的方式,也是同样的结果。这就是独裁者

经常强奸民意的理论根据。

而当人们的偏好不同时,民主选举程序的规则设计就极大

地影响着选举结果。

我们举一个例子。一由n人组成的社会,假定n取300,对

Page 154: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

159  

第七章

 理性的界限

候选人A、B进行选举,并假定进行一次性投票,此时有2/3的

人反对A而选举B,1/3的人选A而不选B。我们有没有办法

设计一个结构,通过“民主的”投票规则使A能够当选呢?我们

说这是可能的。

假定大家都同意服从大多数原则,但程序可以商量。我们

把这300人构成3组———这3组既可以天然地形成,也可以设

计。每组中候选人获得该组的大多数选票,他就赢得这组的选

举,3组中赢得2组 即 赢 得 大 多 数,就 算 赢 了。我 想,在 实 际 中

这些是任何候选人都能同意的,并且也认为是公平的。我们假

定每组的人数不是一样的:第一组是50人,第二组是100人,第

三组是150人———我们这里人数的确定完全是随意的。假定第

一组中有30人赞成A而反对B,第二组中有60人赞成A而反

对B,第三组中10人赞成A而反对B。即:第一组A与B的比

例是:30∶20;第二组A与B的比例是:60∶40;第三组A与B

的比例是:10∶140。

在这样一种规则下进行投票,A获得了3组中2组的赞成

票。A获胜。

在这个例子中,如果不分组就选一次,那么B肯定获胜。

这个例子中,使B获胜的是直选机制,使A获胜的是间接

选举机制。台湾采取的是前者,美国采取的是后者。

布坎南在《同 意 的 计 算》①中 举 了 另 外 一 个 例 子。一 个25

个人组成的社会,只需要9个人同意某个议案就可使得它通过。

具体地说,可以将这25个人分成5个区,每个区5个人,这样,

① 布坎南,塔洛 克:《同 意 的 计 算》,中 国 社 会 科 学 出 版 社,2000年

版,第242页。

Page 155: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   160  

只要有3个区(5个 区 中 的 多 数)中 的 多 数 同 意,即 每 个 区 有3

个人同意就能使一项议案通过。

具体地,我们可将25个人分成A、B、C、D、E共5个区。同

意者分在A、B、C三区,见下表。

A B C D E

这完全可以在“大多数”原则下使一项议案得到通过,尽管

可以有16人不同意。如果是36961人(199×199)的一个社会,

只需10000人就可使一项议案获得通过,只比总数的1/4多一

些,而无须多于1/2的人同意。即用此方法对两个候选人或候

选议案进行选举或进行表决,可以使其中本来获得少数人同意

的当选。

这说明民主选举有其局限性,但并不是说民主选举是虚伪

的和带欺骗性的,当然更不能构成不进行民主选举的理由。正

如有一篇讨论民主与丑闻的文章里说的那样,民主选举不是绝

对好的,但反民主绝对是坏的。在民主社会里,罪恶被最大限度

地暴露出来,并受到谴责,因此抑制了更多的罪恶;而在反民主

的社会里,罪恶被最大限度地掩盖起来,于是往往导致更大的罪

恶。斯塔尔法官对克林顿与莱温斯基的性丑闻穷追不舍,克林

顿为此不得不在电视上公开道歉。总统没有绝对的权力,他也

有服软的时候。

Page 156: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

民主与丑闻

Page 157: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   162  

  选举是揭示群体偏好的一种方法,我们这里要说的是,一群

体进行的所谓民主选举并不能客观地揭示一群体成员的偏好。

五、投票悖论与阿罗不可能性定理

在对陈水扁当选的分析中,我们可看到民主选举的结果取

决于规则与程 序。对 人 的 偏 好 的 揭 示 是 福 利 经 济 学 研 究 的 对

象,而著名经济学家阿罗提出的著名的阿罗不可能性定理,对人

与人组成的社会的内在结构作了深刻的揭示。

假定A、B、C共3个人晚上要一起活动,但对进行什么样的

活动要投票 表 决,有3个 方 案:M(聊 天)、N(看 电 影)、K(跳

舞)。对于这3个活动,A的喜欢顺序是 M>N>K,B的偏好顺

序是N>K>M,而C的顺序是K>M>N。

假定3个人先是在 M(聊天)与N(看电影)之间进行表决,

那么结果因A和C对 M(聊 天)比 对 N(看 电 影)有 更 多 偏 好,

即:M>N,M(聊天)以2∶1获胜。

接着他们在N(看电影)与K(跳舞)之间进行表决,因A和

B对N(看电影)的偏好均比K(跳舞)要大,即N>K。N(看电

影)以2∶1获胜。现在的问题是,既然 M>N,N>K,是不是 M

>K呢?

不是!

我们在 M (聊天)与K(跳舞)之间进行表决,结果是:K(跳

舞)> M (聊天),即K(跳舞)获胜。

3个人通过 投 票,采 取 大 多 数 原 则,但 得 出 的 结 果 却 是 矛

盾的。

Page 158: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

163  

第七章

 理性的界限

A、B、C三人的偏好次序如下表:

偏 好 顺 序

人A B C

1 M N K

2 N K M

3 K M N

这个例子反映的道理是深刻的。如果是社会对几个方案进

行表决,如国家选举总统、某个城市让市民决定先修建哪个公共

事业 工 程,等 等,这 个 例 子 说 明,社 会 投 票 很 可 能 得 出 矛 盾 的

结果。

这个问题被 称 之 为 阿 罗 问 题,即 投 票 悖 论 或 者 循 环 投 票。

200多年前 法 国 的 孔 多 塞 侯 爵 就 发 现,过 半 数 的 规 则 会 导 致

悖论。

对于社会的选择问题,阿罗认为,在非独裁的情况下,不存

在任何加总社会个体成员偏好的方法。

所谓加总社会偏好即找到一个社会偏好函数,阿罗提出了

这样的函数要满足4条公设:第一,定义域不受限制,即适合所

有的个人的偏好类型;第二,非独裁,即社会偏好不以一个人或

少数人的偏好来决定;第三,帕累托原则,即所有人的偏好都认

为a优于b,那么社会偏好也是a优于b;第四,独立性,即不管

个人对除了a与b的其他的偏好顺序发生什么变化,只要所有

个人对a与b的偏好不变,那么社会对a与b的偏好不变。

这4条公设是基本的,或者自明的。但是,阿罗论证了不存

Page 159: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   164  

在这样的社会 福 利 函 数。我 们 设 计 出 来 的 揭 示 偏 好 的 选 举 方

法,其结果不 具 有 传 递 性,从 而 会 产 生 矛 盾。我 们 在 数 学 中 的

“大于(>)”的关系是具有传递性的:如果a>b,并且b>c,那么

a>c。如果社会选举的结果是“a优于b”,“b优于c”并且“a优

于c”,那么社会偏好就是满足传递性的,但事实上,在非独裁的

情况下我们往往做不到。这就是阿罗不可能性定理的意思。

阿罗定理指的是,社会没有一种客观地反映群体的社会偏

好的方法。如果某种偏好得以反映出来,如台湾陈水扁当选“总

统”,或者小布什而不是戈尔当选美国第53任总统,那完全取决

于所确定的“民主”的选举规则。另外一套规则得出的完全可能

是另外一种结果。

戈尔比小布什多几十万张选票,然而美国实行的投票人制

度是,谁获得了某一州的多数票,那么他就获得该州所分配的选

举人的选票,小布什与戈尔之争的关键是佛罗里达州的选举结

果,小布什获胜就在于他以微弱优势获得了佛罗里达州的25张

选举人票。最后,小 布 什 与 戈 尔 的 选 票 之 比 为277∶266。小 布

什获胜。

你会说,通过一次性投票来决定谁当选,即对候选人或候选

方案进行一次性表决,这应该是合理的。但是,这很有可能让选

民最不喜欢的人或方案当选。

举一个例子。假定有4个候选人,他们是 A、B、C、D,假定

有26%的 人“最 喜 欢”A,各 有25%的 人“最 喜 欢”B和 C,有

24%的人“最喜欢”D。现 在 进 行 一 次 性 投 票,A当 选。而 很 有

可能的是“最喜欢”B、C、D的那些人“最不喜欢”A,即:“最不喜

欢”A的人有74%!在这种规则下,最 多 人“最 不 喜 欢”的 候 选

人当选了!这样的规则合理吗?很有可能的是,台湾的陈水扁

Page 160: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

165  

第七章

 理性的界限

就是这里的A。

如果有一种确定了的规则,并且候选人的竞选纲领在选民

心里得到确切的定位,即每个选民对不同的候选人确定了其偏

好程度,那么结果是确定的。而为什么不同的候选人同意同样

的规则呢?因为,每个候选人总会尽量以其竞选纲领及个人魅

力赢得选民的偏好。这里有一个真理:假如你的竞选纲领及个

人魅力赢得了所有的选民,即对所有选民进行偏好排序,你都是

在最前面的,那么在任何选举规则下你都会被选中。同样,如果

你永远排在最后面,那么无论什么规则,你都不会选中。这一点

可以用数学证明。

同时,候选人接纳某种民主的选举规则而参与竞选,是因为

他无法预先知道每个选民的偏好。民主的选举是人们以此来揭

示选民的心理排序情形的方法。阿罗不可能性定理正说明了人

的有限理性的悖论。

此外,阿罗定理说的是,社会的选择方法不可能既是有效率

的,又是民主的。因为循环投票本身就是无效率的,而有效率的

方式必须是独裁的。这就再次揭示了民主和效率的矛盾。当然

也有可能是,有效率的独裁方式能够揭示民意———当独裁者和

所有的臣民想法相同,但是现实中怎么知道臣民的偏好呢?除

非他是上帝,否则揭示臣民的偏好必须通过某种方式,即通过民

主的程序来进行。这就是为什么中国的封建统治者常常以上天

的儿子即“天子”自居。

Page 161: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   166  

六、革命:另外一种投票方式

投票是加总社会中各个人偏好的一种方式。我们已说明,

无论哪种投票制度都是不完善的,之所以采用是因为对所有的

候选人来说是公平的。对于群体选择,或者表达群体偏好,还存

在另外的方法———革命,或者如毛泽东所说的“枪杆子里面出政

权”。革命是极端的投票方式。

一个合理的社会将不断地调整社会财富的分配,如所得税

率实行低收入低 征 乃 至 于 不 征,高 收 入 按 高 比 率 征 收 的 方 法。

当财富集中在少数人手里时,两极分化严重,社会出现极度的不

公正,对一社会来说隐藏着巨大的社会危机。危机意味着革命

的发生。

什么是革命?革命是政治学范畴,如果从经济学范畴来说,

革命就是社会 财 富 的 再 分 配。在 经 济 学 里 有 边 际 效 用 递 减 规

律。所谓效用是指物品对人的需要或欲望的满足程度,而边际

效用指的是消费者在消费物品时所消费的每一单位物品给他的

满足程度。比如:某 人 一 顿 吃 了3碗 饭,每 一 碗 饭 给 他 一 个 效

用;一富豪买了一辆奔驰车后又买了第二辆奔驰车,他买第一辆

奔驰车和第二辆奔驰车时的满足程度是不同的。这就是边际效

用的概念。

边际效用递减规律说的是,消费者在消费物品时,每一单位

物品对消费者的效用是不同的,它们呈递减关系。无论是饿着

肚子的人还是饱食终日的人,第一碗饭给他的效用最大,第二碗

饭则没有那么大的效用了,吃到一定程度后,再吃的话,饭给他

Page 162: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

167  

第七章

 理性的界限

的效用是负的,即不仅不能给他好处,反而是负担。对买车的人

也一样,当他买了第一辆奔驰车时,他感到方便很多,同时有巨

大的心理满足感。当他买第二辆奔驰车时,他不能同时用两辆

车,这第二辆车给他的方便及满足感会没有第一辆车大。当然

第二辆车会体现他的成功,从而增加他的炫耀资本,此时总的效

用是增加的,但增加的幅度没有他买第一辆车时增加的幅度大。

如果他继续购买车,他想,买了车后,既要雇司机,又要准备停车

的车库,同时要防范窃贼的光顾,等等,会感觉到得不偿失。这

第三辆车给他带来的效用更低了。

可以这么认为,边际效用递减规律是关于人的规律,正如诺

贝尔奖获得者 H.西 蒙 提 出 的 关 于 人 的 理 性 是 有 限 的 看 法,它

们均为关于人的假设。

人的边际效用是递减的,那么将财富从富人那里部分地转

移到穷人那里似乎是合理的,此时富人的效用减少了,但减少得

不多,但穷人增加的效用则很大。如果一个社会贫富悬殊过大,

政府又没有调节好贫富之间的关系,那么革命就有可能发生。

劫富济贫从来就是不合法但被颂扬的行为,因为它增进了

大多数人的效用,在政府无力的时候,这是惟一的增进社会总的

效用的方式。抢夺富人接济穷人,或者因生活潦倒、无法生存而

去抢夺富人的东西以活命,同样增进社会的效用。当然,抢劫穷

人的物品来为自己享用是土匪行径,这种行为是可耻的。

从这个意义上说,革命就是多数人通过暴力对少数人的财

富进行剥夺和再分配,因此它是一种偏好的表达方式,是非和平

的方式,而不像投票那样的和平方式。之所以要采取暴力的方

式,是因为,一般情况下,理性的财富拥有者是不会自动地将财

富分给穷人的,慈善者除外。

Page 163: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

革命:另外一种投票方式

Page 164: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

169  

第七章

 理性的界限

  革命不同于民主的选举方式和民主化的决策方式,革命是

非理性的。如果一个社会有合理地表达人民意愿(或偏好)的程

序或方法,那么革命就不会发生。但是正如我们上面说的那样,

由于不可能有一种绝对合理的民主决策方式,任何决策方式本

身都只是一种在某种程度上揭示偏好的方法而已。因此,任何

社会都不能排除革命的可能。

在民主社会里人民的偏好得到一定程度的表达,发生革命

的概率较低。一般情况下,革命不是发生在专制社会里,就是发

生在前民主的社会里,前者完全没有表达人民意愿的机会,后者

表达人民意愿的机制尚不完善。一个完善的社会制度存在一个

渐进完善的机制,可以在某种程度上化解革命的发生,这样才能

避免社会震荡。

中国古代的朝代更替就是震荡式的。专制社会没有人民表

达意愿的机会,再加上“家天下”的政治机制不存在“退出”机制,

人民只能以激烈的方式来表达自己的意愿。

因此,对 于 社 会 来 说,关 键 不 在 于 它 现 在 的 体 制 多 么 不 完

善、政治架构多 么 不 合 理,而 在 于 它 是 否 有 一 个 合 理 改 进 的 机

制,从而使得制度渐进合理。

Page 165: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!哈定悲剧

二!中国北方草原荒漠化的问题

三!发展经济与对自然的破坏

四!光天化日之下的违法行为为什么总能成功"

!

集体行动的悲剧

第八章

Page 166: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

173  

第八章

 集体行动的悲剧

一、哈定悲剧

在人类社会中存在群体行动的悲剧。这种悲剧是群体的而

非个人的,不是个人命运遭受的不公平对待,而是群体在行动过

程中所遭受的不可避免的集体性灾难。

什么是悲剧?著名哲学家怀特海在《科学与近代世界》一书

中描述希腊戏剧时说:“悲剧的本质并不是不幸,而是事物无情

活动的严肃性。但这种命运的必然性,只有通过人生中真实的

不幸遭遇才能说明。因为只有通过这些剧情才能说明逃避是无

用的。”群体行动的悲剧也是这样:它不是群体偶然性的不幸,而

是具有必然性,每个人都意识到这种悲剧,但无法摆脱。

说群体悲剧是群体遭受的难以抗拒的灾难,一定程度上指

群体受一个无情法则的支配。一定意义上,这种悲剧是社会的

规律造成的———当然我们这里使用规律一词是比较危险的,因

为规律意味着与人的自由相对抗,人绝对不可避免,然而我们在

第9章将 分 析,人 类 的 文 化 或 文 明 正 是 对 不 可 抗 拒 的 悲 剧 的

抵抗。

让我们看一下著名的公共资源悲剧问题,即哈定悲剧。该

问题是经济学中的经典问题,也是博弈论教科书中必定要讨论

的问题。

公共资源悲剧最初由哈定提出。哈定(GarritHadin)1968

年在《科学》杂志上发表了一篇文章,题 为 TheTragedyofthe

Commons。北京大学的张维迎教授将之译成《公共地悲剧》,但

哈定那里的thecommons不仅仅指公共的土地,而且指公共的

Page 167: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   174  

水域、空间等等;武汉大学的朱志方教授将TheTragedyofthe

Commons译成《大锅饭悲剧》,有一定的道理,但也不完全切合

哈定所表达 的 意 思。将thecommons译 成“公 共 资 源”似 乎 更

确切些。哈定描述的TheTragedyoftheCommons,我们可称

为哈定悲剧。

哈定举了这样一个具体事例:一群牧民面对向他们开放的

草地,每一个牧民都想多养一头牛,因为多养一头牛增加的收益

大于其购养成本,是合算的,尽管因平均草量下降,可能使整个

牧区的牛的单位收益下降。每个牧民都可能多增加一头牛,草

地将可能被过度放牧,从而不能满足牛的食量,致使所有牧民的

牛均饿死。这就是公共资源的悲剧。

对公共资源的悲剧有许多解决办法,哈定说,我们可以将之

卖掉,使之成为私有财产;可以作为公共财产保留,但准许进入,

这种准许可以以多种方式来进行。哈定说,这些意见均合理,也

均有可反驳的地方,“但是我们必须选择,否则我们就等于认同

了公共地的毁灭,我们只能在国家公园里回忆它们。”

哈定说,像公共草地、人口过度增长、武器竞赛这样的困境

“没有技术的解决途径”,所谓技术解决途径,是指“仅在自然科

学中的技术的变化,而很少要求或不要求人类价值或道德观念

的转变”。

对公共资源悲剧的防止有两种办法:一是制度上的,即建立

中心化 的 权 力 机 构,无 论 这 种 权 力 机 构 是 公 共 的 还 是 私 人

的———私人对公共地的拥有即处置便是在使用权力;第二种便

是道德约束,道德约束与非中心化的奖惩联系在一起。

在实际中也许可以避免这种悲剧。当悲剧未发生时,如果

建立起来一套价值观或者一个中心化的权力机构,这 种 权 力 机

Page 168: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

哈定悲剧

Page 169: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   176  

构可以通过牧牛成本控制数量或采取其他办法控制数量。

二、中国北方草原荒漠化的问题

据中央电视台的新闻报道,2001年新年的第一天,北 京 市

和银川市发生沙尘现象,沙尘像雾一样笼罩在这两个城市的上

空。生态警钟再次敲响。

河北境内的沙漠直逼北京,河北的怀来县离北京只有60公

里!专家预测,如不想出有效办法对沙漠进行治理,过不了多长

时间,北京将消失,被沙漠掩盖,像消失的楼兰文明。

土地荒漠化是中国重大的生态问题。中国土地的荒漠化集

中在中国的北部,即内蒙、新疆、黑龙江、宁夏等省份。来自北面

的风沙侵袭着北京,以 至 于 北 京 的 风 沙 一 年 比 一 年 大,1999年

发生了两次沙尘暴!

荒漠化的速度呈上升趋势。20世纪50年代至70年 代 中

期,土地 荒 漠 化 年 均 扩 大1560平 方 公 里;而 在70年 代 中 期 到

80年代中期,年 均 扩 大 面 积 为2100平 方 公 里。目 前 的 扩 大 速

度为每年2460平方公里。这个速度还在增加。

现在普遍的观点是,荒漠化的原因,是由于人类对土地资源

的过度利用,对土地的利用超过了它的承受能力。在北方,雨水

量小,土地上的生态系统脆弱,为了维持人口的过度增长对粮食

等的需求,人 们 对 土 地 的 索 取 呈 加 速 趋 势。对 土 地 的“滥 垦”、

“滥牧”、“滥樵”、“滥采”是土地沙漠化的主要原因。

据调查,在牧区,草原上的牲畜严重超载已成普遍现象,牧

区一般超载50%~120%,有的地区达到300%!

Page 170: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

177  

第八章

 集体行动的悲剧

发菜是宁夏“四宝”之一的“黑”宝,宁夏的农民为了多赚钱,

大规模地采集发菜,以销往南方,以至于当地政府不得不明令禁

止这种行为,并将发菜从宁夏“四宝”中去除。而在甘肃挖甘草

已成致富之路,据估计每挖10公斤甘草要破坏5.3公顷~7.3

公顷的草地。

这与哈定的公共资源悲剧何其相同,其原因就在于环境资

源是大家的。

三、发展经济与对自然的破坏

现在各国都在发展经济,GNP(国民生产总值)或人均GNP

是一国富裕程度的指标,或者说是国力强弱的指标,各个国家都

在制订促使GNP增长的政策。然而,GNP的增长完全建立在

对自然的破坏之上,可以这么说,GNP是对自然破坏的指标。

当然,有很多人不同意我这里的观点。为什么美国那么富

裕,而对自然破坏得较少?美国的环境是保护得最好的。其实,

这有三个原因:第一,美国的生产或消耗的原料有很大一部分来

自于别国,如石油来自中东,美国GNP的增长建立在他国对自

然的破坏之上;第二,美国的产品许多是高科技产品,高科技产

品对自然的破坏较轻,但它会加大人类的破坏力量;第三,像美

国生产的高科技产品往往难以被自然消解,自然对加工粗糙的

产品的消解是容易的,而对用高科技制造出来的精巧的物品消

解起来是缓慢的,但这种对自然的破坏不是那样直观,因此常被

我们忽略。

可以这么认为,人类社会的发展对个人来说是没有选择的

Page 171: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   178  

自由的。当周边国家进入工业社会,发展机器工业,可以在较短

的时间生产出比农业社会更多的物资,并且可以生产出以前没

有的东西,试想一想,有哪个国家看到这种情形还会无动于衷?

并且重要的是,没有选择发展工业的国家面对周边国家的强盛,

它的安全受到威胁,它除了被动地选择进入工业社会,别无其他

选择。18世纪工业革命首先发生在英国,西方国家相继进入工

业社会。而远东的中国,在距离上离发生工业革命的西欧较远,

直到19世纪中叶才感受到工业革命的冲击———在列强枪炮的

攻击下被动地接受工业化。20世 纪 的 中 国 其 实 是 被 动 地 接 受

现代化的。在社会发展史上人们在很大程度上是没有多少选择

余地的,这一点正如马克思所认为的,生产力是最具革命性的力

量,它促进生产关系的发展。

我们这里要说的不是历史的发展规律问题,而是要表明:当

前世界各国竞相发展经济、对自然进行破坏,是一个集体行动的

悲剧。有读者可能无法理解:发展经济是好事,为什么能和哈定

悲剧联系在一起?

发展经济对人类确实是好事,人类总不能生活得与动物世

界一样。但问题是,当今经济的发展已经进入过渡时期,经济的

发展造成了环境的破坏。

市场经济是竞争经济,在这样一个优胜劣汰的格局下,拼命

地向自然索取或者说掠夺是现时代的特征。每个竞争者———可

以小到个人,大到国家———都这样想:我不发展就有可能被淘汰

出局。而经济的发展就是对自然的利用———无论这种利用是对

自然中原始物的加工还是对中间产品的再加工,其结果都是自

然被加速地破坏。这就是自然的生态状况愈来愈恶化的原因,

其结果是人类的生存环境越来越恶劣。这也是囚徒困境。

Page 172: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

179  

第八章

 集体行动的悲剧

许多 人 清 楚 人 类 目 前 的 这 种 状 况,但 谁 也 没 有 良 药,因 为

“破坏—发展”是占优策略,每个参与者采取“破坏—发展”成为

集体行动的纳什均衡。这就是悲剧:大家都意识到问题所在,但

大家都无能为力。

四、光天化日之下的违法

行为为什么总能成功?

  人类有许多关于猴子的故事,比如朝三暮四,杀鸡给猴看。

其实猴子是没有思维的,它们有一定的群体意识,但没有社会意

识,人们关于它们的故事其实是说人自己的。我们这里也讲一

个猴子的故事。

在一个笼子里关了一群猴子,主人每过一天就打开笼子抓

一只猴子去杀掉。每天主人来时,每个猴子都紧张,它们不敢有

任何举动,怕引起主人的注意而被主人选中。当主人把目光落

在其中一只猴子身上时,其余的猴子就希望主人赶快决定。当

主人最终作出决定时,没有被选中的猴子非常高兴。那个被选

中的猴子拼命反抗,其余猴子在一旁幸灾乐祸地观看,这只猴子

被杀掉了。这样的过程日复一日地进行着,最终猴子全部被宰

杀掉了。

如果这群猴子群起而攻之,有可能会逃掉。但每只猴子不

知道其余的猴子是否会和它一起反抗,它怕自己的反抗会引起

主人的注意而被主人选中宰杀掉。

在现实社会中,窃贼在公共场所比如公共汽车上偷东西时,

车上的乘客看到了,但不敢吭声。没有被偷的人想,反正被偷的

Page 173: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

待宰猴群的结局

Page 174: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

181  

第八章

 集体行动的悲剧

人不是我,我反抗了,我得不到任何好处,反而遭到伤害;而不反

抗虽不得益,但也不受损,我何必要反抗呢?这就是光天化日之

下的偷窃行为为什么总能成功的原因。

窃贼在偷东西时发出这样的信号:如果谁反抗,将殴打谁。

乘客想,窃贼的威胁是可信的:因为如果个别乘客反抗,而窃贼

不殴打该乘客的话,就会有更多的乘客抓窃贼,窃贼将有可能被

抓,因此窃贼必然欧打反抗的乘客。乘客的策略及 可 能 的 支 付

为:反抗,有可能被殴打甚至受伤;不反抗,无所得也无所失。这

一博弈过程为:

窃贼

乘客!受伤窃贼!可能被抓"

可能逃脱

反抗

乘客!无所得#无所失

窃贼!被抓

不欧打欧打

乘客!受伤窃贼!得到赃物

乘客!无所得#无所失窃贼!得到赃物

不反抗

欧打 不欧打

窃贼

窃贼

乘客

偷东西

对于乘客来说,窃贼的威胁是可信的,因而乘客的最优策略

是“不反抗”;而对于窃贼来说,乘客“不反抗”下的“不殴打”策略

为最忧。

这一博弈的结果是,窃贼偷东西时“乘客不反抗,窃贼不敢

打”,这是一“子精炼纳什均衡”。

这样一种群体不反抗的结果将使社会风气恶化,偷窃之风

Page 175: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   182  

盛行。对个体来说,虽然这一次被偷的不是你,但下次你被偷的

几率增加了。这使得我们都如同待宰的猴子,我们不知道什么

时候轮到我们自己。这样,我们每个人的处境比以前更差。

如何从这种困境中摆脱出来?

我们看到,使乘客采取“反抗”策略,而非“不反抗”策略在于

加大采取“反抗”策略的获益,而减少不反抗的获益。当“反抗”

策略下的获益大于“不反抗”策略下的获益时,乘客就会采取“反

抗”的策略。

加大道德宣 传,培 养 人 的 道 德 感 可 以 解 决 这 个 囚 徒 困 境。

增强人的道德观念就是加大“反抗”策略的获益,即:当反抗时,

尽管有受伤的可能,但是道德荣誉感或道德满足感将使得乘客

的心理有所补偿;而在窃贼行窃时,乘客如果不反抗,他的道德

感将使得他为他的行为感到羞耻。上述博弈过程为:

窃贼

乘客

窃 贼

乘 客 !受 伤 "但 有道德满足感窃贼!可能被抓"

可能逃脱

反抗

乘客!没 有 受 伤并有道德满足感

窃贼!被抓

不欧打欧打

乘客!受伤并有道德耻辱感

窃贼!得到赃物

乘客!道德耻辱感窃贼!得到赃物

不反抗

欧打 不欧打

窃贼

偷东西

Page 176: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

窃贼与乘客的博弈

Page 177: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   184  

  这样,当小 偷 偷 东 西 时,尽 管 乘 客 认 为 窃 贼 的 威 胁 是 可 信

的,但是如果乘客是道德感强的人,那么博弈结果是“乘客反抗,

小偷殴打”,从 而 小 偷 有 可 能 被 抓 住,这 也 是 一“子 精 炼 纳 什 均

衡”。从全社会的 角 度 来 说,如 果 每 个 公 民 都 有 这 样 高 的 道 德

感,小偷成为过街老鼠,社会将从偷窃之风盛行的困境中解脱出

来。并且小偷如果偷窃的话,他知道将会受到道德感强的公民

的反抗,即支付函数成为公共知识,他偷窃的收益将很低,他很

难再从事偷窃活动了。这使我们看到,此处道德是消除集体行

动悲剧的一个良方。

这里,道德的人并不是不理性的,理性的人是计算的人,是

对得与失作出充分计算后行动的人。这也是道德存在的科学解

释,对此将在下一章作出分析。

博弈论对不合作的博弈结果的预测是令人悲哀的。但是,

从这个例子我们看到,道德就是由群体实施的对所谓“非道德”

的行为进行非强制性的惩罚机制,而法律及实施法律的国家的

形成与改进就是建立一个对所谓“违法行为”实施的中心惩罚机

制。这正是下一章要讨论的内容。

Page 178: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!囚徒困境的消解与文明

二!一个关于猴子的故事

三!人类原初的状态就是囚徒困境

四!国家和道德是两种克服囚徒困境的机制

五!更为基本的道德调节

六!哪种策略更能赢

七!道德作为"文化基因#的遗传与变异

八!国家的作用及其局限

九!文明新解

十!当前的悲剧与解决途径$世界政府的

可能性与可行性分析

集体行动悲剧的克服与文明

第九章

!

Page 179: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

187  

第九章

 集体行动悲剧的克服与文明

一、囚徒困境的消解与文明

文明和文化是什么,一直是思想家思考的问题。我们无法

给文明和文化下一个明确的定义,但我们可以认为,文明及文化

均是人类独有的现象。当然我们也在寻找地球外的文明,但是

否有天外文明仍然是个谜。

20世纪80年 代 弗 洛 伊 德 的 精 神 分 析 理 论 开 始 在 中 国 流

行,他对人类文明的独特见解曾迷倒许多莘莘学子。

他认为,文明是对人的本能的压抑,人的历史就是人的本能

被压抑的历史。在他看来,人有“生的本能”和“死的本能”,前者

称“性本能”或“爱 的 本 能”,后 者 称“死 亡 本 能”或“破 坏 本 能”。

本能的目的是满足,但是如果本能得到完全的满足,则没有了文

明。人所追求的目标是各种需要的满足,而文明则是要人彻底

抛弃这个 目 标 的。因 此 在 他 看 来,文 明 就 是 对 本 能 的 压 抑 与

利用。

而在社会学大师韦伯看来,文明是对人的贪欲的压抑,社会

的各种组织理性化就是为了压制和利用人的贪欲。

由此可见,要解释文明就是要解释利己的个体是如何得到

约束的。下面将从博弈论的角度提出一个新的文明观:文明其

实就是对集体行动悲剧的克服。

在囚徒困境中,每个参与者选择的占优策略是“招认”即“不

合作”,如果对囚徒博弈在参与者之间进行重复博弈呢?试考虑

这样一个非合作博弈:甲、乙两人博弈,两人各有两个策略。各

策略下的支付矩阵为:

Page 180: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

文明是对人的贪欲的压抑

Page 181: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

189  

第九章

 集体行动悲剧的克服与文明

甲乙 不合作 合作

不合作 (1,1) (5,0)

合作 (0,5) (4,4)

但是如果此时,两者的纳什均衡为(不合作,不合作)。

在第二阶段假设支付情况是这样的:当在第一阶段采取的

是“合作”策略时,将有额外的收益3;如果采 取“不 合 作”策 略,

则没有任何额外收益。即:在第二阶段额外的支付矩阵为:

甲乙 不合作 合作

不合作 (0,0) (0,3)

合作 (3,0) (3,3)

假设在第一阶段博弈双方知道这个两阶段博弈在各种策略

下的结果,于是这个博弈可由上述两个矩阵相加得出:

甲乙 不合作 合作

不合作 (1,1) (5,3)

合作 (3,5) (7,7)

这两个阶段博弈其实是一阶段博弈。在这个博弈中(合作,

合作)是纳什均衡,而这个结果就解开了囚徒困境。

这个例子的社会意义是什么?这里关键是对上面第二阶段

Page 182: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   190  

的支付矩阵的解释。

一种解释是:如果第一阶段双方只要有人采取不合作的策

略,那么以后双方便不能合作,以后的收益为0。这相当于在生

意场上如果一方欺骗了一方,那么以后双方便不能合作。如果

第一阶段采取了合作,那么双方在第二阶段没有理由不采取合

作,这就等于说,第二阶段是第一阶段的自然结果。

其实,第二阶段的支付矩阵是赏罚矩阵,是对参与者第一阶

段采取某种行 动 的“赏 罚”。即:如 果 第 一 阶 段 双 方 采 取 了“合

作”,那么将对双方奖励3;如果第一阶段有一方采取不合作,则

收益变为0。

在这个例子中,奖惩矩阵是在参与者之间建立起来的。而

一般来说,存在两种情况:一是参与者在博弈过程中自动建立起

来的,这就是演进博弈研究的内容;第二种情况是非博弈第三方

强加于参与者之上的赏罚矩阵,从而调节博弈结果。

摆脱囚徒困境的这个方法或者说模型对于社会有什么解释

力呢?我们说,文明就是这个赏罚机制的建立,而道德与国家的

目的就是建立这样的机制。

二、一个关于猴子的故事

这里再讲一个关于猴子的故事:

有一群猴子被关在笼子里,在笼子里的上方有一条绳子,绳

子拴着一个香蕉,绳子连着一个机关,机关又与一个水源相连。

猴子们发现了香蕉,有猴子跳上去够这个香蕉,当猴子够到时,

与香蕉相连的绳子带动了机关,于是一盆水倒了下来,尽管够到

Page 183: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

191  

第九章

 集体行动悲剧的克服与文明

香蕉的猴子吃到 了 香 蕉,但 其 他 猴 子 被 淋 湿 了,这 个 过 程 重 复

着,猴子们发现,尽管有猴子吃到香蕉,但吃到香蕉的猴子是少

数,而其余的大多数猴子都被淋湿。经过一段时间,有一伙猴子

自觉地行动起来,当有猴子去抓香蕉时,它们便揍那个猴子。每

当有猴子去取香蕉,就有其他的猴子因愤怒而自动地去撕咬那

个猴子,久而久之,猴子们产生了合作,再也没有猴子敢去取香

蕉了。

在这个故事里,猴子间产生了“道德”。如果这群猴子构成

一个社会,它们 也 繁 衍 下 一 代,它 们 会 将 它 们 的 经 历 告 诉 下 一

代,渐渐地猴子们便认为取香蕉的后果对其他猴子不利,从而认

为去取这个香 蕉 是“不 道 德 的”,它 们 也 会 自 动 地 惩 罚“不 道 德

的”猴子。

当然这只是一个故事,这个故事反映了人类的道德的产生

过程。

人天生是自私的,他努力使自己的利益最大。当然这不是

对现实的人的看法,而是一个抽象的假定。但现实中的人为什

么有道德呢?从自私的假定中怎么推出道德的人?

上述猴子的“道德”产生的故事可以用来解释博弈论专家对

道德的阐述。

三、人类原初的状态就是囚徒困境

人类的天性是驱利避害的,从动物状态走出来时人是自私

的。自私的人在交往中每个人为了自己的利益而产生的结果正

是一种囚徒困境。

Page 184: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   192  

英国哲学家霍布斯假设了人类的原初状态,用他的话说,自

然状态中人与 人 之 间 像 狼 与 狼 一 样,是“每 个 人 对 每 个 人 的 战

争”。在这种状态中,每个人都力图保护自己的利益,并企图占

有别人的东西,此时,每个人是每个人的敌人。此时没有任何规

则,没有财产,没有正义或不正义,只有战争。武力与欺诈是战

争中的两大基本德性。

在自然状态下,霍布斯说,是没有工业、知识、艺术、社会的

一点余地的。

霍布斯对自然状态的假定,目的是要引申出他的政治主张。

他认为,在这种状态下人的生活是悲惨的。为了摆脱这种状态,

人们便汇聚起来,建立契约,同意确立一个权力者或权力团体,

这就是利维坦,这个拥有巨大权力的利维坦对人们使用权力,以

结束每个人对每个人之间的混战。这就是霍布斯的社会契约论

的思想。

博弈论正是从这里找到哲学的理论先驱者。

让我们用博弈论来解读“自然状态”下的情形。假定我们这

里有两个人:A与B,每个人的策略是战争和不战争。在“自然

状态”中各种策略下的支付矩阵为:

AB 战争 和平

战争 (1,1) (4,0)

和平 (0,4) (2,2)

这个矩阵意味着:如果我进攻你,你保持和平的话,我不仅保

持我自己的利益而且占有了你的部分利益(2+2);如果你进攻

Page 185: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

193  

第九章

 集体行动悲剧的克服与文明

我,而我保持和平的话,我的利益被你占去了,此时我的利益为0;

如果每个人都不采取战争的话,每个人保持了自己的利益,各为

2;如果每个人采取战争的话,每个人或者要花时间和精力来保护

自己的利益不被对方抢去,或者因战争两方都受损,此时双方的

总收益下降,假定两人的实力是相当的,此时其利益为1。

不难看出,此时有一纳什均衡(战争,战争),即战争为每个

人的占优策略。这是一个囚徒困境。

这就是霍布斯的自然状态博弈论的结构。

但是,为什么人与人之间不是狼与狼那样?霍布斯说,国家

的产生就是为了消除人与人之间的战争状态的,此时国家这个

拥有绝对权力的组织对战争者进行惩罚,而保护和平的状态。

四、国家和道德是两种克服囚徒困境的机制

思拉恩·埃格特森在《新制度经济学》中举了一个例子,解

释为什么非洲的部落没有国家,但群体一样得到很好的调节。

非洲努埃尔人以部落为单位生存,假定每个部落里有两个

大家庭X、Y,每家 拥 有 同 样 的 武 力 潜 能 和 侵 犯 倾 向,每 家 拥 有

相当于10头牛的财产。每家都拥有两种策略:侵犯对方。不侵

犯对方。支付矩阵为:

XY 侵犯 不侵犯

侵犯 (4,4) (18,2)

不侵犯 (2,18) (10,10)

Page 186: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   194  

支付矩阵说明:若双方互不侵犯,各自拥有自己的10头牛;

若一方侵犯,另一方不侵犯,侵犯的一方则有18头牛,不侵犯的

一方只拥有2头牛,此时总数不变;若双方均选择侵犯对方,因

双方的战 斗 消 耗 了 资 源,财 产 总 量 下 降 为8头,双 方 各 拥 有

4头。

这个矩阵的纳什均衡为(侵犯,侵犯),双方的收益为(4,4)。

这是一个囚徒博弈,是一不合作的均衡。作者说:“这是一个产

权得不到保障的 社 会。”作 者 认 为,“要 解 决 这 个 基 本 的 社 会 困

境,就必须给对策者加以外部约束或内在化价值以改变收益方

阵的相互关系。”

这样,侵犯他人可能因报复而得到抑制,同时亲戚关系使得

侵犯者遭受成本(包括心理成本)的损失。上述方阵变为:

XY 侵犯 不侵犯

侵犯 (-5,-5) (9,2)

不侵犯 (2,9) (10,10)

此时X、Y就由非合作均衡变为合作均衡。

在这里,这个社会是一个由道德调节的社会,而非一个由国

家用法律提供有权力中心实施的中心化的惩罚机制。

作者探讨了无国家的状态下怎么处理社会不合作均衡的困

境,他在这里是引入了道德。

在霍布斯的理论中,国家起到调节的作用。国家是一个权

力组织,这个权力是中心化的,即权力组织建立在空间上的某个

Page 187: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

偷牛的成本

Page 188: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   196  

地方,政策的发布、实施是由这个中心组织进行的,比如法律的

建立、发布与实施就是这样。

道德则与国家不同。道德规范的形成、演变不是中心化的,

它的实施通过各个行为者来进行,而非某个组织。但是,这两种

方式都是调节人类社会的,这就是文明。

从理论上讲,国家和道德都是为了使人类走出不合作的囚

徒困境的机制。这种机制的特点就是建立一种赏罚机制。这种

赏罚机制要对某种行动进行奖励,而对其他一些行动进行惩罚。

这是其共同特点。

在“霍布斯模型”中,自然状态下的支付矩阵为:

AB 战争 和平

战争 (1,1) (4,0)

和平 (0,4) (2,2)

假定国家对每个人通过法律实施这样的惩罚措施:如果某

人采取战争的策略,那么罚 去3;如 果 采 取 和 平 的 策 略,不 奖 不

罚。这样,我们就引入一个惩罚矩阵:

AB 战争 和平

战争 (-3,-3) (-3,0)

和平 (0,-3) (0,0)

这样,在存在国家的状态下,支付矩阵为:

Page 189: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

197  

第九章

 集体行动悲剧的克服与文明

AB 战争 和平

战争 (-2,-2) (1,0)

和平 (0,1) (2,2)

对每个人来说,如果存在国家,“和平”的策略是占优策略。

同样,在非洲,努埃尔人的心理上无形中形成的也是一赏罚

矩阵。无论是担心报复还是因亲戚关系造成的心理成本,偷牛

会受到损失。实际上的情况不是人人都去偷另一个家庭的牛。

贝茨的分析,其实是在上述矩阵中引入了一惩罚矩阵:

XY 侵犯 不侵犯

侵犯 (-9,-9) (-9,0)

不侵犯 (0,-9) (0,0)

即:谁若侵犯他人,将有9头牛的损失,即被罚去9头牛;不

侵犯,没有成本,即不奖不罚。原支付矩阵加上惩罚矩阵就得到

改变后的支付矩阵。

在“霍布斯模型”中,国家以法律条文规定对某种行为如“战

争”采取惩罚措施,但是如果惩罚措施不力,即使扣除惩罚的成

本,行动者从“战争”行动中获取的好处大于他采取“和平”策略

所带来的好处,那么国家的法律措施是无效率的或者说是低效

率的。因此国家 法 律 的 制 定 应 以 抑 制 对 他 人 的 危 害 行 动 为 原

则。这就是法律制定的第一条原则:效率原则。

效率原则是从对社会的整体考虑分析得出的,从这个意义

Page 190: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   198  

上讲,法律越严格越好,越严格越有效率。但是,严格的法律对

犯法者公平吗?这就涉及法律制定的第二条原则。

第二条原则是,法律对犯法者的惩罚应以与犯法者给社会

或他人造成的危害相等为原则,这就是公平原则。从这个意义

上讲,法律惩罚太重,对犯法者不公平;而太轻,对社会或他人不

公平。

效率原则与公平原则是很难统一的,法律的制定既要考虑

效率原则,又要考虑公平原则,但往往两者难以兼顾。在不同的

国家以及在同一个国家的不同时期,对这两个原则的侧重点是

不同的。

五、更为基本的道德调节

与国家一样,道德也是对某些不合作行动的惩罚机制。这

种机制的出现(当然还有国家)使得人类从囚徒困境中走出来。

道德调节的第一个特点是,道德是先于国家产生的。根据

历史记载,国家的出现在人类历史上是很晚的事情,而在国家出

现以前,人类已经经过很长一段历史。

在国家出现以前,以某种权力组织来调节群体是可能的,如

部落的存在。然而更为基本的是道德的调节作用。道德先于国

家而存在,在上面的例子中,非洲的努埃尔人没有国家,但也调

节得很好,这便是道德的作用。

人的正义和非正义的概念与财产权的概念分不开,没有明

确的财产权的地方是不可能有正义的,因而在人类的早期,正义

的观念与财产权的观念几乎是同时产生的。

Page 191: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

199  

第九章

 集体行动悲剧的克服与文明

人的正义与非正义的观念产生了道德感,无论是霍布斯还

是休谟都这么认为。道德的产生先于国家,而它们的作用都是

区分或调节正义与非正义的行为的。

英国著名哲学家休谟在《人性论》中认为,人存在着先天的

不足。狮子勇猛、敏捷,羊、牛虽不具备这些条件,但它们食量也

不大,而人身体软弱但需求很大,为了弥补这个不足,只有依赖

于社会。在社会中人有了力量、能力和安全。但是社会是如何

合作的?休谟叙述了从两性的吸引到亲情关系,再到道德感的

产生。道德感自然地使得人们对不道德的或不正义的行为谴责

或者对不道德的人不采取合作,从而使得不道德的人遭受损失。

这样,社会上不道德的行为就会受到抑制。

因此只要社会形成了道德或不道德,或者正义或非正义的

观念,就自动地产生了调节作用。我们说,这种调节机制是非中

心化的,即它不是通过某个建立起来的中心化的组织来实施的。

道德调节无须成本,这是道德调节的第二个特点。道德感

是存在于每个人心中的,它无须成本维持。对不道德行为的谴

责也是不花成本的。

道德调节的第三个特点是,道德的调节存在着局限。它对

不道德的行为的抑制是有限度的,当不道德的行为带来的利益

大于道德的满足时,道德的作用便失效。捡到别人掉的东西还

给失主是道德行为,一方面捡到者有道德满足感,另一方面会受

到社会的表扬;如果不送回失主并被发现的话,则会受到谴责。

但是如果捡到的是一大笔钱,捡到者对是否还回给失主将有所

疑虑,因为他道德的满足感或可能承受的谴责小于他捡到这笔

钱的获利。另外一个例子是,自古有杀人者死,伤人者刑,然而

这与法律的实施相联系,在没有国家、没有组织的原始社会,我

Page 192: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   200  

们假定这时是单个人的社会,如果有力量的人杀了人,有谁对其

惩罚呢?人们可以谴责这种行为,认为它是不道德的,但没有力

量对之惩罚。因此从社会发展的角度来看,社会发展到一定程

度,便需要强有力的政府产生,以弥补道德调节的不足。

六、哪种策略更能赢?

假定我们的社会已经形成约束行动者的道德规范。如果对

不道德的行为不能产生即时的惩罚,不道德的行为在社会中往

往能给行为者带来好处。这表现在一次性的非合作的博弈中,

行为者理性地选取对自己有利的行动。但是,如果存在重复博

弈,参与者之间对不合作行为就会形成惩罚机制。

对囚徒困境进行无限次的重复博弈,什么样的策略会赢?

甲乙 不合作 合作

不合作 (1,1) (4,0)

合作 (0,4) (2,2)

假定第一步双方均采取合作的策略,第二步有人采取不合

作策略,而对方 采 取 合 作 策 略,采 取 不 合 作 策 略 的 人 将 有 支 付

4,采取合作策略的人将有支付0。采取合作策略的人感觉自己

不合算,他在第三步也会采取不合作策略。此时双方有可能进

入均采取不合作策略的重复性的囚徒困境。因此,在第二步,采

取不合作策略的人会考虑这样的结果。

Page 193: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

201  

第九章

 集体行动悲剧的克服与文明

这里涉及参与者以什么样的态度对待对方的不合作策略。

在博弈论里,有两个著名的策略。

如果一方采取不合作的策略另一方随即也采取不合作策略

并且永远采取不合作策略,在博弈论里面称之为触发策略,或称

冷酷策略,英文叫triggerstrategy。

如果对方知道你的策略是触发策略,那么对方将不敢采取

不合作策略,因为一旦他采取了不合作策略,双方便永远进入不

合作的困境。因此,只要有人采取触发策略,那么双方均愿意采

取合作策略。但是这个策略面临着这样一个问题:如果双方存

在误解,或者由于一方发生选择性的错误,这个错误是无意的,

那么结果将是双方均采取不合作的策略。也就是说,这种策略

不给对方一个改正错误或解释错误的机会。

第二 种 策 略 是,若 你 采 取 不 合 作 策 略,我 也 采 取 不 合 作 策

略,但是如果你采取了合作策略,我也采取合作策略。这叫“一

报还一报”策略,或者称之为“针锋相对”,英文叫tit-for-tat。

美国密执安大学的罗伯特·埃克斯罗德(RobertAxerold)主持

了一次计算机比赛,看谁写出来的程序能够赢。参加者有政治

学家、数学家、经 济 学 家、社 会 学 家,他 们 都 详 细 研 究 过 囚 徒 困

境。获胜者是加拿大多伦多大学的拉波波特写出的tit-for-

tat策略。这个程序非常简单:第一步采取合作,接着对方采取

什么策略,他便跟着做什么。

当然有多种策略,如对方采取了不合作,但自己永远采取合

作策略,这个策略可以叫做“以德报怨”策略。这个策略对行动

者最为不利,因为对方知道你采取这种策略,他会永远采取不合

作的策略,因而 理 性 的 人 是 不 会 采 取 这 种“以 德 报 怨”策 略 的。

然而,极端道德的人是超越理性的限制的,此时他会采取“以德

Page 194: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   202  

报怨”策略。佛说:“我不入地狱,谁入地狱?”基督说:“爱你的敌

人。”他们爱一切人而不会计算他爱的行动会给他带来利益或灾

难,而是希望他的行动感化众生。

如果是有限次的囚徒困境,那么情况就不同于上述无限次

的囚徒困境的重复博弈。当临近博弈的终点时,采取不合作策

略的可能性加大,如果参与人以前的所有策略均为合作策略,并

且被告知下一次博弈是最后一次,那么双方肯定采取不合作的

策略。

这可以解释许多商业行为。一次性的买卖往往发生在双方

以后不再有买卖机会的时候,尽量谋取高利并且带欺骗性是其

特点。而靠“熟客”、“回头客”便是通过薄利行为使得双方能继

续合作下去。

七、道德作为“文化基因”的遗传与变异

道德产生之后,它 成 了“文 化 基 因”,它 与 基 因 一 样 可 以 遗

传。学 者 达 维 肯 斯(R.Dawkins)发 明 了 一 个 词 meme,它 与

gene(基因)相对应,指某一群体的文化上的特质,或者说是文化

基因。武汉大学的朱志方博士在《社会决策论》中将之翻译成模

因,以与基因相对。文化基因(meme)有记忆和模仿的特征。

说道德是文化基因,因为它与遗传物质的基因有许多相同

之处,它可以复制、遗传及变异。

首先,道德可以遗传。道德的遗传通过“教—学”的关系来

完成的。父母及周边的人通过其行为不自觉地将道德传给了子

女,各种教育机构通过不同的教育方式传递德道规范。一代又

Page 195: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

203  

第九章

 集体行动悲剧的克服与文明

一代,在学习过程中继承了前辈形成的道德。

其次,道德可 以 变 异。变 异 意 味 着 进 化,惟 有 变 异 才 能 进

化。道德是人类集体行动时面临集体行动的悲剧而产生的,当

人类产生新的集体行动的悲剧时便会产生新的道德意识。从这

个意义上讲,人类和生物的进化不是变异在先,而是环境的变化

在先,能够产生适应环境的变异,才能得以生存。人类的道德也

是一样,当新的生存悲剧产生时,产生新的克服它们的道德,群

体才能生存下去,否则便灭亡。真正的悲剧不是不能克服,而是

来不及克服。

第三,存在不 同 的 道 德,道 德 之 间 是 相 互 竞 争 的。严 格 说

来,道德是一个群体区别于其他群体的文化,不同的群体因道德

的不同而相互不同,在历史上道德根植于宗教。大的范围里,我

们用“文明”称呼不同的道德群体。美国著名学者、美国国际事

务顾问亨廷顿认为当今世界存在着八大主要文明,它们是:中华

文明、西方文明、东正教文明、印度文明、日本文明、伊斯兰文明、

拉丁美洲文明以及非洲文明。有时我们用“民族”来称呼具有独

特文化的群体。我们说道德与国家是两种调节社会的工具,道

德存在于宗教之中,而宗教比国家的起源更早。这也是为什么

西方历史 上 世 俗 政 权(国 家)和 神 权(宗 教)相 互 争 夺 权 力 的

原因。

亨廷顿在《文明的冲突》、《文明的冲突与世界秩序的重建》

中表明他的观点,他认为,当前的冲突表现出文明的冲突,目前

最严重的冲突是在文明的交接点上,比如最近几年来在巴尔干

半岛上的冲突和战争。相同的文化及相同的道德意识,把人们

团结在一起,“我们相同”、“我与你不同”将人们分成群体,相同

的道德群体内部尽管有冲突,但是遇到不同的外来文化的侵略

Page 196: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

蚂蚁分工

Page 197: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

205  

第九章

 集体行动悲剧的克服与文明

时,相同文化的人就团结在一起。中东六次战争是信奉伊斯兰

教的阿拉伯国家和信奉犹太教的以色列之间的战争。第四,基

因载体努力复制自身,文化基因也力图发展自己。在生物学家

看来,基因有很强的复制自身的动力。在蜜蜂和蚂蚁王国,蜂后

和蚁后专司生殖,而工蜂和工蚁专门寻找食物。这有一个问题,

对于工蜂和工蚁来说,怎么解释它们不繁殖自身呢?生物学家

解释说:工蜂和工蚁自己繁殖的话,下一代的基因与自己相似的

程度是50%,而由蜂后和蚁后 来 繁 殖 的 工 蜂 和 工 蚁 的“弟 弟”、

“妹妹”与自己基因的相似程度是75%。于是,工蜂和工蚁它们

宁愿自己不繁殖。当然这只是一个解释。

对于文化基因似乎也是这样,一群体总是努力使自己的文

化基 因 发 展 壮 大。不 同 文 化 的 扩 张 必 然 带 来 冲 突。基 督 教

2000年来的发展,是与传教士的努力分不开的。基督教在自身

的扩展过程中,是排斥异教的,基督教的十字军东征就是为了消

灭异教徒。今天西方世界与伊斯兰国家之间的冲突就是文化基

因在拓展自身过程中的冲突。儒家文明与西方基督教文明冲突

剧烈的时候是在19世纪。西方基督教文明在向四周扩张的时

候,努力压制其他文明。儒家文明为了不至于消亡,在外部世界

的压力下,发生了变异以适应新的环境。

当今全球化过程中人们对自身文明的认同越来越强烈,亨

廷顿认为,通讯的发展并不会使得人们价值观发生趋同,而不同

的文化对这些信息将产生不同的解释。

Page 198: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   206  

八、国家的作用及其局限

国家与道德均是一套赏罚机制,它们的建立是为了调整人

们的行为,使人摆脱囚徒困境,走向合作。

笔者写了一篇论文,题为《赏罚机制的建立与博弈结构的调

整》,中心意思是,人类的个体理性与集体理性存在着冲突,这个

冲突就是集体行动的悲剧,但是人类可以通过“自动”地建立一

赏罚机制来克服这样的悲剧。就数学形式而言,赏罚机制的建

立就是在支付矩阵上加一个赏罚矩阵,或者在支付函数上加一

个赏罚函数;从实际意义上说,就是通过改变规则来对人的某些

行动给以奖赏,而对某些行动给以惩罚。

这种规则的改变有三种方式。

第一,如果参与者之间没有一个组织调节,那么参与者之间

可以通过协议形成组织,以调节人类的行动。国家是其中的典

型,竞争的企业之间为了避免相互恶性竞争建立的某些行业协

会也是其中的一种。

第二,如果原来存在着协调组织,但是,它的规则导致囚徒

困境,这时,该组织可以通过改变规则,来改变博弈结果。像中

国北方草原问题,在一定程度上起因于草地财产权的界定。

第三,参与者之间形成道德调节过程。道德谴责与道德赞

赏是非中心化的,而道德的作用一样可改变博弈规则,使违反道

德的行为得以降低,遵从道德的行为得以升高。

这三种方式是都是对“悲剧”的克服的方式,它们都可以说

是人类自动形成的。并且可以这么认为,它们就是文明!

Page 199: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

207  

第九章

 集体行动悲剧的克服与文明

对于这种对人类集体行动的悲剧的解决方式的解释,华南

师范大学的陈友芳先生提出这样一个问题:从原始社会开始,为

什么有的地方形成了国家?为什么有的地方没有形成国家而只

有道德的调节机制?

这个问题涉及一个深刻的问题,即实际的机制形成的问题。

为什么有些地方形成一中心化的国家,而有些地方没有形成国

家,只有道德调节,这可能是成本问题,当然我这里只是一种猜

测。中心化的组织的形成及其运行是要花成本的,而道德存在

于每个人的心中,它是非中心化的,其实施是通过每个人的行为

表现出来的。在人类社会形成之初,由于人口稀少、生产力低下

及行动能力的局限,道德是主要的调节因素,此时人类没有能力

形成控制力强的组织即国家。只有到社会发展到一定程度,人

口到一定的规模,生 产 力 达 到 一 定 水 平,中 心 化 的 组 织 才 能 产

生。正如马克思 所 认 为,原 始 社 会 是 没 有 国 家 的,到 了 奴 隶 社

会,才形成了一个阶级压迫另一个阶级的国家。

其实可以这样认为,国家是在其带来的利益大于其成本时

才得以形成的,即国家是人们为了摆脱“集体行动的悲剧”而形

成的,此时好处大于坏处。当然国家形成之后往往是一个集团

通过它得到更多的利益,而许多人因国家的存在而遭遇不幸,成

为国家的牺牲品,但在自然状态或原始社会中,是没有一群人实

施对另一群人“合法性”的屠杀的。

国家的运作成本太大,如果每个人不能从中得到更多的额

外的好处,那么国家便不能形成,或者严格地说不能自愿形成,

此时人们不可能有去形成这样一个权力中心的动机。当然,形

成的国家对统治者来说是有好处的,往往有足够武力的少数人

或集团有统一的动机,他们通过武力来征服其他人以形成一中

Page 200: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   208  

心化的国家。然而,当人民在这样一个国家下得到的好处没有

他们在自然状态下获得的好处大时,从长期来看,这个国家便不

能存在下去。这也可以解释古希腊马其顿国王亚力山大统治的

横跨欧亚的国家,成吉思汗建立的世界上最大的横跨欧亚非的

国家以及前苏联国家,它们为什么不能长久的原因。它们可以

短时间通过武力建立起来,但是不能长时间存在下去,因为它们

存在的成本太高,而给人民的好处不大。

因此可以说,国家的存在是有条件的,而道德的存在是没有

条件的。在非洲地区,或者古代,因生产力低下,人们所在的地

域广大,国家存在的管理成本太高,因此只可能有小而灵活性的

部落性组织存在,而不可能有庞大的制度化运作的国家。

国家和道德均有调节机制,是为了使人类摆脱“集体行动的

悲剧”而自动产生出来的机制。这里所谓的自动产生是指,它的

产生是由行动者本身的内部力量产生出来的,而非由该集体之

外的力量为它设计的。因而,国家和道德是人类集体进化的产

物,从这个意义上讲不是上帝强加于人类的。

这里只说明了什么时候产生国家,什么时候产生道德,但为

什么在有国家的地方仍有道德呢?可以这么认为,国家通过规

则化的机制对人的行动进行规范,然而它对人的行动的监督是

有成本的,它对社会危害大同时道德无法进行监管的行为进行

管制,而把对社会危害小同时难以监督的行为留给了道德。如

抢劫、杀人对社会的危害不言而喻,道德虽然可以在一定程度上

制约这种行为,但对这些行为的真正有效的惩罚只有通过合法

的暴力来进行。至于吐痰、在公共场所吸烟这类行为,对于吐痰

者或吸烟者是有利的,因为有吐痰的需求时立即吐掉是愉快的,

而对于吸烟者来说,在公共场所烟瘾上来时吸上几口烟 也 是 很

Page 201: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

公共场合抽烟

Page 202: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   210  

愉悦的。但无论是随地吐痰还是在公共场所吸烟,对他人是有

害的,因而这些是不道德的行为,对它们只有通过人们内心的道

德感以及他人的谴责来进行抑制。如果没有道德调节,而由国

家实行的外部的 强 制 力 量 来 管 制,那 么 其 成 本 太 高,实 际 上 效

果不大。

九、文明新解

那么在博弈论中,文明是什么呢?在博弈论中,人是经济人

或理性人,然而理性的人往往导致谁都不愿意见到的结果,这就

是集体行动的悲剧。当然,并不是所有的集体行动都造成悲剧。

这里得出与弗洛伊德及韦伯不同的看法:文明就是对集体

行动悲剧的克服。正如休谟认为,人的天生能力不如其他动物,

而惟有形成社会并相互依赖才能克服自身的弱点。但是,群体

的行动往往导致没有技术解决办法的悲剧。国家及其相应的法

律、道德都是为了克服集体行动的悲剧。

文明的发展是对集体行动的悲剧不断克服的历史。集体行

动的悲剧具有相同的结构,都是囚徒困境的形式,即:自私的人

或理性的个体从自身利益出发,造成群体受到损害。这在现实

中往往以不同的方式表现出来,如我们在第7章中举出的例子。

同时,在人类的发展中不断产生新的集体性的悲剧,而人类就是

在不断地调整自己的行动———通过建立法律、形成新的道德意

识,从而不断克服这种悲剧的。

历史上存在着这样一个现象:对社会均衡的打破开始于殉

道者。先知看到常人没有看到的东西,他们预测到集体行动的

Page 203: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

211  

第九章

 集体行动悲剧的克服与文明

灾难,然而社会没有意识到问题之所在,没有形成克服悲剧的集

体的道德意识,当然更没有建立某种克服悲剧的组织形式。社

会不能理解先知的呼喊,因而先知因违背众人的意志而被社会

所不容,甚至被处以极刑。

鸦片 战 争 后,中 国 面 临 被 列 强 瓜 分 的 危 机,清 政 府 软 弱 无

能。固守传统还是学习西方,成了人们论战的主题。康有为、谭

嗣同等人力主维新变法,然而开明并支持维新的光绪皇帝其权

力受到以慈禧为代表的保守势力的多方挟制。当袁世凯出卖光

绪,慈禧开始对维新派进行大规模搜捕屠杀时,力主变法的谭嗣

同没有逃走。他拒绝到日本躲避,而慷慨赴难。他说:“各国变

法,无不从流血而成,今中国未闻有因变法而流血者,此国所以

不昌也。有之,请自嗣同始。”维新运动被保守的清政府镇压了。

维新在某种程度上是在清政府原来的体制上的改革,而非彻底

的革命,维新运动的失败意味着清政府丧失掉了克服集体行动

悲剧的机会,因而导致清政府的腐朽和灭亡。经过辛亥革命以

及毛泽东等人领导的中国共产党的革命,强大的共和国终于在

维新运动失败的半个世纪之后建立起来。

谭嗣同从容就义,鲁迅大声呐喊,都是为了唤醒民众。他们

要告诉人们:不要再昏睡下去,要行动起来!否则中国要亡了。

他们力 图 打 破 由 自 私 而 形 成 的 社 会 的 均 衡,克 服 集 体 行 动

的悲剧。

因此,人是自由的,他不受必然性的支配。当人没有认识到

集体行动的悲剧的时候,人可能无法克服这样的悲剧。而一旦

人认识到集体面临的悲剧,人的道德感便可能使人超越人的经

济理性而走向道德理性,集体面临的悲剧就可能被克服。黑格

尔说得好:“自由是对必然性的认识。”这就是人,也正是人才有

Page 204: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   212  

文明。

十、当前的悲剧与解决途经:

世界政府的可能性和可行性分析

当前的悲剧 是 竞 争 的 悲 剧。无 论 是 前 苏 联 和 美 国 核 竞 赛

(当然两个超级大国的核竞赛随着前苏联的解体而结束),还是

全球性的对环境的破坏,都源于竞争。

马克思说,私有制是一切罪恶的根源,然而私有制并不必然

产生竞争,中国古代是私有制的,但根本没有产生竞争,当然更

没有产生今天的这种破坏性的竞争。可以这么认为,竞争的机

制是囚徒困境的机制。

20世纪 的 一 些 事 件 给 知 识 分 子 以 严 重 的 创 伤,福 山(F.

Fukuyama)在《历史的终结》导言中说:“我们西方人在关于认识

民主制度全部进 步 进 程 的 可 能 性 方 面,是 彻 底 的 悲 观 主 义 者。

这种普遍的悲观主义不是偶然的,而是受20世纪上半叶极其可

怕的政治事件影响的结果。这些政治事件包括:两场毁灭性的

世界大战;独裁主义意识形态崛起;科学以核武器及环境破坏的

形式构成反人类的转向。”

第二次世界大战中,先后参战的国家达61个,全世界80%

以上的人口约17亿人直接或间接地卷入到战争中去,参战军队

达1.1亿人,直接用于军费的开支总额约为13520亿美元。各

交战国用于军 费 的 开 支 占 其 国 民 生 产 总 值 的60%~70%。战

争持续了6年零1天。军队死亡人数为2210多万,居民死亡约

3430多万人,合计死亡5600多万人,约占交战国人口的3%。

Page 205: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

213  

第九章

 集体行动悲剧的克服与文明

二战时,纳粹德国设立的奥斯维辛集中营中有400万人丧

生;日本侵略军攻入南京时,南京大屠杀中有30万人遇难。

二战中,参战国经济损失达40000亿美元。日军侵华战争

给中国人民造成巨大的经济损失,直接经济损失达620亿美元,

间接经济损失达5000亿美元。

人类当前的困境有着深刻的历史、文化原因,也可以说这是

社会发展的必然趋势。如果从文化角度来分析可以这样认为,

西方享乐主义文化在全世界的扩展是本质性的。西方文化最近

500年才崛起,它是 一 种 强 势 文 化,并 且 是 竞 争 性 文 化,它 将 全

球拖入竞争状态,各国发展经济一方面是要满足人民的需求,更

重要的是要在国 际 舞 台 上 取 得 地 位,防 止 被 其 他 国 家 所 消 灭。

可以这样认为,各国发展经济是政治要求,是另外一种战争。

战争为人类的天性,而西方科学技术的发展使得战争成为

毁灭性的。弗洛伊德说,人有生的本能和死的本能,后者也叫破

坏本能。所谓本能是发生于人的内部的永恒冲动力,本能意味

着需要,不能通过逃避得以解除,而要通过满足来消除。死亡本

能的驯服、控制和对象转移是文明的一个条件,正如对生的本能

的必要压抑是文明的前提一样。而死亡本能的外投,用之于向

自然开战就是生产,而向敌人开战就是战争。因此战争是不可

避免的。

走出当前的困境,需要限制人类的享乐性文化的扩张,消除

国家之间的战争,这 需 要 一 个 全 球 性 的 人 类 共 同 政 府 来 实 施。

对当前悲剧的惟一解决方式是世界政府的建立,世界政府的建

立可以消除各国之间的战争。

世界政府或者说全球政府,意指世界进入一种无国家的状

态,原有的有平等权力的各个国家消亡了,而只由一个政府来对

Page 206: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   214  

全球的事务进行管理和调节。

这里涉及两个问题:一是世界政府可能吗?二是世界政府

可行吗?

对于第一个问题,我们说这是可能的。从管理的可能性来

分析,人类社会随着生产力的不断发展,政府的管理能力不断地

增大;从历史的角度来看,国家是对非正规的权力组织即部落的

统一,国家的产生条件是生产力水平发展到一定程度。由于地

理环境和历史文化的多种因素,国家有大有小。而从今天的管

理能力来看,一个政府对全球事务进行管理是可能的,或者是渐

渐可能的。

上面说的是管理能力的可能性。但是一个政府的出现还面

临着文化的可能性问题。从能力上大国完全有能力吞并小国,

但这种吞并是非正义的,面临着吞并国文化上的抵触。不过,世

界人民经过500来年的频繁交流,文化已达到一定的融通或理

解。比如,以儒家为代表的中华文明从来就是一个开放的和包

容性强的文明,由于中华文明的悠久历史和博大精深,它对其他

文明的接纳有一个过程,目前正处于快速吸纳阶段。因此,世界

各国人民从文化上得以相互理解和认同,并形成一种全球性的

共同文化是可能的。而且即使不形成一种共同文化,只要能够

相互理解和宽容,世界政府就是有可能建立的。

第二个问题是,世界政府是可行的吗?即它的建立可以解

决人类面临的问题吗?目前人类的战争问题、武器竞赛、污染问

题是世界性的,这些问题的进一步发展将毁灭人类,这种悲剧是

大范围内的并且是毁灭性的。对这些问题的解决,我们已分析

得出:一种办法 是 建 立 一 个 赏 罚 机 制,另 一 种 办 法 是 道 德 的 约

束。道德约束个人的行为在一定范围内是可行的,而约束国家

Page 207: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

215  

第九章

 集体行动悲剧的克服与文明

或集团则有相当的难度。对于人类来说,最有效的方法是从制

度上建立消除悲剧的可能性。

要建立调节国家行动的赏罚机制,必须存在一个其权力高

于国家的机构。法律的权威性与法律的实施相联系,一国之内

法律意味着国家权力的权威性。但是国与国之间的法律是什么

呢?现行的所谓国际法不是严格意义上的法律,而只是“国际惯

例”。必须存在超国家的权力组织或政府,才会有约束国家的法

律,此时国家的权力不足以与这样的组织对抗。因此,惟有建立

这样的政府,才能协调或奖惩各个国家的行为———如果此时各

个国家还存在的话。

英国历史学家汤因比与日本著名学者池田大作都论述过世

界政府问题,汤因比认为未来世界政府的领导人最好由中国人

担任,因为中国人爱好和平。

可以设想世 界 政 府 对 于 解 决 目 前 的 悲 剧 是 一 种 可 行 的 方

法,但是它仍有许多问题:它的建立是暴力的还是和平的?它产

生独裁怎么办?它的存在往往会压抑人的创造性———池田大作

这么认为,这个问题怎么解决?它会不会产生其他的人类悲剧?

等等。这有待于进一步思考。

Page 208: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

一!弑父娶母的传说

二!我们不知道未来我们会知道什么

三!社会在什么意义上是可预测的"四!社会科学研究的作用

!"

集体行动的未来能否预测!

第十章

Page 209: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

219  

第十章

 集体行动的未来能否预测?

一、弑父娶母的传说

如果没有摩擦阻力的话,我们能准确计算出物体下落的时

间,我们能准确预测哈雷慧星每76年光顾地球一次,等等。在

宏观物理世界,我们的预测是准确的或基本准确的。

但是,我们能预测我们的社会未来是什么样的吗?美国能

成功部署NMD吗?100年后中国的经济、政治、文化能与美国

齐肩吗?100年后世界政府能够创立吗?

据称,许多先知能预测未来。在传说中,明朝朱元璋的军师

刘伯温就是一个能预测未来的奇人。据说,他曾预测未来:“天

上蝴蝶飞,地上海龟爬”。蝴蝶,飞机也;海龟,汽车也。

不仅中国的传说中有这样的先知,西方社会里同样流传着

有这样的所谓预测大师。根据诺查丹马斯的《大预言》,有人说

他预测到了20世纪发生的两次世界大战,预测到了会出现恶魔

希特勒(据说连 名 字 都 预 测 出 来),并 且 预 测1999年 人 类 大 毁

灭。但人类顺利度过了1999年。

人能够洞察人群组成的社会秘密吗?如果能的话,我们既

然知道了社会发展的进程,我们不是能完全可以按照我们的意

愿来改变未来状态吗?但是,如果我们改变了未来状态,我们的

预言不是错了吗?对于社会的未来,似乎是,或者我们承认不可

以预言,或者认为可以预言,但是对预言的事实或者说将要成为

事实的事实,我们不能改变,这样才能不发生矛盾。

古希腊有一个古老的传说:俄狄浦斯是国王拉伊俄斯之子,

俄狄浦斯出生后,先知预言国王必被其子俄狄浦斯杀死。国王

Page 210: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   220  

拉伊俄斯叫奴隶将俄狄浦斯杀死在山中,奴隶不忍心杀死这个

婴儿,将其置于山中。俄狄浦斯大难不死,被另一个国王波吕玻

斯收养。波吕波斯把俄狄浦斯当作自己的孩子来养。

俄狄浦斯长大后,先知告诉他,他将犯杀父娶母之罪。俄狄

浦斯非常害怕,他离开了养父波吕玻斯,出外流浪。当然,他不

知道波吕玻斯是他的养父。

在流浪的途中,他与人抢路而发生争吵,一怒之下杀死了对

方。而被其杀死的正是他的亲生父亲拉伊俄斯,然而他并不知

道。他来到他亲生父亲拉伊俄斯的国家,正好人首狮身的怪物

司芬克斯作乱,城里人说,谁杀死了司芬克斯怪物,他将为王,并

娶寡居的王后为妻。司芬克斯问:什么动物早上四条腿,中午两

条腿,晚上三条腿?这就是著名的司芬克斯之谜。俄狄浦斯猜

测说是“人”。因为人小时候不会走路,用手和脚在地上爬,长大

了用两条腿走路,老了的时候因体力不支而需撑着拐杖。俄狄

浦斯猜中了怪物的谜语,怪物跳崖而死。俄狄浦斯因对全城有

功被推举为王,坐了他亲生父亲的位置,并且娶了他的母亲。先

知的预言实现了,俄狄浦斯努力避免而没能避免。古希腊著名

悲剧作家索福克勒斯据此传说创作了《俄狄浦斯王》,这是一个

著名的悲剧剧作。

这就是悲剧,明知道但不可避免的不幸。

这个故事涉及社会发展的两个问题:一是我们能否知道事

件或历史 发 展 的 进 程? 二 是 如 果 知 道 了,我 们 能 否 改 变 这 个

进程?

在俄狄浦斯杀父娶母的例子中,先知知道俄狄浦斯会杀父

娶母,俄狄浦斯的父亲及其本人也知道了这个最终结果,他们都

在努力避免预言成为现实,然而却并没有避免得了。

Page 211: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

俄狄浦斯杀父娶母

Page 212: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   222  

  先知预测到了俄狄浦斯将杀死父亲并娶母亲这个结果,并

将这个结果告诉俄狄浦斯的父亲及其本人,以及俄狄浦斯及其

父亲为避免预言成为现实所作的努力,等等,这是不是说所有这

些都是事件发展的必然进程呢?

似乎可以从中得出这样的结论:预言及对预言结果改变的

企图均构成预 言 结 果 的 实 现 过 程。这 个 传 说 表 达 的 正 是 这 一

点。也就是说,即使我们预先知道了事件的未来的结果,这个结

果也是我们不可改变的。

二、我们不知道未来我们会知道什么

无论是科幻电影、小说,还是学者严肃的探讨,许多人都认

为回到过去是可能的。但回到过去真的可能吗?

回到历史中去也面临着一个原则上是否可能的问题。本人

认为———这也是许多学者指出的,回到过去在原则上是不可能

的。因为,回到过去就意味着可能改变过去,而改变了过去就使

本来发生的事情不能发生,这违反最基本的逻辑规律。因为在

同样的时空状态下,一事物不能既存在又不存在,即不能违反矛

盾律。发生的已经发生了,回到历史中去,如果不违反矛盾律的

话,惟一的可能是,无法改变已经发生的事件,即只能“看”而不

能“动”。当然,如果能够回到过去并改变历史的话,那改变后的

历史及其发展是全新的社会发展状态,这样一个全新的状态是

另外一个事件的发展进程,而不是原来的历史进程了。

回到过去原则上是不可行的,对未来的预言原则上是不是

同样不可行呢?

Page 213: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

博 弈 生 存   博 弈 生 存   博 弈 生 存   博 弈 生 存

  

我们今天不可能知道我们未来会是什么样子

Page 214: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   224  

  自然科学能够做到对物质系统的发展作出预测,这在一定

程度上已经形成共识。然而在混沌世界,以及在微观世界,预测

面临着危机。自然中 的 混 沌 现 象 是 不 可 预 测 的。在 社 会 行 动

中,我们能预测我们的行动对社会进程的影响吗?不能。因为

我们不能知道我们未来的行动会是什么样的,我们都有这样的

经历,今天的一些行动是几天前或几年前所无法预知的,尤其在

社会大变动的年代,我们不知道几年后我们会在哪里,当然更不

知道我们将来会做些什么了。既然我们不知道我们未来将有什

么行动,我们怎么能够知道我们的行动如何影响他人呢?

20世纪最伟大的 哲 学 家 之 一,卡 尔·波 普,论 证 了 历 史 预

测的不可能性,他的论证简单说来是这样的:我们得承认,我们

的未来受人类知识的强烈影响,我们今天不可能知道我们未来

会知道什么,因此我们今天不可能知道我们未来会是什么样子。

波普论证的关键在于“我们今天不可能知道未来我们会知

道什么”,波普认为,“他的证明在于指出了任何科学预测者———

不管是一位科学家,还是一部计算机———都不能用科学方法预

测它自己未来的结果。”任何预测的人无法知道自己未来能知道

什么,他当然就无法知道自己尚不知道的东西对未来会造成多

大影响。

在生活的舞台上,我们不知道我们未来会演什么角色,也不

知道我们自己会怎么演,当然也就不知道我们未来的演出会给

其他角色造成什么影响。我们不会知道这一台节目未来会演成

什么样子。

Page 215: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

225  

第十章

 集体行动的未来能否预测?

三、社会在什么意义上是可预测的?

对社会的预测,就是对集体行动结果的预知。

从原则上讲,在一般意义上人类的历史是不可预测的,也就

是说,人类的集体行动是不可能预知的。

但是,在某些假定的条件下,某种集体行动是可预测的。博

弈论中对行动者的假定是,行动者是理性的。理性的人不可能

作出非理性的事情,在这个假定下,许多结果就能预测出来。

博弈的均衡就是可预测的结果。在囚徒困境中,那两个被

抓的囚犯除了选择“招认”外其他还有吗?对于理性的或者说自

私的囚徒来说,没有。这是理性人的假定下的必然结论。

在博弈论中有这样的结论:在静态的博弈中,如果有一个纳

什均衡解,那么这个解就是该博弈的必然结果,它是可预测的;

而当有几个纳什 均 衡 时,这 几 个 纳 什 均 衡 都 是 可 能 的 结 果,此

时,结果也是可预测的。

像中国北方草原每况愈下的公共资源悲剧,武器竞赛,人口

问题,等等,这样的集体行动的悲剧也是可预测的。一旦群体处

于这种状态下,结局将不可避免。当然这是从理性的假定之下

得出的。然而人的个体理性与集体理性发生冲突时,一种调节

的力量产生了,即道德和国家的产生或进化。此时,从个体理性

出发的预 测 将 失 效,集 体 行 动 到 底 走 向 何 方,没 有 必 然 性 的

答案。

因此,原则上集体行动是不可预测的,而所谓预测只是在一

定前提下的结论,而非逻辑的必然性。

Page 216: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   226  

由此,我们可以看一下我们的社会。我们只能从现有的状

况预测未来的发展,这只是一个趋势,离我们较远的未来,我们

无法作出准确的预测,而所谓先知,只不过比其他人看得更远一

些而已。我深感到,未来是茫茫的黑暗,它充满着恐惧,同时也

意味着希 望。但 对 于 我 们 有 限 的 认 知 个 体 来 说,未 来 是 一 个

黑洞。

帕斯卡有一句名言可以很好地描述我现在的感受,他说:面

对茫茫的宇宙,我充满着恐惧。当然他指的不仅是空间的宇宙

而且指未来。这是有限的个体对无限的宇宙———无限的时间和

空间———的恐惧。面对不可预知的未来,我们能够想像出会是

什么样子吗?绝对不可能!在无限的时空面前,我们只是一粒

微不足道的尘埃。我们的知识也只是大海里的一滴水。

四、社会科学研究的作用

本书勾勒的世界政府同样会遇到历史预测的可能性问题。

对于社会科学,本人坚持社会预测的不可能性。波普从逻

辑上论证了历史预测原则上的不可能。

学者的研究本身是一种行动,正如科学家的研究是一种行

动一样。科学家的实验是对自然物(被实验的对象)的干扰,不

论肉眼的观测还是通过望远镜、显微镜的观测都是一种行动,这

种行动所造成的干扰在微观层次上影响着观测结果,测不准原

理表明了这种干扰。社会科学家的研究体现在收集社会事实材

料时对社会的干预,这不是指那种坐图书馆查阅年鉴、统计数据

等,而是指如社会学那样的社会调查,当然前者也是一种对社会

Page 217: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

227  

第十章

 集体行动的未来能否预测?

产生影响的行动,这里不作论证。更重要的是,社会科学家在收

集资料时的行动(如访问等)改变着社会状态,也改变着社会进

程。社会科学家的研究成果作用于社会,变成一种独特的改变

世界的力量,使思想变成行动。

社会科学在揭示已发生以及正在发生的社会事实时,它的

意义比较明显。历史科学告诉我们过去发生了什么以及如何解

释所发生的事情,社会学则告诉我们某一社区的人群的职业结

构、风俗习惯、道德状况,等等。但是,对于未来,社会科学只能

告诉人们,未来发生某些事情的可能性。

指出未来发生某些事情的可能性只是社会科学的一个起码

的目的,如果该门社会科学想这样的话。更为重要的是,社会科

学要促成一些事情的发生。思想也是一种力量,思想与现实的

其他力量对比究竟如何,取决于该思想与其他力量的关系。在

一定社会场合下,如封闭的高压社会,与高压政策相背的自由思

想无所作为,而适合统治者的观念则变成一种强大的力量。

社会科学,如果涉及未来的世界状态的话,它本身就在提倡

着某些观点,即使它以中立者的角色出现。而未来究竟发展成

何样,取决于各种力量以及该思想或观点对社会的影响程度。

马克思发现了社会的发展规律,指出社会发展的五大发展

阶段理论,而当前的资本主义的巨大不平等将由发达、平等、没

有剥削、压迫的共产主义社会来代替,他的思想的缘起是他看到

资本主义的丑恶,努力提出与现实不同的一个美好蓝图。由于

马克思主义影响的广泛性,马克思主义本身便成为一种强大的

改变社会的力量,于是多种 力 量 共 同 推 进,20世 纪 出 现 了 多 种

多样的社会主义,而中国共产党走出中国特色的社会主义是马

克思主义与中国文化、中国社会现实等力量共同促成的。

Page 218: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

   228  

总之,从理论上或者从逻辑上讲,社会科学要精确地预测一

个社会或群体的未来是不可能的,但它可以指出未来某些事情

的可能性,并促成某些可能的事情的发生。

Page 219: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

附录:纳什均衡定义及纳什均衡存在定理

纳什均衡定义:对于 一 个 由n个 参 与 人 的 博 弈 G{s1,s2…

sn;u1,u2…un},如果策略组合{s1 ,s2 …sn }对所有的参与人i,

满足:

ui(s1 ,s2 …si-1,si ,si+1…sn )≥ui(s1 ,s2 …si-1,si,si+1…

sn ),i=1……n

则称策略组合{s1 ,s2 …sn }为该博弈的一个纳什均衡。

这里,si,ui 分别为参与人i(i为1…n)的策略空间集和效用

函数。

纳什均衡是这样的含义:在某一策略组合下,对每一个参与

人,如果其他参与人的策略不变,该参与人当下所选择的策略优

于其他策略,即该参与人不会改变策略。此时,该策略组合便是

一个纳什均衡。

纳什均衡存在定理:对于任一n人博弈,至少存在着一个纳

什均衡。此时的均衡有可能是混合策略均衡。

Page 220: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

参考文献

1.AndrewColman:GameTheoryandExperimentalGames:

TheStudyofStrategicInteraction,PergamonPress,1982.

2.RobertGibbons:APrimerinGameTheory,Harvester

Wheatsheaf,1992.

3.H.W.KuhnandA.W.Tuker(eds):Contributionstothe

TheoryofGames,PrincetonUniversityPress,1953.

4.VonNeumann,andMorgenstain:TheoryofGamesandE

conomicBehavior,NewYork:JohnWiley&Sons,1944.

5.谢识予:《纳什均衡论》,上海财经大学出版社,2000年版。

肯尼思·阿罗:《社会选择:个性与多准则》,首都经济贸易大

学出版社,2000年版。

6.马丁·J.奥斯本、阿里尔·鲁宾斯坦:《博弈论》,中国社会科

学出版社,2000年版。

7.布坎南:《同意的计算》,中国社会科学出版社,2000年版。

8.约翰·纳什:《纳什博弈论论文集》,首都经济贸易大学出版

社,2000年版。

9.朱志方:《社会决策论》,武汉大学出版社,1998年版。

10.张维迎:《博弈论与信息经济学》,上海三联出 版 社、上 海 人

民出版社,1997年版。

11.丹 尼 斯·缪 勒:《公 共 选 择 理 论》,中 国 社 会 科 学 出 版 社,

1999年版

Page 221: 博弈生存idl.hbdlib.cn/book/00000000000000/pdfbook/003/010/109415.pdf第五章 信息、言语与行动 103 一、知识与博弈 105 二、信息与战争博弈 108 三、声称的策略与实际的策略:言语博弈问题

图书在版编目(CIP)数据

博弈生存:社会现象的博弈论解读/潘天群著.

2版.—北京:中央编译出版社,2004.9

ISBN7-80109-467-0

Ⅰ.博...

Ⅱ.潘...

Ⅲ.对策论—应用—社会行为—研究—通俗读物

Ⅳ.C912.68-49中国版本图书馆CIP数据核字(2004)第093963号

博弈生存

出版发行:中央编译出版社

地  址:北京西城区西直门内冠英园西区22号(100035)

电  话:66560272(编辑部) 66560299 66560273(发行部)

h tt p://www.cctpbook.com

Email:edit@cctpbook.com经  销:全国新华书店

印  刷:北京金瀑印刷有限责任公司

开  本:880×1230毫米 1/32字  数:156千字

印  张:75版  次:2004年10月第2版第1次印刷

定  价:1680元