纳什均衡和美丽心灵--lee

2010/1/27 21:45:00

纳什均衡和美丽心灵

纳什均衡名称来源及简介：　　

约翰·纳什1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》（1950）的博士论文。该博士论文导致了《n人博弈中的均衡点》（1950）和题为《非合作博弈》（1951）两篇论文的发表。纳什在上述论文中，介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念，也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。

纳什均衡定义：

假设有n个局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。

纳什均衡的重要影响：

纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础，正如克瑞普斯（Kreps，1990）在《博弈论和经济建模》一书的引言中所说，“在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面

　　（1）改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等，均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域，改变了这些学科领域的内容和结构，成为这些学科领域的基本研究范式和理论分析工具，从而改变了原有经济学理论体系中各分支学科的内涵。

　　（2）扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法，因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法，包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法，为经济学家们提供了深入的分析工具。

　　（3）加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用，不满足于对经济个体之间复杂经济关系的简单化处理，分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律，强调从微观个体行为规律的角度发现问题的根源，因而可以更深刻准确地理解和解释经济问题。

　　（4）形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系，按照经典博弈的类型或特征进行分类，并根据相应的经典博弈的分析方法和模型进行研究，将一个领域所取得的经验方便地移植到另一个领域。

　　（5）扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大，就因为它普通，而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律，也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用，使经济学与其他社会科学、自然科学的联系更加紧密，形成了经济学与其他学科相互促进的良性循环。

　　（6）改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利（Kandori，1997）对保罗·萨缪尔森（Paul Samuelson）的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家，因为它必须学习的只有两个词，那就是‘供给’和‘需求’”，曾做过一个幽默的引申，他说，“现在这只鹦鹉需要再学两个词，那就是‘纳什均衡’”。

发展：

MIT的一位计算机科学博士生的博士论文(PDF http://people.csail.mit.edu/costis/thesis.pdf )——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的，找到纳什均衡点是几乎不可能的事。目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与 UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作，证明对某些博弈来说，穷全世界所有计算机之力，在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信，计算机找不到，人类也不可能找到。纳什均衡属于NP问题，Daskalakis证明它属于NP问题的一个子集，不是通常认为的NP-完全问题，而是PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。

====

趣味纳什均衡博弈BLOG文章转载：

最近研究博弈论，顺便反思下爱情。现在，我来说一个故事：

电影《天下无贼》中的小偷情侣主角——刘德华和刘若英因为一次合伙盗窃被囚禁，法院已经确定他俩是合伙作案，但却没有足够的证据，于是法官隔离起两个人，分别对两个人说以下同样的话：

如果你们都坦白你俩偷了东西，则你俩共同判刑5年；
如果你坦白而她不坦白你俩偷了东西，则你立功释放而她判刑10年；
如果你不坦白而她坦白你俩偷了东西，则相反，她立功释放而你判10年；
如果你俩都不坦白，则我们没有证据，但因你俩有前科，所以共同扣留1年。

好了，我们已知她俩是情侣关系，心里都是想着让对方尽量少判一些，自己判多少年是其次。现在我们来分析两个人心里的小九九：

这时刘德华会这么想：
若她坦白了，而自己也坦白了，则两人都判5年！而若自己不坦白，则自己判10年，但她无罪释放，这样对她就比较好。所以若她坦白，我应该是不坦白对她好一些。
若她不坦白，而自己却坦白了，则我直接释放但她要判10年，这显然不行！而若我也不坦白，则两人都只扣留1年。所以就算是她不坦白，我仍旧是不坦白对她会好一些。

最终，刘德华对法官说：我不承认我俩偷了东西。
而刘若英也想为了老公好，所以心中的想法跟刘德华是一样的，所以她也想着自己只要不坦白老公就可以早点出来，所以她也跟法官说：我不承认我俩偷了东西。

而我们知道，两个人都不坦白的结果是所有选择中最好的——只扣留1年。

好了，上面的故事告一段落，接下来有一个相同的故事，只是主人公不再是一对恋人，而是两个很自私的小偷。他俩也合伙偷了东西，法官同样也对他们说了如上的话，那么这两个小偷心里会怎么想呢？

小偷一：
如果我俩都坦白，则两人都判5年，而若他坦白我不坦白，则我自己判10年！
如果我俩都不坦白，则两人都扣留1年，但若是他不坦白我坦白，我无罪释放，哈哈！
所以怎么看都是我坦白的好。

因为小偷二想的跟小偷一是一样的，所以最终两个小偷都坦白了。

而可以看到，两个人都坦白的结果是相当坏的——共同判了5年，明显不是最优解。

以上两个例子，同样的开头却有着截然不同的结果。差别就在于我用粗体描出的字上：两组人出发的立场不同。两组人，情侣那方是为了对方着想（事实上，从经济学上，也是为了自己的利益着想，只是把自己的利益建立在让别人幸福身上，所以博弈论在这里同样适用）；而那对自私的小偷，是完全地从自己的利益出发。

其实，这是1994年诺贝尔经济学奖的一个课题——“纳什均衡（nash equilibrium）”的实际一个运用例子，情侣和小偷的例子也是纳什均衡理论中最经典的例子“囚徒困境”的升级版。现在我想揪出影射到生活恋爱中方方面面的“纳什均衡”“非合作博弈均衡”的模型。

对那对情侣来说：两个人都置自己的利益于不顾，但最终却是两人都得到的最大的利益。
对那两个小偷：两个人都在为自己的利益而努力，而最终却是两人都得到了严重的处罚。

对于小偷的情况，传统的经济学认为集体中只要每个人都从利己出发，则最终整个集体都会有“利他”的效果。我们一般也认为只要每个人都在进步，则集体就会进步，但“纳什均衡”却证明了1+1<2，我分三点来看待这个问题：

分析

一、从经济学上，两个小偷符合亚当·斯密提出的“理性的经济人”的特征，都是从利己的目的出发进行选择，但结果却是“损人又不利己”，这就让亚当·斯密的理论成为了一个悖论（明显是利己的，但又不利己）。而根据我以前写的《不存在悖论》，可以证明亚当·斯密理论中必有一个假设是错误的。而亚当·斯密假设存在“一只看不见的手”来左右经济活动，很可能就是“存在这只看不见的手”的这个假设是错误的，经济活动中并无看不见的“市场”规律。

二、那对情侣相比那对小偷来说可以算是“识大体”（虽然本意并不是为了整体考虑，但结果确是对大局有利），我在整体与局部（一个蚂蚁不为一个生物）中阐述过，只有懂得整体的意义，才能化解危机。

三、因为是两个人在博弈，所以必然有利益之分，即便是对那对恋人，也存在利益之分：“让对方判刑尽量少些，就是在让自己的利益最大化。”所以在外人看来他们的策略正好达到了“最优解”，其实对他们之间的任何一个，都不是最优结果，对他们来说，最优结果是：“我判10年，而对方立功释放”，所以选择的策略不约而同都是不坦白。此时“两人都不坦白”不仅是纳什均衡，而且还是占优（策略）均衡。（两组人争夺的权益不同，占优策略均衡也不同）

结论

说了那么多，其实重要的结论就两个：

一、恋人和小偷的对比可以说明，恋爱确实是有用的，对双方都是一件好事。相比“两个”独立的个体，组合成“一对”的恋爱行为可以称得上是“共赢”的投资。

二、以上说的是“二人博弈”，但也是恋人这个整体和法官的对抗。可以看到，恋人还是考虑一下对方，无私一些比较好。“两人都大公无私”，这其实就是“合作”的思想了。显然，一个常识是，两人合作的竞争力比两人单干要强。

延伸

从更深的层次讲，这对恋人为何能够只为对方着想而不想想自己的危机呢？从经济学上，其实他们是在遵守着一层协议——爱的协议，即他们相信他们之间的爱，他们不担心对方变心，他们潜意识里坚信他们之间的契约，即便他们已经隔离开来了。可惜，刘德华和刘若英的例子是恋人希望达到的境界，很多恋人远远没有达到这个“忘我”的境界，所以在生活中的一个个“囚徒困境”中，难以求解。

举个例子，所有情侣都曾猜疑过对方是否有出轨行为。我们可以洞察一对感情并不深的“理性感情投资者”的情侣中双方的想法：

模型选择

博弈模型适用性分析
两个Player、争夺让自己能够“不被对方伤害”的权益（Payoff, 报酬或支付）、双方都可以自由做出决策（Strategy）、双方是同时做出决策的（the order of play）、两人都了解对方的部分信息（Information），这五要素都满足博弈的条件，所以可以构成一个标准的博弈环境。

建模

（题外：无论我们在怎样的提倡人与人的交往中不要企图有回报，但把人与人的交往这个模型放到经济学中，你对别人的态度，和别人对你的态度，都是赤裸裸的投资与回报）

以上在做博弈模型适用性分析时已经把模型建立的差不多了，加一个经济模型中共有的要素——规则，模型就建立起来了。

规则：恋人双方做出“是否出轨”的决策，呈现出的结果以“最终双方受到的伤害”来衡量。
纳什均衡：如果a*代表男方在女方选择b*时的最佳行动，而b*代表女方在男方选择a*时的最佳行动，那么，策略组合（a*,b*）就是两人博弈的均衡解。

寻找纳什均衡点

男：
若是她出轨了，我还忠贞不渝，则我是被戴了绿帽子；而若我也出轨，则倒也公平；
若是她不出轨，我也不出轨，那确实是个完美的结局；而若她不出轨我却出轨，那我就对不起她了。

同样女方也是这么想的。

这样这里就不存在任何决策能够形成“占优均衡”（如果双方出轨是占有均衡的话，那世界上就没有永远的情侣了），但还是有两个纳什均衡点，即两个都出轨或者两个都不出轨：（出轨，出轨）和（不出轨，不出轨）。

再加上我之前提到过的“前景理论”和“心理账户”，人们都是“风险偏爱”的，对男人来说：“她出轨造成自己受伤害”的担心将大于“她不出轨自己也不出轨”的喜悦之情，而对女人来说：“他变心造成自己耗费了青春”的担忧大于“我们都不变心”的喜悦。所以男人更愿意设想“她出轨了”自己该怎么做，这样子，如果爱不是那么深，爱太过理性的话，十有八九都是选择了第一个纳什均衡点（出轨，出轨）。

解决这个“纳什均衡危机”的办法只有一个，那就是相互爱对方和信任对方，在爱多少已经固定的情况下，要做的只能是信任对方。所以纳什均衡可以证明为何“相互信任”的情侣过得比“相互猜疑”的情侣要好的多。

这也是为什么从古至今，誓言总是为人们津津乐道的原因，誓言，就是为了让对方更相信自己不会变心，让对方更遵守爱的协议，让纳什均衡点只有一个。“只要你不先变心，我一定不会先变心”，遵守了这个契约，纳什均衡点就只有一个了——（不变心，不变心），这个情况下，两方都安于现状，没有动力去改变现状，都选择了不变心，从而达到了纳什均衡。

我们中国的古语已经证明了这个简单的生存法则：人不犯我，我不犯人；以其人之道，还治其人之身。恋爱中也同样适用，两个单纯的恋人，他们的结果优于两个复杂的人。

这里能让恋人摆脱“囚徒困境”的一个关键点是两个恋人间能够沟通，能够以誓言的形式来订立条约，并且能够及时洞察对方的一举一动，但有一种恋人的情况例外——异地恋。异地恋是最受博弈理论影响的恋情了，天各一方的情侣，被“老天”这个天然法官给隔离了，这个时候他们只能靠自己的感觉来判断这连“一纸空文”的要求都达不到的感情能否拴住对方，这时等待他们的就是无尽的猜疑，所以他们就会像那对囚徒一样，他们的纳什均衡点就是（变心，变心）。

其实，我们应该很早就在运用博弈学了，比如我并不在意身边的人是否比我出色，我曾告诉周围的人，我们的对手是“生存”，是在跟千千万万的人博弈，而对周围的人，合作共赢才是王道。

posted @ 2010/1/27 21:45:00 myfreemail.lee 阅读全文 | 回复(0) | 引用通告 | 编辑 | 收藏该日志

上一篇：企业家精神（Entrepreneurial Spirit）
下一篇：不良资产

留言簿

公告

最新日志

最新评论

搜索

登陆

友情连接

统计

发表评论：