博弈论研究人们的决策。生活中的许多事情包含决策。你的选择影响别人的结果。别人的选择也影响你的结果。博弈论分析这种互动。智慧树的课程讲解了这些知识。这篇内容讨论博弈论的基本思想。这些思想可以帮助我们写论文。
博弈论的核心概念是博弈。博弈包含几个要素。参与者做出决策。参与者可以是两个人。参与者也可以是很多人。每个参与者有自己的目标。他们想获得好的结果。规则决定可以做什么行动。信息决定参与者知道什么。结果由所有人的选择共同决定。支付表示每个参与者的得失。支付可以用数字表示。数字大表示结果好。数字小表示结果差。
博弈的分类很重要。一种分类是合作博弈和非合作博弈。合作博弈中参与者可以达成协议。协议有约束力。非合作博弈中参与者独立决策。他们不能签订强制协议。智慧树的课程主要讲非合作博弈。非合作博弈更常见。生活中的大多数决策是非合作的。
另一种分类是静态博弈和动态博弈。静态博弈中参与者同时行动。他们不知道别人的选择。动态博弈中参与者轮流行动。后行动者知道先行动者的选择。下象棋是动态博弈。猜拳是静态博弈。博弈的形式不同。分析的方法也不同。
信息是博弈的关键。完全信息博弈中参与者知道所有人的特征。他们知道别人的支付。不完全信息博弈中参与者知道自己的支付。他们不知道别人的支付。生活中信息往往不完全。我们经常需要猜测别人的想法。
博弈论分析参与者的策略。策略是行动的完整计划。策略告诉参与者在每种情况下做什么。简单的博弈策略少。复杂的博弈策略多。参与者选择自己的策略。他们选择对自己最有利的策略。
均衡是博弈论的重要概念。均衡是一种稳定的状态。每个参与者选择了最优策略。给定别人的选择,没有人想改变自己的选择。均衡不一定是好的结果。均衡只是稳定的结果。纳什均衡是一种常见的均衡。纳什均衡中每个参与者的策略是对其他人策略的最优反应。寻找纳什均衡是博弈分析的中心任务。
囚徒困境是一个经典例子。两个罪犯被警察抓住。他们被分开审问。每个囚徒有两个选择。选择坦白或选择抵赖。如果两个人都抵赖,他们都被判刑一年。如果两个人都坦白,他们都被判刑八年。如果一个人坦白一个人抵赖,坦白的人被释放,抵赖的人被判刑十年。每个囚徒都想自己刑期短。他们不能商量。
从个人角度看,坦白总是更好的。对方抵赖时,坦白获得释放,抵赖被判一年。对方坦白时,坦白判八年,抵赖判十年。无论对方怎么做,坦白的结果都更好。两个人都这样想。结果两个人都坦白。他们都判八年。如果他们都抵赖,他们只判一年。八比一年差。个人理性导致集体糟糕的结果。囚徒困境说明了个人利益和集体利益的冲突。生活中的许多问题类似囚徒困境。环境保护是例子。企业减少污染有成本。如果别人减少污染,自己不减污可以获得好处。如果别人不减污,自己减污会吃亏。所有企业都这样想。结果没有人减污。环境变差。大家都受损。
智猪博弈是另一个例子。猪圈里有一头大猪和一头小猪。猪圈一端有食槽。猪圈另一端有按钮。按按钮会有食物掉进食槽。但按按钮要消耗体力。大猪按按钮,食物掉进多。小猪按按钮,食物掉进少。食物掉落后,大猪吃得快。小猪吃得慢。大猪和小猪都要决定是否按按钮。
小猪会想:如果大猪去按,我自己最好等待。我按按钮消耗体力。我跑得慢。等我回来大猪吃了大部分食物。我得不偿失。如果大猪不按,我也不按。按了按钮我只吃一点。不按按钮我们都没得吃。但没得吃和吃一点差别不大。消耗体力不划算。所以小猪的最佳策略是等待。
大猪会想:小猪肯定会等待。如果我不按,我们都没食物。如果我按,我消耗体力。但我能吃大部分食物。这比没食物好。所以大猪的最佳策略是按按钮。结果是大猪按按钮,小猪等待。大猪辛苦劳动。小猪搭便车。这个均衡稳定。智猪博弈说明实力不同的参与者有不同的最优策略。弱者有时等待更好。强者不得不承担更多责任。团队工作中可能出现这种情况。能力强的人做更多事。能力弱的人跟随。
博弈论讨论重复博弈。许多博弈不是一次性的。同样的参与者反复互动。重复博弈可能改变结果。在囚徒困境中,如果博弈重复多次,合作可能出现。这次我选择合作。如果你也合作,下次我继续合作。如果你这次背叛,下次我会报复。报复是惩罚背叛者。报复的威胁可能促使双方合作。重复博弈中声誉很重要。好声誉带来长期利益。坏声誉导致别人不合作。生活中的长期关系类似重复博弈。邻居之间互相帮助。商店讲究诚信。这些行为考虑未来互动。
博弈论包括威胁和承诺。威胁是告诉别人:如果你做某事,我会做对你不利的事。承诺是告诉别人:如果你做某事,我会做对你有利的事。威胁和承诺要可信。空话没有用。行动才能让人相信。父母对孩子说:不完成作业就不能玩游戏。这是威胁。必须真的执行。孩子才会相信。公司承诺质量三包。这是承诺。必须真的退换货。顾客才会相信。可信性影响博弈结果。
博弈论研究信息不对称。一方知道信息。另一方不知道信息。二手车市场是例子。卖家知道车的真实质量。买家不知道。好车和坏车看起来差不多。买家只愿出平均价格。这个价格低于好车的价值。高于坏车的价值。好车卖家不愿意卖。坏车卖家愿意卖。结果市场上只有坏车。好车退出市场。这叫做逆向选择。保险市场也有类似问题。身体差的人更想买保险。保险公司提高价格。身体好的人觉得贵不买。剩下身体更差的人。保险公司继续提价。市场可能崩溃。解决方法包括发送信号。好车提供保修。保修是信号。好车保修成本低。坏车保修成本高。坏车不敢提供保修。保修传递质量信息。身体好的人买体检报告。报告是信号。信号帮助解决信息问题。
博弈论可以用于拍卖。拍卖是卖方出售物品。买方出价竞争。拍卖有很多形式。英式拍卖价格从低往高叫。出价最高者赢得物品。支付自己的出价。荷兰式拍卖价格从高往低降。第一个应价者赢得物品。支付当前价格。密封拍卖中买方写报价。报价密封提交。最高报价者获胜。支付自己的出价或第二高价。不同的拍卖规则影响出价策略。卖方想收入高。买方想价格低。拍卖设计很重要。
博弈论分析投票选举。候选人争取选票。选民投票支持喜欢的候选人。简单多数规则中得票最多者获胜。可能出现策略投票。你最喜欢候选人A。但A可能赢不了。你转而支持候选人B。B比候选人C好。你不投A而投B。这确保C不会赢。你的投票策略影响结果。选举制度设计影响候选人行为。比例代表制让小党有机会。多数代表制鼓励大党。
博弈论思考公平分配。两个人分蛋糕。一个人切蛋糕。另一个人先选。切蛋糕的人想公平。切得不平均自己吃亏。他会尽量切平均。这样两个人都满意。这是简单的分配机制。更多人的分配更复杂。博弈论设计公平程序。
写博弈论论文需要理解这些概念。论文可以分析一个具体问题。首先描述问题。说明参与者是谁。他们的目标是什么。他们有什么选择。信息条件如何。博弈是静态还是动态。博弈重复吗。然后建立模型。定义参与者的策略。列出可能的支付。用表格或树形图表示博弈。接着求解均衡。寻找纳什均衡。分析均衡的性质。均衡是唯一的吗。均衡结果好吗。有什么效率问题。最后讨论现实意义。模型解释了什么现象。提出改进建议。政策制定可以参考博弈论。
论文写作要清晰。用简单的语言。一步一步推理。避免复杂数学。重点讲思想。举例说明概念。例子帮助理解。智慧树的课程提供了许多案例。可以参考这些案例。结合自己的生活观察。生活中的博弈很多。家庭决策是博弈。父母和孩子有不同偏好。孩子想玩游戏。父母想孩子学习。双方互动达成平衡。交通出行是博弈。司机选择路线。堵车是大家选择的结果。商场促销是博弈。商家定价格。消费者决定购买。市场竞争是博弈。
博弈论帮助我们理解世界。它分析理性人的互动。它预测可能的结果。它设计更好的规则。学习博弈论很有用。写论文是深入理解的过程。通过论文整理知识。应用知识解释现象。这就是博弈论论文的价值。