<<<写在前面>>>

最近在看经济学原理和博弈论,本文的囚徒困境是一个经典的经济学模型,第一次看到博弈论相关文章所描述的就是这个经典模型,身边类似案例屡见不鲜,教育减负和下文烟草广告都是囚徒困境的一种表现。经济学与博弈论在当下社会中无处不在。

烟草广告

20世纪中叶烟草业繁荣但吸烟危害渐明,反烟组织抨击,烟草广告“内卷”且营销受限,在此背景下1971年美国禁止电台和电视台播放香烟广告

起初烟草公司抱怨这样的政策会损害他们的利益,但事实上利润反而提高提高

囚徒困境

囚徒困境-百度百科

囚徒困境是博弈论中的经典案例,内容如下:

囚徒困境简介

情境设定

  • 警方逮捕了两名犯罪嫌疑人(甲和乙),但缺乏足够的证据来证明他们的主要罪行,只有一些与持有枪支相关的较轻罪名证据。警方将两人分别关押在不同的牢房,使他们无法沟通。

检察官提出的交易条件

  • 若两人都保持沉默(合作):警方只能以非法持有枪支罪对他们进行轻判,比如每人判刑1年。
  • 若其中一人坦白(背叛),另一人沉默:坦白者会因为与警方合作而被免罪释放,沉默者则会被重判,比如判刑10年。
  • 若两人都坦白(互相背叛):两人都会被定罪,但检察官会为他们争取一定的从轻情节,比如每人判刑6年。

困境分析

  • 从甲的角度来看,若乙沉默,甲坦白则甲可获释(0年),甲沉默则会判刑1年,此时坦白对甲更有利;若乙坦白,甲坦白判刑6年,甲沉默判刑10年,这种情况下坦白对甲还是更有利。乙面临同样的处境。
  • 最终结果是,尽管两人都保持沉默(总刑期2年)对双方整体最有利,但出于对自身利益的考虑,他们往往都会选择坦白(总刑期12年),导致个体的理性决策造成了集体的不利结果。这体现了个体理性与集体理性之间的矛盾,以及在缺乏信任和沟通的情况下,双方难以达成最优合作的困境。囚徒困境在经济学、政治学、社会学等多个领域有广泛的应用,用于分析竞争、合作等策略选择问题。

举个较为简单的经济学例子

  • 背景:假设在一个行业中有两家主要的企业,它们共同垄断了某种产品的市场,且产品的市场需求是有限的。
  • 决策:
    • 企业 A 和企业 B 都选择维持现有产量:市场价格保持相对稳定,双方都能获得一定的利润,例如都能赚取 800 万利润。
    • 企业 A 增加产量,企业 B 维持产量:市场上产品供应增加,价格会有所下降。企业 A 由于产量增加,虽然价格降低,但通过薄利多销,利润可能增加到 1000 万;而企业 B 的市场份额被挤压,利润下降到 300 万。
    • 企业 A 维持产量,企业 B 增加产量:结果与上述情况类似,企业 B 利润增加到 1000 万,企业 A 利润下降到 300 万。
    • 企业 A 和企业 B 都选择增加产量:市场上产品供过于求,价格大幅下降,双方的利润都会大幅减少,可能都只能赚取 200 万利润。
博弈
博弈
  • 困境分析:
    • 从企业 A 的角度来看,无论企业 B 选择何种策略,它增加产量似乎都是最优选择。因为如果企业 B 维持产量,企业 A 增加产量能获得更多利润(1000 万 > 800 万);如果企业 B 增加产量,企业 A 增> 加产量也比维持产量的利润要高(200 万 > 300 万)。企业 B 同理。然而,当双方都基于这种个体理性做出决策时,最终的结果却是双方都获得较低的利润(200 万),而不是双方都维持产量时的较高利润(800 万)。这就是企业在产量决策上的囚徒困境,个体追求自身利益最大化的行为导致了集体利益的受损。

再举一个


再回到烟草广告的案例,正是由于个体追求自身利益最大化的行为使得生个行业利润相对较低,而政府的这一决策让烟草行业从囚徒困境中跳脱出来,收益自然上升了。

博弈论

博弈论当然不止囚徒困境还有诸如胆小鬼博弈智猪博弈等等。博弈论是冯诺依曼研究数学和经济学交叉领域问题是得出的一种系统分析竞争与合作理论,当下种种社会行为几乎都能看到博弈论的影子。在我国古代也有博弈论的案例,如耳熟能详的田忌赛马

田忌赛马分析引用

博弈 习题-田忌赛马问题

田忌赛马分析引用
田忌赛马分析引用
田忌赛马分析引用
田忌赛马分析引用

理性人不选择坏策略

智猪博弈-百度百科

智猪博弈

假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本。按钮和猪食槽在相反位置,按按钮的猪要付出2个单位的成本,并且丧失了先到槽边进食的机会。
若小猪先到槽边进食,因为缺乏竞争,进食的速度一般,最终大小猪吃到食物的比率是6∶4;若同时到槽边进食,大猪进食速度加快,最终大小猪收益比是7∶3;若大猪先到槽边进食,大猪会霸占剩余所有猪食,最终大小猪收益比9∶1。
那么,在两头猪都有智慧的前提下,最终结果是:小猪选择等待,大猪去按按钮。

智猪博弈
智猪博弈

像这样的一个博弈,从大猪角度思考

  • 对于大猪,小猪摁下时应选择策略为等待(7 > 4),小猪等待时应选择策略为摁下时(0 < 3),此时有两种最优
  • 对于小猪,不论大猪是否摁下(3 > 0),(0 > -1),小猪最优策略为等待

因此,大猪做出选择前必须先考虑小猪会选择的策略,小猪选择等待,那么大猪应选择摁下

智猪博弈最优策略
智猪博弈最优策略

但以上描述有个前提,大猪必须知道小猪是理性的,若只知道小猪有 50% 是理性的呢?解决此问题需要引入理性共识的概念「什么是无穷阶次的理性共识?-知乎

但理性共识对于求解和预测博弈是一个非常繁杂的事情,现实中很难有参与人达到这样的程度,这也是博弈论推理结果和实际结果有差异的原因。

纳什均衡

纳什均衡是博弈论中很重要的一个概念

纳什均衡定义

纳什均衡是指在一个博弈过程中,无论对方的策略选择如何,每个参与者都选择了自己的最优策略,这样的一种策略组合就构成了纳什均衡。在纳什均衡状态下,没有参与者有动机单方面改变自己的策略,因为单方面改变策略并不能使自己获得更大的利益。

回到上面两个企业的例子

博弈
博弈

这里可以看出当个体追求自身利益最大化时,每个企业都想得到 1000 的收益,但二者同时增产带来的结果就是只能获得 200 的收益,纳什均衡停留在(200,200)的位置,个体的理性决策造成了集体的不利结果

参考链接:

  1. 什么是无穷阶次的理性共识?-「知乎」