囚徒困境:在竞争与合作之间取得平衡

关键要点

  • 囚徒困境说明自私行为会导致次优结果。
  • 在囚徒困境中,合作并不总是对个人最有利的。
  • 在商业中,识别囚徒困境有助于平衡竞争与合作。
  • 艾伯特·塔克于1950年将囚徒困境引入博弈论。
  • 囚徒困境展示了个人决策如何影响集体结果。

获取基于27年以上可信专业经验的个性化AI答案。

ASK

囚徒困境是由兰德公司(Rand Corporation)的 Merrill Flood 和 Melvin Dresher 于1950年提出的一个悖论,后来由加拿大数学家艾伯特·威廉·塔克正式化并命名。

囚徒困境基本提供了理解如何在合作与竞争之间取得平衡的框架,这些概念有时也能成为战略决策的有用工具。因此,它在商业、金融、经济、政治科学乃至哲学、心理学、生物学和社会学等多个领域都有应用。

VioletaStoimenova / Getty Images

解释囚徒困境

囚徒困境的场景如下:两名嫌疑人因犯罪被捕,分别关在警察局的不同房间,无法相互沟通。检察官分别告诉他们以下内容:

  • 如果你认罪并同意作证指控另一名嫌疑人,而他不认罪,你将被撤销指控,获释,另一人将服三年刑期。
  • 如果你不认罪,但对方认罪,你将被判刑三年,而对方获释。
  • 如果你们都认罪,双方都将被判两年。
  • 如果你们都不认罪,双方都将被控轻罪,判一年。

嫌疑人应当怎么做?这就是囚徒困境的核心。

囚徒困境的基本原则

要使囚徒困境悖论成立,必须具备一些基本概念,包括:

  • 必须有两个参与者。 场景涉及两个个体或实体,他们共同涉及某一情况,比如共同犯罪或共同面临某一决策。
  • 决策同时进行。 两人必须在不知道对方选择的情况下做出决定。这一同时决策是困境的关键,每一方都必须在不考虑对方选择的情况下作出决定。
  • 必须存在多种结果组合。 利益矩阵是一张表,列出双方可能的选择组合及其对应的结果或收益,帮助可视化不同决策的后果。稍后我们会详细介绍利益矩阵。
  • 可以是相互合作或相互背叛。 玩家可以选择合作(追求共同利益)或背叛(追求个人利益)。困境的张力来自个人利益与集体利益的冲突。
  • 每个玩家都有优势策略。 这是指无论对方选择什么,能带来最佳结果的策略。优势策略通常是理性选择,但当双方都采取优势策略时,结果可能是次优的。
  • 玩家被假设为理性决策者。 这意味着每个人都倾向于最大化自身利益。这一假设是博弈论和理性选择模型的基础,推动了策略冲突。

评估最优策略

让我们先构建一个收益矩阵,如下表所示。这里的“收益”以服刑时间的长短(用负数表示,数字越大越好)来衡量。“合作”和“背叛”指嫌疑人合作(如都不认罪)或背叛(如一方认罪另一方不认罪)。单元格(a)到(d)中的第一个数字代表嫌疑人A的收益,第二个数字代表嫌疑人B的收益。

囚徒困境——收益矩阵
嫌疑人B
合作
背叛
嫌疑人A
合作
(a) -1, -1
© -3, 0
背叛
(b) 0, -3
(d) -2, -2

对于玩家来说,优势策略是无论对方采取何种策略,都能获得最佳收益的策略。这里的优势策略是“背叛”(即认罪),因为认罪可以最小化在监狱中的平均时间。可能的结果包括:

  • 如果A和B都合作(都不认罪),都判一年(见单元格a)。
  • 如果A认罪但B不认罪,A获释,B判三年(见单元格b)。
  • 如果A不认罪但B认罪,A判三年,B获释(见单元格c)。
  • 如果两人都认罪,双方都判两年(见单元格d)。

因此,如果A认罪,他们要么获释,要么判两年。但如果不认罪,可能只判一年或三年。B面临的困境也是一样。

囚徒困境的后果

囚徒困境巧妙地展示了:当每个人都追求自身利益时,结果比双方合作的结果更糟。在上述例子中,合作——即A和B都保持沉默、不认罪——会让两名嫌疑人都判一年。其他所有结果都意味着两到三年的刑期。

理性人只考虑最大利益,通常会选择背叛而非合作。如果双方都假设对方不会背叛,结果会是(b)或(c),但实际上他们会选择(d),即都认罪,判两年。

在囚徒的例子中,合作(保持沉默)意味着最少一年刑期,而认罪可能让他们获释,或最多判两年。但不认罪的最大风险是被判三年,如果A信任B会保持沉默但B实际上认罪(反之亦然)。

这个激励背叛(不合作)但合作可能带来最佳结果的困境,在商业和经济中以多种方式展现。

快速事实

艾伯特·塔克于1950年首次向斯坦福大学的研究生心理学学生介绍囚徒困境,作为博弈论的例子。

商业中的囚徒困境应用

在现实中,囚徒困境的经典例子是两个竞争对手在市场上的竞争。许多行业中有两个主要对手。例如,在美国,可口可乐(KO)与百事可乐(PEP)在软饮料市场激烈竞争,家得宝(HD)与洛威(LOW)在建材市场竞争。这些竞争在商学院中成为众多案例研究的主题。其他激烈的竞争还包括星巴克(SBUX)与Tim Horton’s(QSR)在加拿大,以及苹果(AAPL)与三星在全球手机市场。

以可口可乐与百事可乐为例,假设可口可乐考虑降价其标志性汽水。如果降价,百事可能也不得不跟进以保持市场份额。这可能导致两家公司利润大幅下降。

任何一方降价都可能被视为背叛,因为这打破了保持价格高、最大化利润的隐性协议。因此,如果可口可乐降价而百事保持高价,前者就是背叛,后者则是合作(遵守隐性协议)。在这种情况下,可口可乐可能通过增加销量赢得市场份额和更高的额外利润。

理解囚徒困境中的收益矩阵

假设可口可乐和百事的额外利润如下:

  • 双方都保持高价,利润各增加5亿美元(因需求正常增长)。
  • 一方降价(背叛),另一方不降(合作),前者利润增加7.5亿美元(因市场份额扩大),后者不变。
  • 双方都降价,软饮料销量增加抵消降价带来的利润损失,各自利润增加2.5亿美元。

利益矩阵如下(数字代表以百万元为单位的额外利润):

可口可乐 vs. 百事可乐——收益矩阵
百事可乐
合作
背叛
可口可乐
合作
500, 500
0, 750
背叛
750, 0
250, 250

其他常见的囚徒困境例子还包括新产品或技术开发,以及公司在广告和市场推广上的投入。

比如,两家公司有隐性协议在某一年保持广告预算不变。如果一方背叛,增加广告投入,可能获得更高利润(因销售增加),但另一方也会跟进,导致广告支出增加,利润可能反而降低。这种“军备竞赛”式的广告投入,最终可能导致双方利润都下降。

经济中的囚徒困境应用

美国民主党与共和党之间偶尔出现的债务僵局,是经典的囚徒困境例子。

假设解决美国债务问题的益处是下一次选举中的选票增加。合作意味着双方愿意共同维持现状,控制不断上升的预算赤字。背叛则意味着采取措施缩减赤字,可能会失去一些选票。

如果双方都合作,经济平稳运行,选票会有所增加。但如果A党试图主动解决债务问题,而B党不合作,B可能会失去选票,转而支持A。

反之,如果双方都不合作,采取强硬措施,可能引发经济动荡(市场下跌、信用评级下调、政府关门),导致两党都失去一些选票。

如何利用囚徒困境

囚徒困境可以用来辅助个人在生活中的决策,比如买车、薪资谈判等。

比如,你打算买新车,走进一家经销商。你的“收益”是非数值的(如对交易的满意度)。你希望以最低价格、最优配置买到车,而销售员希望卖出最高价以获得最大提成。

合作意味着不讨价还价,直接接受标价(让销售员高兴),带车离开。背叛意味着讨价还价,争取更低价格。假设用1到10的满意度评分,10代表完全满意,0代表完全不满意,收益矩阵如下:

买家 vs. 销售员——收益矩阵
销售员
合作
背叛
买家
合作
(a) 7, 7
© 0, 10
背叛
(b) 10, 0
(d) 3, 3

这个矩阵告诉我们什么?如果你强硬讨价还价,成功争取到大幅降价,你会非常满意(得分10),但销售员可能不满意(得分0),因为损失了提成(见单元格b)。反之,如果销售员坚持不降价,你会不满意(得分0),而销售员会很满意(得分10)(见单元格c)。

如果你直接接受标价(单元格a),满意度较低,销售员也可能不太满意,因为你可能会觉得他可以卖出更贵的车型或加装配件赚更多提成(见单元格d)。

长时间讨价还价可能导致双方都不满意(单元格d),因为最终可能达成一个勉强的价格。类似地,在薪资谈判中,接受第一个报价可能看似简单,但可能会少拿一些钱。争取更高薪资可能会得到更好的待遇,但如果雇主不愿意涨薪,你可能会不满意。

经济中的囚徒困境

以宏观经济为例,政府在经济衰退时的财政政策也体现了囚徒困境。

比如,若所有国家都采取扩张性财政政策刺激经济,全球需求增加,可能实现复苏。但如果某个国家选择紧缩,采取紧缩措施,短期内可能经济稳定,但对全球经济不利。

这类似于囚徒困境:每个国家都必须决定是合作(共同推行扩张政策)还是背叛(采取紧缩措施)。如果所有国家合作,全球经济更易复苏;如果一些国家背叛,追求最大利益,可能阻碍整体复苏,导致次优结果。

囚徒困境的答案是什么?

没有绝对正确的答案。它是一个悖论,展示了个人决策如何影响集体结果。

简单来说,

两个囚犯面对是否认罪或保持沉默的选择,不能沟通。每个人的选择影响对方。如果一方认罪,另一方不认罪,认罪者获释,另一人判长刑。如果都不认罪,双方都判较短的刑期。如果都认罪,双方都判中等刑期。博弈论预测,通常人们会选择对自己最有利的选项。

最佳策略是什么?

囚徒困境不是关于“最佳策略”或“答案”,而是展示两个个体出于自身利益行动时,难以实现双赢的局面。

底线

囚徒困境告诉我们,追求个人利益并不总能带来最优结果。企业、政府和个人在行动时,考虑合作可能会带来更好的整体结果。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)