历史故事中的成语:以牙还牙,源于博弈论的重复囚徒困境中的一种有效策略。这策略由数学家阿纳托·拉普伯特提出,并在密歇根大学社会学家罗伯特·阿克塞尔罗有关囚徒困境的研究中脱颖而出,成为解决囚徒困境的最佳策略。
概述
这一策略有两个基本步骤:
第一个回合选择合作。
下一回合是否选合作要看上一回对方是否合作,如果对方上一回背叛,此回合我亦背叛;若对方上一回合作,此回合继续合作。
“以牙还牙”策略有四个特点:
友善:“以牙还牙”者开始一定采取合作态度,不会背叛对方。
报复性:遭到对方背叛,“以牙还牙”者一定会还击报复。
宽恕:当对方停止背叛,“以牙还牙”者会原谅对方,继续合作。
不羡慕对手:“以牙还牙”者个人永远不会得到最大利益,整个策略以全体的最大利益为依归。
在众多策略中,“以牙还牙”是最有效的,曾连续数年击败由计算机科学家、经济学家和心理学家等团队所提出的策略。博弈论者尽管没有实质证据,但他们认为“以眼盯眼/投桃报李”的思想是一种理想化且高效的情感互动模式。
囚徒困境例子
假设有四个参与者:两个用“以眼盯眼/投桃报李”的战术,以及另外两个无论任何时候都会背叛其他人,以获得最大好处。每名参与者将面对另外三个参与者的六次对决。如果一人背离另一人而后人不变相反,则前人得5分,而后人得0分;如果双方都不变相反则各得3分;如果双方同时变相反则各得1分。
当两位使用“彼此瞄准/彼此交换”的战术的人互相竞争,他们都不会在任何比赛中违反这条规则。在所有6场比赛中,他们都维持着这种关系,每场比赛都按规矩进行,最终每人获得18分。
当两位使用不同战术的人互相竞争时,其中一种情况是他们不断地违反这条规则。两人每场比赛均违反,对方也同样做,这导致了6场比赛结束时,每人获得6分。
尽管那些遵循“彼此瞄准/彼此交换”的战术的人从未赢过一次比赛,而那些始终违犯规则的人从未输过一次,但是考虑到共同利益,这仍然被认为是最好的方式之一,因为它能够确保长期稳定的协作关系和较大的整体收益,即使不能保证单方面获胜的情况下也能达到最高收益。此外,它展示了人类行为如何通过简单、固定的反应模式来实现更广泛和可持续的社会秩序,如学生间冲突或地区战争等现实世界冲突环境中的平衡状态。而实际应用该方法只能够保证与他人的平局,并很难取得更大胜利。不过,在20周年纪念赛中,有一个小组找到了另一种可以打败这个方法的新战术,该小组成员包括尼古拉斯·詹宁斯(Nicholas Jennings)、Rajdeep Dash、Sarvapali Ramchurn、Alex Rogers 和 Perukrishnen Vytelingum。这项新的方法提供了一种小组内成员共同努力并保护其中某一个人,从而形成一个巨大的竞争单位,使其能够超越单纯独立之间竞争者的优势,并成功地挑战了传统之冠军——"彼此瞄准/彼此交换"法则。在现实世界应用方面,比如BitTorrent网络下载技术采用了类似的优化unchokeing机制来提高下载速度。通过定期随机选择其他用户进行上传,以寻找更多潜在协作者并最大化所有下载者的共同利益。在动物群落里,我们看到施予帮助给受益者的行为应该得到返回,当需求互换时,那些原来受助但现在需要帮助的是应该回到最初帮助它们的一方。“彼此瞄准/彼此交换原则是一个调节互惠主义的一个重要机制”。