有“两报还报”策略
存在,它便
定会获得冠军,因为它可以有效避免长期
互相伤害。
于是,们算出
赢家策略
两个特点:善良与宽容。这几乎是
个乌托邦式
结论:善良与宽容能得到好报。许多专家曾试图在恶意策略里耍点儿花招,认为这可能得到高分。即使那些提交“善良”策略
专家,也未曾敢如“针锋相对”
般宽容。所有人都对这个结论十分惊讶。
阿克塞尔罗德又举办第二次竞赛。这次他收到
62个策略,再加上随机策略,总共便有
63个策略。这
次,博弈中
回合数不再固定为200,而改为开放式
不定数(
之后会解释这
做
理由)。
们依然将得分评判为基准分“永远合作”分数
百分比,不过现在基准分需要更为复杂
计算,并不再是固定
600分。
第二次竞赛程序员们都得到
第
次竞赛
结果,还收到
阿克塞尔罗德对“针锋相对”与善良与宽容策略获胜
分析。这
做是为
让参赛者们能从某种方向上
解比赛
背景信息,来权衡自己
判断。事实上,这些参赛者分成两种思路。第
种参赛者认为,已经有足够证据证明善良与宽容确实是获胜因素,他们便随即提交
善良与宽容
策略。
位参赛者约翰·梅纳德·史密斯(JohnMaynardSmith)提交
个最为宽容
“三报还
报”(TitforThreeTats)
策略。另
组参赛者则认为,既然对手们已经读过
阿克塞尔罗德
分析,估计都会提交善良宽容
策略。他们于是便提交
恶意
策略,以期在善意对手中占到便宜。
然而,恶意再次没有得到好报。阿纳托尔提交
“针锋相对”策略再
次成为赢家,获得
满分
96%。而善意策略又再
次赢
恶意策略。前15名中只有
个策略是恶意策略,而倒数15名中只有
个是善意策略。然而,最为宽容
、可以在第
次竞赛中胜出
“两报还
报”策略,这次却没有成功。这是因为本次竞赛中有
些更为狡猾
恶意策略,它们善于伪装自己,无情地抛弃那些善良
人们。这揭晓
这些竞赛中非常重要
点:成功
策略取决于你
对手
策略。这是唯
能解释两次竞赛中
不同结果
理由。然而,就像
之前说过
那样。这本书并不是关于计算机程序员
创造力
,那
,是否有
个广泛客观
标准来让
们判断,哪些是真正好
策略?前几章
读者们估计已经开始准备从生物进化稳定策略理论中寻找答案
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。