己对弈分数高。
阿克塞尔罗德竞赛里还有
些比“老实人探测器”与“愧疚探测器”更为复杂
策略,但它们平均分都比“针锋相对”低。事实上最失败
策略(除
随机)是最复杂
那
个,作者为“匿名”。这个作者引发
些饶有兴趣
猜测:五角大楼
高层?中央情报局
首脑?国务卿基辛格?阿克塞尔罗德自己?
们也许永远也不会知道。
不是每个策略细节都值得研究,这本书也不谈计算机程序员
创造力。但
们可以给这些策略归类,并检验这些类别
成功率。阿克塞尔罗德认为,最重要
类别是“善良”。“善良”类别指
是那些从不率先背叛
策略。“针锋相对”便是其中
个例子。它虽然也采取“背叛”
行动,但它只在报复中这
做。“老实人探测器”与“愧疚探测器”也偶尔采取“背叛”,但这种行为是主动起意挑衅
,属于恶意
策略。这场竞赛中
15个策略中,有8个属于“善良”策略。令人吃惊
是,策略中
前8名也是这8个善意
策略。“针锋相对”
平均分504.5分,是
们600分基准分中
84%,
个很好
分数。其他“善良”策略所得分数要比“针锋相对”少
些,从83.4%到78.6%不等。排名中接下来
分数则是由格雷斯卡普(Graaskamp)所获得
66.8%,与高分们有很大差距,而这已经是所有恶意策略中
最高分
。令人信服
结果表明,好人在这个博弈中可以胜出。
阿克塞尔罗德另
个术语则是“宽容”。
个宽容
策略只有短期记忆。虽然它也采取报复行为,但它会很快遗忘对手
劣迹。“针锋相对”便是
个宽容
策略,面对背叛时它毫不手软,但之后则“过去
让它过去”。第十章中
“斤斤计较者”则是
个完全相反
例子。它
记忆持续
整个博弈,永不宽恕曾经背叛过它
对手。在阿克塞尔罗德
竞赛中,有
个策略与“斤斤计较者”完全相同,由
位名叫弗里德曼(Friedman)
选手提供。这
个“善良”而绝不宽恕
策略结果并不算佳,成绩在所有“善良”策略里排倒数第二。即便对手已经有悔改之意,它不愿意打破相互背叛
恶性循环,因此无法取得很高
分数。
“针锋相对”并不是最宽容策略。
们还可以设计
个“两报还
报”(TitforTwoTats)
策略,允许对手连续两次背叛后才开始报复,这似乎显得过分大度坦荡
。阿克塞尔罗德算出,只要在竞赛中
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。