这里,们不关心某
个策略是否优于另
个策略。
们只关心哪个策略在与15个对手博弈后,最终赢得最多
“钱”。在这里,“钱”指
是赢得
分数。相互合作
奖赏为3分,背叛
诱惑为5分,互相背叛
惩罚为1分(相当于
们早先例子中
轻判),失败
代价为0分(等同于之前例子中
重罚)。
zsdjy3
无论是哪种策略,理论上它们能得到
最高分都是15000分(每
回合5分,15个对手共有200回合),最低分则是0分。不用说,这两个极端都没有实现。实际上,
个策略如果能超过15个对手中
平均水平,最多也只能获得比600分高出
些
分数。因为如果对手双方决定他们持续合作,每人在200场博弈中都能得到3分,总共便是600分。
们可以将600分作为基准分,将所有分数表达为600分
百分比。这
算来,理论上
最高分将是166%(1000分)。但事实上,没有任何
个策略
平均分超过600分。
要知道,竞赛中博弈者并不是人类,而是计算机事先设定好
程序。而基因则在这些程序
作者里事先设定
“程序”,使得它们身体力行地扮演同样
角色(想想第四章中
计算机对弈与“仙女座”超级计算机)。你可以将这些策略想象成这些作者
微型代理。虽然
个作者原本可以提交
个以上
策略,但这其实是作弊,这表示作者将在竞争本身中加入策略,使得其中
个角色从另
个角色
牺牲中得到合作
好处。阿克塞尔罗德应该不会接受这
点。
交上来有
些很聪明
策略,当然它们远没有其作者聪明。然而,最后胜出
策略却是
个最简单
、而且看起来最不聪明
个。这个策略称为“针锋相对”(TitforTat),它来自多伦多
位著名心理学家和博弈学家阿纳托尔(AnatolPapoport)教授。这个策略在第
回合时采取合作行动,然后在接下来
所有步骤里,只是简单复制对手上
步
行动。有
“针锋相对”策略
博弈将如何进行呢?
如寻常,下
步
出牌完全取决于对手。假设另
对手也选择
“针锋相对”
策略(每
个策略不止与其他14个对手竞争,也与自己本身博弈),双方都选择以“合作”而开场。第二步中,双方都复制对方上
步
策略,仍然采取“合作”。这样,博弈双方持续合作,直到游戏结束,双方都能获得100%
600分基准分。
那,假设“针锋相对”
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。