一、用博弈论分析竞技游戏中的不合作现象
笔者尝试过射击,MOBA等类型的多人在线竞技游戏,私以为,在系统匹配的对局中遇到放弃配合的队友的情况不在少数。在当今游戏模式固化的大趋势下,不配合带来的消极体验是在线人数减少的重要原因。
本文的目的,主要是找到使得不配合现象存在的客观原因,探讨如何设定规则可以尽可能地避免这种不愉快出现而不是适得其反。
几乎在大多数要求配合的游戏中,角色/位置都会有两个趋势:
1.适合单打独斗的角色
2.配合能力更佳的位置
表 1-1中形式如(X,Y)的项中,X表示玩家1的收益,Y表示玩家2的收益,纵向代表玩家1的选择,横向代表玩家2的选择。
简单解释一下:
有很大一部分玩家在游戏开始之前就决定好了自己要玩某个角色/位置(原因可能是熟练度/兴趣),在他们决定的时候因为游戏还没有开始,所以他们不知道他人的选择。
假设两个位置1相遇,两者游戏体验的收益都是-1,-1;
位置1和位置2相遇,他们的体验收益分别是3,-2;
位置2和位置2相遇,则两者的游戏体验是1,1。
那么在这个博弈中,玩家会发现,不论对方的选择是什么,自己选择单打独斗的角色总是比选择配合的角色要更好,也就是单打独斗总是优势策略,导致这个博弈的纳什均衡处在都选择单打独斗(-1,-1)。
这听起来令人感到沮丧,明明这些位置/英雄被设计出来就是为了加强玩家之间的配合,结果他们很少被人选取以至于对加强配合没有什么效果。
但这又是在一些情况下真实发生的事情。举例来说,在LOL排位中,选择上单位置,等待匹配成功的时间要比选择辅助位置,等待匹配成功的时间高出5-6倍。
辅助的胜率影响并不比上单位置低,结果却是辅助不受欢迎,原因就是辅助是一个幕后工作占多数的位置,考虑得更多,而收获的游戏体验更少。
一个比较典型的例子是LOL游戏当前版本的辅助英雄,时光守护者,基兰。基兰所有的伤害都是延迟的所以获得击杀的概率不大,相反他要随时关注队友和对手的状态,导致成本很大,以至于就算他的胜率在辅助中相当靠前,选取率也仅有0.1%。
玩家总是选择单打独斗的原因是,单打独斗总是优于配合。如果我们把上图改成如下形式,表 1-2,那么单打独斗不总是一个优势策略了。
纯策略纳什均衡单打独斗-配合(0,2)和(2,0)。混合策略纳什均衡点为
分别以50%概率选择单打独斗或者配合,期望收益为(0.5,0.5)。
如果这是一个单次博弈,则玩家较难达到纯策略纳什均衡,而更可能采取混合策略纳什均衡。
可以得出的结论是,不要让单打独斗的选项总是优于配合。
以上情况虽然普遍存在,但有一个比较重要的假设,就是双方都不知道对方的选择。
实际上,很多事情发生的都是有顺序的,比如说依次选择英雄,依次选择位置,我们拿出修改过的收益表 1-2:
如果玩家1能够让玩家2相信,自己已经选择了单打独斗且无法更改,那么玩家2只能配合他选择配合,尽管大家都选择配合更公平。
这样有顺序的博弈看上去可以提高玩家的整体游戏体验,然而又会带来另一个困扰:公平。
如果我们做出如下假设:
1.玩家行为可以转换,当获得低收益的玩家和高收益的玩家相遇,较低收益的玩家下轮可能将采取较高收益的玩家所采用的策略,概率视收益差距而定;
2.当玩家收益为负数时,玩家会有概率放弃游戏。
那么我们不难想到,在两个纳什均衡点(0,2)(2,0)会让大量选择配合的玩家转而选择让对方相信自己已经选择单打独斗且无法更改,而单打独斗的玩家遇到同类型的玩家时会受到负面体验从而放弃游戏,导致游戏的在线人数降低。
能得到的结论就是,仅仅让不配合的现象减少是不够的,因为哪怕一次的不配合现象都有可能让玩家放弃游戏。
如果能创造一个长期的配合,使这个博弈成为一个多轮博弈,让游戏参与者轮流承担低收益的一方,能让情况更公平。
在即时游戏中,很多情况下玩家没有办法在应付敌人的同时观察队友的行为,他们未必清楚队友的上一个决定,更不能确定队友的下一个决定。
因为配合不可能只有一次,所以这是一个多轮博弈,假设玩家有三种选项:
1.根本不打算配合,节省了考虑配合的精力。
2.到达一个可以配合的位置,如果队友主动配合就配合,否则不配合,因为观察导致1单位的利益损失。
3.主动发起合作,如果队友选择不配合就因为被卖损失5单位的利益,如果同时主动则因为技能重叠导致收益降低而只获得2单位的利益。
表达为表格形式:
如表3‑1所示,有三个纯策略纳什均衡点,分别是:
都不配合(-2,-2)
被动和主动(3,2)(2,3)。
在连续博弈中,玩家1想要达到(3,2)并不难,他只要让玩家2相信他会选择主动,并且主动选择一次主动就可以。只要做到这一点,玩家2很快就会意识到选择被动收益更高,就达成了平衡。
问题如下:
1.这不公平。
尽管都知道选择主动可以达成配合,它的收益优于不配合的平衡点,但双方都可能会寄希望于对方先选择主动而自己只以一定概率采取主动剩余采取被动,这会导致负面体验。
2.玩家无法确定对方的下一个选择,通常也来不及交流
一旦没有达到均衡点,玩家也就没有办法确定对方的下一个选项。例如都选择了主动到达(2,2)的位置,那么下一步将无法预测对方选择主动,被动,还是不配合,如果玩家选择了被动,对方甚至不知道该玩家是否选择不配合的决策,最终可能导致双方都不配合。
3.即时游戏会有失误率
有时候玩家决定主动/被动去配合,但由于失误,导致被误认为采取了不配合的策略,导致双方达成不配合的(-2,-2)均衡点。
结论:尽量多给玩家一些反应时间
当准备时间宽裕的时候,游戏就从即时游戏变成了策略游戏,博弈就从不知道对方如何选择的博弈成为一个完全信息的贯序博弈,虽然完全信息的贯序博弈仍然会有不配合的情况,但至少可以减少由于操作失误、无法预测导致的负面体验。
LOL为例,事实上几乎所有近年重做的英雄和新英雄都包含了那种威力大但是很明显的技能,比如说菲奥娜,亚托克斯,德莱厄斯,卡特琳娜的重做,新英雄如佐伊,瑟提,永恩,奥恩,莉莉娅等,都包含一些动画明显但威力大的技能(当然不仅仅是从配合的角度考虑,还有对抗双方互动的因素在内)。
因为加入了顺序,有了思考时间,所以可以把上一节中不配合的选项剔除。
如表4‑1所示,会有两个纳什均衡点,(2,3)和(3,2),选择主动仍然不总是一个稳定策略:如果对方选择被动,最佳策略是主动,而对方选择主动时,最佳策略是被动。
参与的双方可能因为谁做那个迈出第一步的人而僵持很久,这是的确存在的现象。比如说,在LOL中,谁先为资源争夺去做准备工作,在CS:GO中,谁做突破手,发生一段时间的僵持是比较常见的现象,尽管这些事件发生的速度足够玩家反应过来去配合。
也就是说,即使做到了先后顺序明确,依然可能会导致双方陷入僵持,而进入一个没有先后顺序、不知道对方这一次将如何选择的连续博弈。
他的单次博弈可以表示成表4‑2:
各个符号的意义如下:
c:都选择等待损失的游戏体验(在这里假设每次等待的损失相同)
v:合作带来的额外收益
x:后续博弈的期望收益
一旦进入这个博弈,意味着双方没有达成纯策略纳什均衡,在不能交流的情况下也不知道对方下一次选择的情况下,考虑混合策略纳什均衡。
假设对方采取等待的概率为p,混合策略纳什均衡存在于玩家不论如何选择收益都相等的点,即:
且
联立前三式可以求得
令c=1,以上两个函数的图像如图所示:
横坐标时争夺的利润v,细线表示函数,粗线表示函数,随着争夺的利润v增大,玩家采取不配合的策略的概率将越来越接近1,同时期望收益越来越接近0.5c。
令v=1,以上两个函数的图像如图4‑2所示:
坐标和函数意义同上。随着c增大,玩家采取不配合的概率减小,同时期望收益越来越接近v/2。
可以得出的结论是,想要减少不配合的现象,我们可以在不破坏玩家体验的前提下使得v尽量小,而使得c尽量大。
在前面几个情况里,我们都假设玩家和玩家的收益情况是相等的,事实并不如此。诚然,如果减少v使得,那么玩家就几乎不可能选择不合作的态度,不过这同时会让游戏变成一个强制玩家合作的无聊游戏,不仅仅是部分热衷于独行的玩家感到无聊,大多数玩家都会感到无聊。
实际上,玩家之间存在差异性,不同的玩家之间,他们合作带来的额外收益也不尽相同,一刀切只能是下策,最好是让玩家自行决定配合的程度和利益的分配。
我们可以用一个例子来比喻玩家之间讨论配合程度的过程,就是讨价还价。
假设一个商品,卖家进货价格为,买家的预算为,一旦开始议价,双方则须在这个区间里选择一点达成交易,即两人总共为v()的利润展开争夺。
假设卖家先提出一个分配方案,买家得到价格后有以下三种选项:
1.接受
买家获得收益,卖家获得收益
2.放弃交易
买卖双方各获得
3.继续议价
因为时间损失而造成的收益损失,又因为后续期望获得的后续收益。
买家也可以提出价格,卖家同样有如上三个选项。
在这个博弈中,可以看出,当双方的心理预期之差时,议价是一件浪费时间的事情;同样的把价格报的过低也是一个劣势策略,因为如果报价过低,对方不可能接受,只可能继续议价或者放弃购买(假设参与双方都理性,不会因为对方的报价而改变自己的预算/进货价格)。
那么我们可以把劣势策略:报价低于对方心理价位剔除,剔除之后放弃购买也成为一个劣势策略,因为接受或者继续议价的收益都高于放弃购买。
再把双方的报价设成固定值,这个博弈就可以简化成如下形式:
表 5-1和表 4-2其实是同一类型,我们已经证明了增加成本C或者减少争夺的利润V都可以促进他们采取妥协的策略,并且可以遇见在双方都理性、耐心,清楚对方底价的情况下,他们会选择合理地设置使他们相等,以求在第一次就达成平衡,避免繁琐的议价过程,所以他们也有合理的动机去设定。
可实际情况又是不同的,我们知道实际生活中买卖物品时,允许议价的地方,可以预见至少有以下情况会影响公平:
1.如果一方有急于达成交易的可能,那对手就可以选择压缩他的利益
2.参与人可以假装下达最后通牒,迫使对方以较低的利润达成交易
3.在参与人知道对方底价的情况下,可以谎报自己的底价向高处,最后达成一个对方认为公平实际不公平的价格。
所以一旦议价发生,双方往往需要一段时间来探索和证明对方是否耐心,心理底线在哪里,所说的是否是真的。
整个议价过程是一个丢不掉的包袱,除非你对价格不敏感。这个过程放到游戏中肯定是不理想的,因为重复测试是否有耐心本身就是一件让人失去耐心的事情。
最理想的情况,当然是双方的谈判的成本()都很高,并且如实地公布自己地底线(),那么就可以又快又公平地达成交易。
实际游戏环境中谈判成本C是有上限的,并且玩家的底价各不相同,让他们主动公布底价也不太现实,所以除了这两个方向,更切实的办法是,在游戏模式允许的前提下,适当地包容单人游戏的玩家,允许他们独自游戏,提高他们的收益,原因如下:
1.单人玩家的游戏体验如果变差,就可能会放弃游戏
2.让喜欢单人游玩的玩家单人游玩,可以提高寻求配合的玩家之间的配合概率
3.单人玩家的游戏体验变高之后,配合的收益就降低了。
我们可以这样做:
在开始的时候以较低的利益促进他们合作的积极性,然后逐步增加合作的利益。
经过以上分析,我认为要减少不配合现象,有以下几点要注意:
1.配合的收益不能总是低于不配合
2.让玩家多次合作而不是只合作一次后解散
3.合作要公平,在不破坏游戏模式的情况下让收益差距尽量小
4.让玩家清楚地知道对方的选择
5.提高不配合的成本
6.允许玩家议价,允许不配合的玩家单人游戏
邮箱:shijie-cai@outlook.com
二、博弈论沉思14红黑游戏及其启示
63红黑游戏
两人不能串通且完全理性的前提下,一定是每个人都追求自己的利益最大化而不会顾同伙的利益,并且双方又都不会相信对方的合作精神,最后的结果,只能实现对他们都不理想的结果(各判5年),即他们摆脱不了的“囚徒困境”。该结局也被称为“纳什均衡”,也叫非合作均衡。
红黑游戏基本上不会有赢家。没有人在这场游戏会感觉自己真正赢了,所有的人都在反思,为自己人生的盲点和误区,为人性深处的欲望,人与人组成的社会总是欲望与利益相纠葛。
64囚徒的救赎的启示
65竞争势态下的人性特点
生活本身就是矛盾的统一体。没有永远平静的大海,也没有永远波涛汹涌的大海。我们选择什么,不完全由我们自己决定,我们生存在一个现实的社会里,不是一个想像的空间。
我们必须面对现实,勇敢地参与到社会的竞争中去。我们想哭的时候,也许我们还得强装笑颜。我们笑的时候,也许我们心里在哭。你能说,我们就此放弃生存与生活吗?我们没有,我们是站起来了。因为活着,真好!因为世界总是美好的。我们总是有着美好的希望。对吧!
人生其实是很公平的,上帝会让你失去很多,也得到很多。
红黑游戏在某种程度上表达了现实生活中人对人的态度,让我学会“尽可能相信你的朋友或者合作伙伴,不要用恶意的想法去揣测对方”,在我们输掉比赛的同时却赢得同事之间的信任和支持。在现实社会中,每个人都有自己的路,选择好自己要走的路,选择好适合自己的一条路并朝着这个的方向一直不断的去努力,相信在输掉身边很多东西的同时赢得却是更宝贵的东西。
那么,马走日,象走田,你走哪呢?
红<>打败对方,致对方于死地,黑<>共同进步,绝对的信任,信任<>不争取个人的发展空间信任<>任我行不去与其它的同类产品生产商竞争团结<>不需要竞争竞争<>不需要团结现实商品经济或市场经济是:红+黑并存;团结+竞争并存。
66红黑游戏下的启示
出来混的,迟早要还。
如果对手的最佳利益是你输,而不是共同把蛋糕做大,你就必须学习《孙子兵法》,准备玩一场零和游戏了。至于如何在零和游戏中取胜,这并非是通过玩几盘红黑游戏就能解决的。
67我们怎么办?
当我们说社会堕落了,大家都不讲诚信了,很多人不要脸了,那这个大家,这个很多人,是谁?当我们在谩骂这个社会的时候,你是否想到,你在骂的对象到底是谁?
难道,这只是一种排除了“我”之后的大家,可是“我”其实还是大家的一部分。
因此,就正如我以前说的话一样,如果没有最初的革新者,吃螃蟹者,现实将不会有丝毫的改变,我们所处的情况将会越来越糟糕。
最后,我想借用的经营之神王永庆先生告诫劝勉陷入“囚徒困境”的人们(尤其是生意人):“帮助人家,最后受益的是自己,不要忘了考虑对方的利益,帮助人家,服务贡献,对方也会还报于你。这种道理很浅,大家也都了解,可现实是实行的人太少太少,我觉得很可惜。”
三、博弈论和纳什平衡是如何改变游戏的
利用对手策略改变自己的策划,达到胜利目的,就是博弈论的核心。
只要是对抗类的游戏都有博弈论的影子。简单的五子棋,难一点的象棋,围棋。lol,dota从ban选英雄开始就在进行博弈对抗了。根据敌方阵容选择打法,比如对面是各种后期大哥,那边就要选择速推的打法。
纳什均衡就是游戏的平衡性。做游戏都要保证游戏的平衡性,保证尽量多的纳什均衡。石头剪刀布其实就包含有纳什均衡。一个克制一个,不让一家独大,就是纳什均衡的精髓所在。以moba游戏为例,一个英雄非ban必选就破坏了平衡,放任就会影响游戏体验和寿命。
纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
个人觉得,主要看是应对的什么类型的游戏,如果是一些运营策略类的游戏可以考虑作用纳什均衡的观点寻求最优的方案以达到收益最大化,如果是一些冒险博彩类的游戏完完全全用的知识玩游戏的话会让游戏少一些搏一搏单车变摩托的乐趣,因为毕竟风险跟收益成正比的,风险越高收益也就越高