相信很多人都遇到过这么一种情况,自己下了课或者下了班,想打开电脑爽两把游戏,结果每把都能遇到几个神人队友。

在LOL里遇到猫咪打野,在CS里遇到夕阳红大狙,在三角洲里野人队友活得像是个阿萨拉士兵,在PUBG里野人队友落地挂机。

为了赢,你喊来了好哥们开黑。结果游戏二连坐,越打越沉默,最后梦里还在复盘赢一把为啥这么难。

一个人面对这种情况,他会手足无措。一千万个人面对这种情况,那他们就会认为这是种特殊现象。

这种特殊现象的成因究竟是啥,可能没有太多人会深究。不过经历了玩家间口口相传之后,人们会下意识的归因为三个字——Elo。

估计大伙不太清楚,喷Elo这事,不是这两年的习俗,而是玩家间源远流长的传统。

英雄联盟在北美公测的次年,也就是2010年,顶不住Elo的外国老哥就发明了一个词——Elo地狱(Elo hell)。它用来形容玩家被困在某个分数,你可以简单理解成咱这边常说的青铜天坑。

之后几年,伴随电竞的发展,Elo地狱这个词也逐渐破圈,被玩家用在任何一个PVP在线游戏里。

不过Elo地狱在玩家间也存在争议,有人觉得是游戏厂商故意搞事,也有人认为纯粹是自己运气不好,两拨人互相辩论了十几年。

如果没啥意外,双方估计会一辈子相爱相杀下去。然而2023年7月,V社在更新dota2 7.33版本时,把盖子给彻底掀开了。

原文太长就不念了,总之大概意思是:Elo地狱是真实存在的。

毫无疑问,V社的“官方背书”,算是把Elo的热度添了一把火。哥几个喷起来,也更加起劲了。

打刀塔的老哥,排位总是上不去,最黑的时候,打出了十连跪的战绩,好像系统要把他锁死在这个分段。那咋办,只能Elo背锅。

另一位LOL手游玩家,选人的时候发现队友玩亚索辅助,自己还选了惩戒虚弱摆烂,除了在野区打野,就是泉水挂机,结果还赢了。这下更证明了Elo在发力。

有人不信邪,贴出了自己在LOL连胜的战绩,认为Elo压根就不存在。

结果网友直接沿着ID倒查,贴出了楼主连败的对局信息,帖子下边充满了快活的空气。

随着关于Elo的海量案例席卷网络,Elo的名声也越来越臭。

它成了一种平衡胜率的邪恶工具,被那些无能的厂商操控,用来把玩家的胜率卡在50%左右。背后的一切就是为了让你像一头永远拉磨的驴,在游戏里日复一日为上分而努力,从而保证游戏日活人数。

为了实现这一目的,万恶的Elo,常常会在匹配时做手脚。于是乎,你发现被自己乱杀的人正在乱杀自己的队友,一想到两拨人里有一拨人必然会赢,你就感觉浑身难受。

面对Elo,玩家的行为简直是八仙过海各显神通。

有人发帖狂喷,渴望厂商赶紧调整;有人搞起了玄学,通过在排位上分前先在匹配局输几把,或者开始游戏前先少充点钱的方式避免被Elo波及;还有的高手直接卡起了Elo的bug上分,他还光明正大的做了一整套教程,手把手教你从养号开始躺到高段位……

看了这么多案例,被玩家的各种行为洗礼,就算你是个路人,心里估计也感觉Elo不是啥好东西。

但是,让你玩游戏玩到痛苦面具的真是Elo吗?

想要搞懂这个问题,你首先得搞懂,Elo到底是个什么玩意。

Elo的名字,源于匈牙利裔美国物理学教授阿尔帕德·埃洛(Arpad Elo),这位出生于1903年的00后老爷子特喜欢国际象棋,棋瘾比公园老大爷还大。

他没少参加各种比赛,而且还八次拿下了威斯康星州冠军,成为了第十一位入选世界国际象棋名人堂的成员。

20世纪50年代左右,国际象棋开始出现了等级分系统,不过埃洛却感觉当时的等级分系统有问题,它会导致结果和真实情况出现错位。于是埃洛在1959年着手研究等级分系统,最后推出了沿用至今的Elo。

也就是说,整套Elo系统的唯一目的,就是科学的给选手实力打分。

我就不详细展开它有多科学了,因为这玩意超级复杂,给你上两张图你就知道了。

这是Elo系统有关的符号和公式,简单机翻了一下,我想大伙应该没啥兴趣听我上数学课吧。

当然,为了搞清Elo的基本原理,我们需要了解两个公式。

第一个公式用来计算玩家的获胜概率:

其中Ea代表和玩家B的对局中,玩家A的获胜概率。Ra、Rb代表玩家A、B的当前Elo分。

举个例子,我的Elo分是2000,你的Elo分是1500,带入计算后就能得出我的胜率是0.94,哥们碾压局。

第二个公式用来给出对局结束后玩家的新Elo分:

Ra’代表对局结束后玩家A的新分数。Ra代表玩家A在对局前的Elo分。S指“得分”(Score),它是个固定值,1代表胜,0代表负,支持平局的游戏里,S也可以是0.5。

K有点特殊,它是一个可以调整的常数,K值越大,分数变化越快,反之同理。

原因嘛,可以用LOL举例。

你是个刚能打排位赛的萌新,这时K值就比较大,因为游戏需要通过分数的剧烈波动,快速定位你的真正水平。

反过来,你是个干死了无数只提莫的峡谷老玩家,那K值就很小。因为游戏在过去已经知道你的水平,它现在的主要目的是给出一个相对稳定的结果。

现在,我们套用第一个公式里的信息:我的Elo分是2000,你的Elo分还是1500,我的胜率Ea是0.94。

K值按国际棋联的标准,设为普通选手级别的20。所以,我在战胜你之后,Elo分来到了2001.2分,因为系统判断我是在虐菜,所以只给我加了1.2分。

与此同时,使用了Elo机制的比赛,通常会给新玩家一个基础分,比如1400分。

所以我们可以发现,知道了能用来赛前预测的公式一,以及赛后调整的公式二,再加上人人都有的基础分,那Elo这套打分系统就可以运作。

恭喜你,到这一步,你已经搞懂了Elo的基本逻辑。

看到这,你可能会觉得,能科学且全面的给选手打分,Elo还真是个好东西,得学啊。

但就像是埃洛发现旧等级分系统存在bug一样,随着时间的推移,Elo系统也开始出现了问题。它没有考虑到某些特殊情况,例如棋手短时间内的实力突飞猛进,以及顶尖棋手为了少丢分而选择和棋。

所以现在的Elo其实已经根据现实需求迭代过,只是核心的逻辑没有变化罢了。

了解以上的内容后,我们再去看看游戏圈里的Elo。

电子游戏和国际象棋一样,追求的依旧是博弈。尤其是2000年后,PVP游戏开始大流行,电竞成了时代的风口。给玩家的技术水平打分,就成了游戏们也绕不开的一步。

当前游戏界常见的评分系统,有Glicko、TrueSkill、Elo等。

Glicko相当于Elo的改进版,主要是引进了等级分偏差和等级分波动性σ两个概念,它解决了玩家等级分可靠性的问题。你可以理解成回坑老玩家等特殊情况下,打分会更准确。

使用Glicko的游戏有CS2、刀塔2、斯普拉遁2等

TrueSkill则是由微软开发,它为比赛涉及多名玩家或团队的在线游戏而设计。

它和Elo就不太一样了,TrueSkill引入了平均值和不确定性。简单来说,这个评分系统考虑到了不同玩家的运气。

使用TrueSkill的游戏有光环、战争机器、极限竞速、彩六等

Elo就更不用多说了,它更是被广泛使用,比如曾经的英雄联盟。

2009年,拳头的游戏设计副总裁在论坛里发过一篇帖子,里边明确提到了LOL采用了改良版的Elo系统。

和原本的Elo相比,改良版还会计算对局里团队的Elo值。

聊到这,比较敏感的朋友可能意识到问题出在哪了。

那就是本服务于1V1对战的Elo,与团队竞技游戏结合后,会让匹配出现巨大的不确定性。

为啥这么说呢,咱先看看英雄联盟的早期匹配系统,这里可以拆分成三步:

首先看你是不是组排,如果是组排那就给你排更强的对手,因为组队本身就是一种优势。

接着系统会为你安排分数贴近的玩家。不过随着排队时间变长,匹配范围也会越来越大,毕竟大伙都想尽快开始游戏。

最后,系统会把排到一块的玩家分成两只队伍,尽量让胜率维持在50%。

不难理解吧,很多游戏的匹配系统都是这个思路。

我个人的理解是,基于这套被广泛使用的匹配逻辑,当一个人连胜后,系统会判定你处在超过当前段位的游戏水平,也就是你的Elo分突然高了一截,然而你的游戏对局,却又要和你当前的段位相匹配。

这种情况下,为了保证双方队伍都处于50%的胜率、团队水平分相近,你们这边就要塞几个水平相对较低的队友,用来抹平你那个夸张的当前水平分给团队分带来的水分。

所以位于当前段位的你,会明显感受到队友实力弱于当前段位、游戏体验极差——这就会给你一种“Elo”的感觉了。即便如此,玩家狂喷的“Elo”是否真实存在,还是个未知数。

比如那个年初在韩服疯狂上分,胜率92%的AI玩家,最后被人发现是职业选手。

当然,这个案例可能比较特殊,不过普通玩家也有人实验。2024年,一位钻石大师水平的玩家,借了朋友的10年黑铁号,通过10多天的100把对局,得出了100局72胜28负的结果,段位冲到了黄金一,经常排到白金翡翠。

他很明确的给出了结论:游戏不存在Elo👇

说实在的,一个游戏有没有用Elo,对玩家来说并不重要。

就像2024年就有报道说拳头公司把Elo改为TrueSkill2评分系统,刀塔2也把Elo改成了Glicko,根本无人在意,人们只是觉得玩的很不爽,于是发帖开喷。

在线游戏里,匹配到的其他玩家本来也是出气筒,顺风聊家常,逆风聊家长

那些不可预知也不可控的逆天队友,更是容易放大玩家的愤怒。如果说你玩单机游戏时,游戏体验垃圾给你的愤怒值是1,竞技游戏时体验垃圾给你带来的愤怒值,可能会直接飙到10。

猫咪打野和起狙就送的神人,他们 成了显眼的靶子,在这一刻恰好用来接住你愤怒的子弹。

所以,“Elo”问题能解决吗?

我只能说,至少在当前,应该没有任何一家游戏公司可以彻底解决这个问题。

从设计角度看,游戏的评分和匹配其实已经在尽力做到了公平。它只是太过理性,因为判断你某段时间很强,于是就给你塞点笨蛋队友拖后腿,拉低团队分。

而玩家在玩游戏时最不需要的就是理性。大伙只是想要一种体感上的公平,也就是实现高手对战、菜鸡互啄。

可这么做还是存在问题。举个最简单的例子,你在LOL、刀塔、CS里是否愿意为了匹配到实力完全相近的九个人而苦等15分钟?

我想很多人在匹配时间超过30秒,就会怀疑游戏服务器是不是出毛病了。更何况,玩家实力过于相近,会让每把的游戏体验类似,十分无趣。一款游戏被贴上无趣的标签,那它就要完蛋了。

其实说白了,大伙所讨厌的Elo,在游戏厂商看来,压根不是啥纯纯的坏种。它能最大程度调动玩家情绪、吸引玩家高频参与游戏、并尽力维持游戏胜率。

或者换个更简单的说法,那些没人说用Elo的游戏,有几个比被玩家狂喷Elo的“垃圾游戏”火?

至于大伙是否同意厂商的观点和做法,那就是另一码事了。

我们可以知道的是,一段时间内,所谓的“Elo”不会消失。

但对那些厌恶Elo的朋友而言,我有一个绝妙的法子,那就是暂时放下鼠标,挪开键盘,站起身来,看看远方的雪山吧家人们。

图片、资料来源

www.invenglobal.com/articles/19356/what-is-eomm-in-marvel-rivals

web.cs.ucla.edu/~yzsun/papers/WWW17Chen_EOMM

www.pubnub.com/blog/skill-based-matchmaking-explained/

web.archive.org/web/20200309232416/http://forums.na.leagueoflegends.com/board/showthread.php?t=12029

gwern.net/doc/statistics/order/comparison/1978-Elo-theratingofchessplayerspastandpresent.pdf

handbook.fide.com/chapter/B022017

mattmazzola.medium.com/understanding-the-Elo-rating-system-264572c7a2b4

www.fide.com/new-fide-rating-and-title-regulations-come-into-effect/

en.chessbase.com/post/what-s-wrong-with-the-Elo-system

dl.acm.org/doi/epdf/10.1145/3539597.3573023

www.dictionary.com/culture/pop-culture/Elo-hell

syncaine.com/2010/09/20/welcome-to-Elo-hell/

www.dota2.com/newfrontiers?l=schinese

us.forums.blizzard.com/en/overwatch/t/Elo-hell-what-is-it-is-it-real/931894

cloudvstheworld.wordpress.com/2015/09/06/Elo-hell-is-not-real-and-you-need-to-stop-kidding-yourself/

leagueoflegends.fandom.com/wiki/User_blog:Madness_Incarnate/The_Mathematics_and_Psychology_behind_%22Elo_Hell%22

www.reddit.com/r/leagueoflegends/comments/rj946/why_the_Elo_system_is_demoralizing/

www.unrankedsmurfs.com/blog/change-to-trueskill2

game-tournaments.com/en/lol/news/54509

www.glicko.net/glicko/glicko.pdf

lichess.org/forum/general-chess-discussion/glicko-2-rating-system-vs-Elo-rating

www.microsoft.com/en-us/research/project/trueskill-ranking-system/