文 | DoNews 小不董
编辑 | 李信马
阿根廷惨案新鲜出炉,天台上挤满了梅西粉丝。
这场比赛无愧世界杯历史上最大的冷门之一,沙特队什么水平?我们国足世预赛都能踢个 1-1 好吧?你梅球王的第五届世界杯,全世界都以为是来创造历史的,结果历史是创造了——阿根廷世界杯史上首次输给亚洲球队?
沙特直接举国放假,全民狂欢,庆贺来之不易的胜利了!
这个事情,懂点足球的人不太理解,很懂足球的人更不理解,后来,熬夜加班(看球)的DoNews编辑组发现,其实AI也不理解。
作为科技发烧友,DoNews是不屑于听专业人士赛前分析的——主要是也听不懂——但我们相信科学。统计学早早就被纳入了对体育赛事的分析中,看不懂比赛数据,都不配说自己是真粉丝。而在预测比赛结果上,统计学还只是辅助人进行分析,人工智能却坚实的迈出了替人决定的一步。
2014年世界杯,谷歌、微软还有中国的百度等公司,就通过人工智能对世界杯进行了预测;2018年,华为云据说成功预测了64场比赛中的40场。除了科技公司外,咨询公司、学术机构甚至个人爱好者,不乏用人工智能对世界杯进行预测的,至于成功率嘛……
华为云那不到2/3的命中率,都值得拿出来炫耀,就可以知道大概水平了。
2016年,AlphaGo都可以击败李世石了(围棋也是体育,脑力运动),为什么预测足球比赛还这么不准?2022年了,现在的AI更聪明了吗?
一、测不准,是机器蠢还是人的问题?
在DoNews准备对这个问题进行探究时,遭遇了一件尴尬的事情——今年大厂们不预测了。
DoNews联系了包括百度、阿里巴巴、腾讯、华为云等国内人工智能实力靠前的科技公司,但都明确表示今年没有世界杯预测的项目,不过,功夫不负苦心人,我们意外的发现,百度的“干儿子”——爱奇艺,今年却上线了这一项目,描述完全符合我们的标准,并且单场比赛预测收费88元(8800爱奇艺豆)。
图片来源:爱奇艺
当看到历时2年多、数亿万次的数据等字眼,尤其是单场88元的价格(64场全部解锁足足要5632元),让DoNews深感贵有贵的道理,信任油然而生。
然后,爱奇艺AI对阿根廷和沙特比赛结果的预测是:阿根廷胜,最少赢两球……
摔!就这?有一点谱吗?而且连着后面一场也预测错了。
对于这个情况,DoNews尝试联系了爱奇艺,但对方不理我们……
不过,从他们的说明中可以看到,爱奇艺的AI大数据推荐,是通过数据建模机器学习进行预测的,巧了,这个就在DoNews的知识范围内了。
机器学习通俗的解释,是给计算机数据,让计算机从数据中不断学习,最终可以通过数据分析做出最佳决策和预测。读者们可以简单理解为,就像往锅里扔上一堆食材(数据),煮上半天(算法训练),菜就做好了(预测)。
对预测世界杯来说,机器学习再适合不过了,毕竟找到以往的赛事数据,包括胜负、进球数、当时球队的国际排名,甚至队员的个人数据并不难(感谢现代体育界对数据的重视)。
用到的机器学习的算法,DoNews推测大概率是随机森林算法(Random Forests),在DoNews找到的资料中,用随机森林预测世界杯比赛结果的团队占到了多数,包括但不限于2018年世界杯时的华为云还有麻省理工学院,出于对读者知识水平的信任(有些枯燥且占用篇幅),算法就不进行具体解释了。
不过有趣的是,用到了同样的算法,使用相同的历史数据,但不同的团队得出来的结果却是不一样的——有的相对准确一些,有的可能很离谱。
这也是人工智能的一个特点:算法、算力和数据三要素中,最终决定效果的,可能是最基础的数据。数据的数量和丰富程度,决定了机器学习的效果,具体可以分为目标值和特征值,可以理解为比赛结果(胜负、进球数等)和可能的原因(球队排名、球员年龄等),然后让机器自己找联系做推断。
假如有人想预测本届世界杯的首场比赛——卡塔尔VS厄瓜多尔,他用的数据是历届世界杯揭幕战的比赛结果,特征值是球队是否是东道主。那么机器可能会惊喜的发现,东道主还没有输过揭幕战,于是预测卡塔尔赢定了!
但看过这场比赛的读者应该都知道,本届卡塔尔创下了另一个世界杯记录——过去92年来唯一首战输球的东道主。
这就是数据在机器学习中的重要性——马儿能不能跑,要看马儿吃什么草。机器学习预测的准不准,根本原因还在人的身上。
回到爱奇艺的预测结果,对世界杯的预测,既可以预测胜平负,也可以预测进球数,对于这场比赛,爱奇艺非常谨慎的没有给出胜负的判断,只给出了总进球数不超过3的判断,但AI还是认为,厄瓜多尔的胜率更高,从这一点来看,AI比起迷信“东道主首战不会败”的玄学或经验主义要靠谱很多了。
当然,AI会认为阿根廷至少能赢两球也可以理解,毕竟在此之前,阿根廷队可是连续36场不败了。这也是博彩公司的共识,赛前沙特赢球的赔率高达23.00,而阿根廷赢球的赔率低至1.11。体育数据公司 Gracenote 曾预测,沙特获胜的概率仅为8.7%,
考虑到历史数据都一样(国家队的比赛数据),不同团队预测结果的差别应该是来自特征工程,华为云之前对分析每场比赛的胜平负,选用的特征数据是每场比赛两个球队的国际足联排名、Elo评分之间的差值。而热衷于预测世界杯的高盛,至今对冠军的判断就没对过,可能的原因就是他们选用的少量特征集中在球队和球员表现上,却忽视了很多实际存在的客观因素,比如主场优势、球队结构等。
因为无法联系到爱奇艺的研究团队,所以DoNews也不确定,他们的模型更重视哪些特征,最终影响了对比赛结果的预测。但是,可能是预测偏差太大,对于这场比赛的预测,爱奇艺给删除了……
咱就说,至于吗?
二、AI反买,别墅靠海?
虽然DoNews是很相信科学的,但赌球这件事情,AI可能真的靠不住。
目前爱奇艺预测了8场比赛,正确5场,错误3场,62.5%的准确率,居然和华为云2018年时达成了惊人的一致!
不过严格来说,可能爱奇艺更好一点,因为据华为云官方表示,他们会根据比赛结果不断调整预测模型,来提高预测准确性。“16强对阵确认了以后,华为云MLS就准确的预测了冠军是法国”——合理猜测是之前没猜对,直到最后全部预测的准确率才提高到了62.5%。
世界杯进程才刚刚开始,之后爱奇艺的预测准确率还有不小的提高空间,也许能趁着其他大厂缺席,打破国内科技公司的记录。
但是,对AI的期待还是不要抱太高,毕竟足球场上意外的因素实在太多了,就说最近两场亚洲球队的比赛,沙特门将穆罕默德·奥韦斯的身价仅仅70万欧,在球场上简直“杀疯了”,就连误伤队友也透着“队友祭天,法力无边”的霸气,帮助沙特队守住了胜利;而威名赫赫的“伊朗国门”阿里雷扎·贝兰万德,开场不久就被队友误伤离场了……
谁家的AI能预测出这个啊!
并且还有一个问题,AI猜得准的比赛,大概率赚不到什么钱……比如昨天买阿根廷赢,下注十万,赢了也就能赚一两万,但输了可是真的血本无归。
可能是痛感各种预测方法的不靠谱,“反买流”在部分球迷中颇为流行。比如说,贝利是个“乌鸦嘴”,他说哪支球队要赢,反买!高盛说哪支球队是冠军,反买,别墅靠海!爱奇艺说阿根廷要大胜两个球以上……
虽然看起来不太靠谱,但的确总是有“幸运儿”出现。DoNews编辑部经过努力,找到了两位昨天押对了比分的幸运儿,不过当询问他们为什么这样买时,才发现真的是全凭运气,毫无技术。“小7”买了不到200块的体育彩票,大部分还是买阿根廷赢的,结果10块钱买的一张彩票,直接赚了850元。
还有一位女生,是在朋友圈看到有代下单的,出于好奇就随机下了50块,还因为途径不正规被扣了400块,“我就下了50块,哈哈哈,多了我也没有,剩下20吃饭”。
DoNews也在周围的体彩店进行了询问,有老板表示,昨天有一位幸运儿,中了“8000多”(应该是买了100块刚好压中)。
但这样的幸运儿还是太少了,而且没什么规律性,难以复制,“反买”还是调侃居多。DoNews咨询了一位从2014年巴西世界杯就开始买足彩的自身球迷,那一年她赚了三四千块,不过2018年就赔钱了,“因为德国等几场爆冷,亏了”。现在她已经不再买彩票了,除了对比赛不像以前那样感兴趣外,也是发现自己看的体育博主“都不是很靠谱,没什么好推荐的”。
在爱奇艺提供的服务中,除了88元的AI大数据方案外,还有更加昂贵的专家方案,单场比赛全部解锁的价格就高达1288元。且不说准确与否,这个价格……要下多大的注才能收回成本啊?
至少DoNews认为,专家如果对自己的预测非常肯定,那赚钱最快的方法就是自己下注,92年的世界杯历史中,预测“翻车”的人类专家可太多了。“机器专家”虽然看起来更科学一些,但“久赌必输”的定律,也不是现在88块的AI服务就能逆转的。
相比之下,有些玄学的确更吸引人,比如8场世界杯预测全中的章鱼保罗,还有“乌鸦嘴”贝利,免费为球迷们增添了许多快乐。游戏品牌 EA Sports 的预测方式也格外有趣,他们在游戏 FIFA 23 中反复模拟这64场比赛,来预测实际的比赛结果,颇有虚拟照进现实的科幻感。据说 EA Sports 此前成功预测了此前三届的世界杯冠军得主,不过,他们11月9日宣称梅西率领的阿根廷队将夺得大力神杯,以目前的比赛结果来看,搞不好今年的预测也要翻车了……
评论