AI预测的2018年世界杯为什么不靠谱?
读趣百科>科普>小知识

AI预测的2018年世界杯为什么不靠谱?

以下是我们从人工智能预测2018年世界杯结果的失败中学到的东西。

2018年世界杯于7月15日周日结束。法国成为世界冠军,随后是克罗地亚和比利时。就像之前的2014年世界杯一样,许多研究人员试图提前预测俄罗斯比赛的结果。今年,国际足联的2018年世界杯也不例外。研究人员和科学家正试图使用人工智能和统计数据来预测64场世界杯比赛的结果,但是它有多可靠呢?

在这篇文章中,我将讨论人工智能在预测2018年世界杯结果方面的表现。不管你是否是人工智能专家,我都会尽最大努力让这篇文章易读。

有许多方法可以预测世界杯的结果。一种方法是根据队伍的能力和获胜的机会来模拟和比较所有成对的比赛。蔡利斯、莱特纳和霍尼克(2018)使用了相同的技术。他们预测巴西以16.6%的概率赢得2018年世界杯,其次是德国(15.8%)和西班牙(12.5%)。

瑞银还预测了三个团队的排名,但顺序不同。他们预测德国(24.0%)是冠军,其次是巴西(19.80%)和西班牙(16.1%)。该模型基于四个因素:一是Elo评分系统的评分;第二是该队在世界杯前的表现。第三,该队在前几届世界杯比赛中取得的成绩;第四,主场优势。

该模型通过10,000个蒙特卡洛模拟来校准,以确定该队的获胜概率和最近五场比赛的结果。

2018年6月8日,来自德国多特蒙德科技大学、比利时根特大学和德国慕尼黑科技大学的四名研究人员(A. Groll等人)发表了一篇关于2018年世界杯结果预测的研究论文。他们使用著名的人工智能算法:随机森林和泊松排序算法。6月14日,这篇文章在俄罗斯和沙特阿拉伯之间的世界杯开幕赛之前发表在网上。他们使用的数据集可以涵盖过去四届世界杯(2002-2014)的所有比赛。他们预测西班牙将成为冠军,其次是德国和巴西。三项研究都提到西班牙、德国和巴西是顶尖球队,但顺序不同。他们使用了三种不同的方法,数据和数据特征,但预测结果几乎相同。现在世界杯已经结束,我们可以看到,所有这些模型都没有正确预测世界杯的结果,也没有任何预测实际发生。

在这些研究中,格罗尔等人的研究方法是我最喜欢的。首先,他们使用了一个很好的数据源。其次,他们考虑了许多训练特征和参数。第三,他们采用了随机森林算法。在本文的其余部分,我将讨论它的数据特征、错误以及在这方面失败的原因。

数据特征

A.Groll等人考虑了与团队本身相关的各种特征,例如:经济因素(人均国内生产总值、人口);体育因素(奥多塞特概率、国际足联排名);主场优势(东道主、洲、联盟);团队的结构因素(每个团队的最大成员数量、平均年龄、冠军联赛球员数量);团队的教练因素(年龄、任期、国籍)。总的来说,他们总结了每支球队和每届世界杯的16个数据特征作为考虑因素。

分类模型

正如我前面提到的,他们使用了“随机森林”的方法,这是人工智能和数据挖掘中众所周知的算法之一。该算法基于“决策树”。在许多情况下,决策树在数据分类方面表现出更高的性能。他们还使用泊松模型根据团队当前的能力对团队进行排名。

预报

在完成100,000场模拟比赛后,西班牙有望以28.9%的几率成为冠军,其次是德国(26.3%)和巴西(21.9%)。

错误

正如我们在2018年世界杯上观察到的那样,预测领先地位的球队都没有进入半决赛,更不用说决赛了。根据世界杯的实际结果和预测,模型的均方根误差(RMSE)和平均绝对误差(MAE)计算如下:

RMSE:8.052

MAE:6.468

这两个指标显示了模型的误差和它能准确预测团队排名的程度。RMSE和MAE都有很高的价值,这使得模型不可靠。尽管该团队使用了16个特征和大数据集(从过去4届世界杯收集的数据),人工智能机器学习(尤其是随机森林)仍然不能可靠地预测结果。在本届世界杯上,俄罗斯、日本和伊朗的表现明显好于预期,而德国则未能晋级。

为什么人工智能会失败?

在人工智能和机器学习中,拥有合适的数据用于训练和建模是非常重要的。然而,在这种情况下,尽管有适当的数据、相对较大的数据、良好的算法和正确的参数,训练模型仍然表现不佳。失败的原因在于我们预测的事物的性质。

像任何其他以人为基础的事件一样,国际足联世界杯依赖于比赛前(不仅仅是16分钟)和比赛中(至少90分钟)太多的因素,这些因素被称为混杂变量。为了正确预测结果,每场比赛的每一分钟都应该被模拟。每个状态的结果取决于之前的状态。这也被称为马尔可夫链过程。

不正确的模拟状态很容易导致比赛状态中不可靠的结果。

除了内部因素,足球比赛的结果也可能受到一些外部因素的影响,如裁判不公、天气、政治形势、球员个人问题等。这些重要特征通常很难测量和收集。此外,勘探总是有机会和不确定性。例如,一个关键的错误或自己的目标是不容易预测的。简而言之,随机和动态的环境,如国际足联世界杯或人类活动是人工智能技术今天不能很好工作的领域。这是一个很好的例子。我们必须注意人工智能在类似动态领域的适用性。此外,由于非常复杂的数据结构,很难检查训练过的模型是否有任何潜在的偏差。人工智能中的偏见会导致针对特定群体的歧视性决策。把这种预测系统作为唯一标准的决策者可能对个人和公司有很大的影响。建议政府和企业只使用人工智能作为随机动态环境预测的辅助决策平台。

最新小知识科普

数学探险故事之荒岛历险8(派遣特务)

米切尔点点头说道,“我明白了。从最右边的2开始,索引依次加1,然后每个项目乘以二进制数的相应项目,然后加在一起。罗科竖起大拇指说:“你真的很棒。你能挺过去的。”...
展开详情

法令纹贴有效果吗

法令纹贴是有效果的,只不过效果是微小的,需要长期使用,不经常使用的话是没有效果的,每个人的皮肤都是不同的,所以法令纹贴给出的效果也是不同的,每天晚上都需要坚持使...
展开详情

发际线不整齐怎么办

发际线如果不整齐可选择毛发移植来修复,也可用刘海来挡住,还可以用眉粉或眼影来修饰。其中移植毛发可以彻底解决发际线不齐的问题,用刘海或者眉粉也可以完美的修饰,然后...
展开详情

微笑唇和m唇的区别是什么

微笑唇和m唇这两种唇形比较类似,但是还有一些区别的,微笑唇的主要特点就是嘴角微微上样,看起来在微笑非常可爱,m唇顾名思义,嘴唇的形状是m形的,也就是我们的上嘴唇...
展开详情

适合放车上的蓝牙音响

蓝牙音响的使用场景是很多的,除了家中、户外之外,我们还可以将它放在车里,既然是防在车上,就需要具备一些特性,比如外观精致、连接稳定、音质良好、摆放稳定等等,需要...
展开详情

bragi耳机是什么牌子

bragi耳机来自于德国的BRAGI品牌,bragi是世界上比较出名的耳机品牌可以与苹果耳机相媲美,音质超级完美。目前,bragi已经推出完全无线耳机,当然,无...
展开详情

雪本诗从哪看生产日期

雪本诗护肤品包装以及瓶身上并没有标注生产日期,因为雪本诗是德国的护肤品牌,而欧盟规定的是只有常态保存日期少于3年的产品才必须标注生产日期,雪本诗瓶身上仅印有生产...
展开详情

全站仪可以测高程吗

全站仪可以测高程。不过实际应用时,除非在特殊情况下,比如没有其他的测高程设备,否则是很少会用全站仪测高的。全站仪是一种很全面的仪器,它既可以测量角度,也可以测量...
展开详情
热门推荐

岩须

别名:长茎岩须、雪灵芝、水麻黄、八股文绳、草灵芝、灵芝、水灵芝、铁刷柄分类:灌木和花科和属:被子植物,被子植物的双子叶植物,杜鹃花科,杜鹃属,紫草属花期:春天引...
展开详情

圆叶椒草

别名:分类:多年生草本花卉科和属:胡椒科花椒属,胡椒科,植物界双子叶种子植物科花期:不开花钝叶胡椒的引种钝叶胡椒的直立植株约30厘米高。单叶和互生,叶椭圆形或倒...
展开详情

大龙冠

别名:太平球龙冠分类:仙人掌科和属:石竹科仙人掌科仙人掌,植物界被子植物科双子叶植物花期:夏季大龙冠简介大龙冠是该类中最具吸引力的物种之一,刺是所有天体中最强的...
展开详情

27寸曲面屏意义大吗

27寸用曲面屏的意义不是非常大,但具体要看主要用途,比如玩射击类、普通网游时选曲面屏的意义就很小,但是玩有些3A大作时曲面屏还是非常不错的。通常大一点的屏幕用曲...
展开详情

志高加湿器质量怎么样

志高加湿器的质量是比较稳定的,属于质量还不错价格很实惠的产品。它的加湿器优点是加水的时候很方便,出雾量很好控制,加湿的速度很快,而且很耐用,适合家庭或办公室用。...
展开详情