2018年俄罗斯世界杯正在如火如荼地进行,各种比赛的预测也很多。 就在前两天,看到一篇关于AI预测世界杯赛事的文章很受欢迎,于是我自己尝试了一下,但发现使用机器学习模型来预测比赛存在几个问题。 。

● 第一:以国家为主体来预测听起来没问题,但球员的职业生涯最长可达15年,所以各队的球员实际上是在不断变化的。

● 第二:即使球队的球员是固定的,那么也只能用过去15年的比赛作为样本。 32支球队过去15年没有多次交手,无法满足机器学习样本量要求。

于是我放弃了预测的想法,用简单粗暴的方法来分析各个团队的性价比。 废话不多说,先从图开始吧。 要快速预览,请查看粗体文本。

看图说话

足球统计比赛数据图_足球统计比赛数据分析_足球比赛数据统计

● 横轴:国际足联官网公布的当前世界排名。 X 轴刻度已标准化,因此可以忽略。 越往右足球比赛数据统计,世界排名越高。 德国目前排名世界第一。

● 纵轴:近10年32支国家队交锋胜率统计。 等级越高,胜率越高(比赛场数和对手可能会造成统计偏差,这里作为次要参考依据)

● 规模:表示团队的总价值。 本届世界杯总身价最高的三支球队分别是10.8亿欧元的法国队、10.4亿欧元的西班牙队和9.5亿欧元的巴西队。

由于图片太大,很多国家标签显示不出来,所以分成左右两块足球比赛数据统计,仔细看看。

● 左侧(整体实力较弱)

足球比赛数据统计_足球统计比赛数据分析_足球统计比赛数据图

●右侧(整体实力更强)

足球统计比赛数据分析_足球统计比赛数据图_足球比赛数据统计

● 现在可以清楚地看到,瑞士、丹麦等总身价很低的球队,近年来在国际比赛中实际上表现不错。 有可能成为本届世界杯的黑马。

● 夺冠热门多为总身价较高的球队,如西班牙、巴西、德国等第一集群阵营。 比利时近年来无论是总身价还是在国际比赛中的表现都出现在第一集训营中。 比利时也很有可能成为夺冠黑马。

足球比赛数据统计_足球统计比赛数据分析_足球统计比赛数据图

我们来看看32支球队的分布情况。 欧美显然占据了绝大多数地区。

好吧~! 分析就到此为止。 剩下的我们看图来分析一下。

生产流程

其实我觉得很多人都可以做分析、做图表,但是在收集原始数据的时候,我觉得70%的人都会被筛选掉。

数据采集​​:

1.获取 上的数据集,包含1872年到2018年所有世界足球比赛结果数据(但需要翻墙)

[官方链接:从1872年到2018年](从1872年到2018年)

足球比赛数据统计_足球统计比赛数据分析_足球统计比赛数据图

2.使用工具抓取FIFA官网、排名、身价等(当然只有32支球队,也可以百度搜索复制粘贴)

[官网链接:2018 FIFA 世界杯™ - - ](2018 FIFA 世界杯™ - - )

足球比赛数据统计_足球统计比赛数据分析_足球统计比赛数据图

数据清洗:

1、生产过程中,你会发现数据有问题。 官网捕获的国家实际上与下载数据集的国家英语无关。

2、数据分为主客场,所以你得把数据清理成一支球队足球比赛数据统计,不区分主客场,进行统计和计算。

足球统计比赛数据分析_足球比赛数据统计_足球统计比赛数据图

数据可视化:

这一步非常简单。 清理后用BI神器生成csv就可以了(费用有点贵,可以在淘宝上买CDKEY,也可以选择POWER BI、Sail BI等免费工具)。 您还可以使用可视化库来制作。

足球统计比赛数据图_足球统计比赛数据分析_足球比赛数据统计

最后,我们重点介绍一下本届世界杯32支球队的汇总数据集。

足球统计比赛数据分析_足球比赛数据统计_足球统计比赛数据图

一切都在这里完成了。 我很期待接下来的分析。 喜欢的话就点个关注吧~! 谢谢!

点赞
上一篇 2024年02月12日 18:23
下一篇 2024年02月12日 18:44