用Python机器学习模型预测世界杯结果靠谱吗?

看到kaggle、medium上有不少人用球队的历史数据来进行建模预测,比如用到泊松分布、决策树、逻辑回归等算法,很大程度上能反映强者恒强的现象,比如巴西、英格兰等大概率能进8强,就像高考模拟考试成绩越好,大概率高考也会考得好。

这个和人脑的预测是类似的,建立在你看了足够多的球赛,对每一个国家队、球员、教练、打法等都了如指掌,你才能有充分的判断依据。而且你还不能带有主观的倾向,意大利球迷肯定笃定意大利能夺冠,但他们在预选赛就被淘汰了。

但是阿根廷输沙特、德国输日本这样的黑天鹅事件,不管是AI还是人脑都是没法预测的,否则真成预言者了。买阿根廷、德国赢的人其实是选择了大概率事件,但并没有发生,他们的决策其实是对的。

因为世界杯比赛有很多变动因素,比如裁判规则、球员伤退、排兵布阵,甚至当地环境、食宿也都会有影响,所以在进行AI预测的时候,需要有很多维度的数据进行综合分析,单单从球队的历史成绩来判断,肯定是对准确率会有影响。

这其实是有贝叶斯定理的逻辑在里面,大胆假设,小心求证。

说了一大堆,还没讲如何用AI来预测。我前几天在kaggle看到过一个博主用了GBM梯度提升算法,它通过求损失函数在梯度方向下降的方法,层层改进。

大概描述下步骤:

1、数据准备。

该项目用了【FIFA 1992-2022世界排名】、【1872-2022国家队比赛结果】两个数据集。通过数据预处理对两个数据源进行连接

2、特征工程。

列出对预测比赛结果有影响的特征字段,共37个。特征选取主要根据历史经验、直觉判断,比如过去的比赛积分、过去的进球和损失、比赛的重要性、球队排名、团队排名提升等等。

接着要对各个特征进行相关性检测,判断对预测是否有帮助,如果没有帮助的特征则直接剔除。最后留下11个最重要的特征,用来建模分析。

3、建立模型。

数据处理了,接下来是通过机器学习模型对数据进行训练,然后得出预测结果。

这里用了梯度提升和决策树两个算法,最终选recall最高的,博主测试后选择了梯度提升算法。

算法具体使用操作方法如下:

4、预测世界杯比赛。

搭建好模型,就可以把世界比赛的对阵数据放到模型里进行预测。最终算出来小组赛、十六强赛、八强赛、四强赛、总决赛的得分情况。

从目前看,预测结果其实还是复制历史经验,小组出线情况基本和世界排名情况一致,没有超乎人的经验范围。对于黑马、黑天鹅并没有什么预测能力。

其他预测结果就不一一展示了,哦,最后好像预测是巴西夺冠概率较大。

总之,AI预测世界杯其实是对历史数据的归纳总结,而且完全依赖数据的喂养,能给出相对概率。

这和人的直觉一样,你觉得巴西会夺冠,肯定有一些过往的事实验证了你的直觉,不然就是瞎猜了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/496860.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

美团0316春招笔试题

下面是美团2024-03-16笔试真题&#xff0c;进行了VP&#xff0c;由于未参与评测&#xff0c;故不保证正确性&#xff0c;仅供参考。 第一题 小美点外卖 求和然后减去满减和红包即可。 #include <bits/stdc.h> using namespace std; using LL long long ; int n, t, x,…

开源 | 电动自行车充换电解决方案,从智能硬件到软件系统,全部自主研发

文章目录 一、产品功能部分截图1.手机端&#xff08;小程序、安卓、ios&#xff09;2.PC端 二、小程序体验账号以及PC后台体验账号1.小程序体验账号2.PC后台体验账号关注公众号获取最新资讯 三、产品简介&#xff1f;1. 充电桩云平台&#xff08;含硬件充电桩&#xff09;&…

ffmpeg实现媒体流解码

ffmpeg Version : 5.14 本期主要讲解怎么将MP4媒体流的视频解码为yuv,音频解码为pcm数据;在此之前我们要先了解解复用和复用的概念; 解复用:像mp4是由音频和视频组成的(其他内容流除外);将MP4的流拆分成视频流(h264或h265等)和音频流(AAC或mp3等); 复用:就是将音频…

Mysql配置autocommit实际使用(慎用)

以下内容都是基于MySQL5.7。所有操作建议在MySQL客户端执行。navicat可能会先意想不到的问题 在导入频繁执行update、insert的时候&#xff0c;可以考虑关闭MySQL的自动提交 首先查询当前的状态 1开启 0关闭 select autocommit;设置本次连接关闭自动提交(如果需要永久关闭请修…

RowHammer 攻击:内存的隐形威胁

RowHammer 攻击是一种相对较新的攻击方式&#xff0c;它利用了现代动态随机存取存储器&#xff08;DRAM&#xff09;的物理缺陷&#xff0c;这种攻击方式不同于传统的软件漏洞利用&#xff0c;它直接针对硬件的弱点。这种攻击利用了 DRAM 在运行过程中产生的意外电荷泄漏效应&a…

IP组播基础

原理概述 IANA ( Internet Assigned Numbers Authority &#xff09;将 IP 地址分成了 A 、 B 、 C 、 D 、 E5类&#xff0c;其中的 D 类为组播 IP 地址&#xff0c;范围是224.0.0.0~239.255.255.255。 一个 IP 报文&#xff0c;其目的地址如果是单播 IP 地址&#xff…

电源66319D控制方法

实现自动化控制&#xff0c;电源为基础的模块&#xff0c;下面为大家讲解电源66319D的控制逻辑。 新建底层控制逻辑 在文件basis_contorl.py中写入仪器控制底层代码&#xff0c;代码如下&#xff1a; import tkinter.messagebox import pyvisaclass InstrumentControl(object…

罗永浩要在直播间卖阿里云服务器了

关注卢松松&#xff0c;会经常给你分享一些我的经验和观点。 万万没想到&#xff0c;罗永浩要在直播间卖阿里云了。一个是科技圈的超级大V&#xff0c;一个是云计算行业的老大&#xff0c;看来这两位要合体了! 罗永浩要3月31日在淘宝直播间卖云产品&#xff0c;阿里云还特意为…

Docker常见软件部署2

1 docker 安装redis集群 docker 安装redis集群&#xff0c;3主3从的配置。 1 创建一个redis通信网卡 #创建一个redis集群使用的网卡 docker network create redis --subnet 172.38.0.0/16 2 创建6个redis的配置文件 #通过脚本创建六个redis配置&#xff0c;复制下面命令直接…

CSS(一)---【CSS简介、导入方式、八种选择器、优先级】

零.前言 本系列适用于零基础小白&#xff0c;亦或是初级前端工程师提升使用。 知识点较为详细&#xff0c;如果追求非常详细&#xff0c;请移步官方网站或搬运网站。 1.CSS简介 CSS全称&#xff1a;“Cascading Style Sheets”&#xff0c;中文名&#xff1a;“层叠样式表”…

【正版特惠】IDM 永久授权 优惠低至109元!

尽管小编有修改版IDM&#xff0c;但是由于软件太好用了&#xff0c;很多同学干脆就直接购买了正版&#xff0c;现在正版也不贵&#xff0c;并且授权码绑定自己的邮箱&#xff0c;直接官方下载激活&#xff0c;无需其他的绿化修改之类的操作&#xff0c;不喜欢那么麻烦的&#x…

JUC内容概述

复习概念 Sleep和Wait的区别 Sleep是Thread的静态方法&#xff0c;wait是Object的方法&#xff0c;任何对象实例都可以使用sleep不会释放锁&#xff0c;他也不需要占用锁&#xff0c;暂停。wait会释放锁&#xff0c;但是调用他的前提是线程占有锁他们都可以被Interrupted方法…

iOS - LLVM的中间代码(IR)

文章目录 iOS - LLVM的中间代码&#xff08;IR&#xff09;1. 转为汇编代码2. 中间代码&#xff08;IR&#xff09;2.1 Objective-C在变为机器代码之前&#xff0c;会被LLVM编译器转换为中间代码&#xff08;Intermediate Representation&#xff09;2.2 可以使用以下命令行指令…

html音频和视频可输入表单input

音频和视频 loop循环播放autoplay自动播放controls显示控制面板<audio src""> //<video src"#">muted静音播放 可输入表单input password密码框 radio单选框 checkbox复选框 file上传文件 text文本框 文本框<input type"text"…

网络编程综合项目-多用户通信系统

文章目录 1.项目所用技术栈本项目使用了java基础&#xff0c;面向对象&#xff0c;集合&#xff0c;泛型&#xff0c;IO流&#xff0c;多线程&#xff0c;Tcp字节流编程的技术 2.通信系统整体分析主要思路&#xff08;自己理解&#xff09;1.如果不用多线程2.使用多线程3.对多线…

智能车主控板原理图原理讲解

智能车主控板原理图原理讲解 综述&#xff1a;本篇文章对智能车主控板的一部分电路进行原理分析&#xff0c;文末附加整体原理图。 1. 电源电路 &#xff08;1&#xff09;通过外接电池供电并通过电源模块电路&#xff0c;运用稳压芯片lm2940&#xff0c;将电源电压转化为5V…

原生JS上传大文件分片

代码&#xff1a;https://gitee.com/xproer/up6-vue-cli 1.引入up6组件 2.配置接口地址 接口地址分别对应&#xff1a;文件初始化&#xff0c;文件数据上传&#xff0c;文件进度&#xff0c;文件上传完毕&#xff0c;文件删除&#xff0c;文件夹初始化&#xff0c;文件夹删除&…

市场复盘总结 20240328

仅用于记录当天的市场情况&#xff0c;用于统计交易策略的适用情况&#xff0c;以便程序回测 短线核心&#xff1a;不参与任何级别的调整&#xff0c;采用龙空龙模式 一支股票 10%的时候可以操作&#xff0c; 90%的时间适合空仓等待 二进三&#xff1a; 进级率中 40% 最常用的…

代码随想录算法训练营第day60|84.柱状图中最大的矩形

84.柱状图中最大的矩形 力扣题目链接(opens new window) 给定 n 个非负整数&#xff0c;用来表示柱状图中各个柱子的高度。每个柱子彼此相邻&#xff0c;且宽度为 1 。 求在该柱状图中&#xff0c;能够勾勒出来的矩形的最大面积。 思路&#xff1a; 为什么这么说呢&#xff…

第三十二天-PythonWeb主流框架-Django框架

目录 1.介绍 发展历史 介绍 2.使用 1.安装 2.创建项目 3.项目结构 4.启动 3.开发流程 1.设置ip可访问 2.创建模块 3.第一个页面 4.视图 5.include()参数 6.url与视图的关系 7.响应内容 4.视图处理业务逻辑 1.响应html 2.获取url参数 3.从文件响应html内容 …