用顺序Logistic回归预测2018年世界杯

admin 66 2024-02-08 01:33:19

  

  很棒的传球进入禁区,4-4-2或4-3-3阵型,有争议的黄牌和红牌是惩罚的诅咒……在这个世界级的足球比赛中,每个人都可以享受。根据英国广播公司最近的一篇文章(https://www.bbc.com/sport/football/44383950) ,英格兰有4%的机会赢得2018年世界杯。这是基于使用计算机模拟的计算。根据每一方的排名,根据获胜/平局/失败的概率,为每场比赛奖励积分。虽然这听起来令人失望,但我决定使用过去的数据进行一些分析。民意调查:谁会赢?

  世界杯球迷们,你知道谁会成为2018年的冠军吗?我们在这里关注自己的预测。现在轮到你了!我们想邀请您参加我们的调查(https://www.surveymonkey.com/r/VWNSLMK),了解谁将名列前茅。我们将在所有游戏结束后将结果制成表格,做一些分析并让您知道我们发现了什么!用顺序逻辑回归预测排名或多或少的常识是,球队的平均年龄和上限(球员在国际比赛中代表他的国家的次数)对于在足球锦标赛中获胜或进入下一阶段比赛的机会有一定影响。因此,我正在收集过去20届世界杯的球队数据,并计算出排名前四名的球队的平均年龄和上限。我还考虑了比赛的是在哪里举行的以及球队所在的大陆。2018年世界杯正在俄罗斯举行,非常适合来自欧洲国家的球队,对他们来说很少或没有需要时差来适应。来自更远的国家的团队可能需要克服时差和较低的温度。这会有影响吗?让我们来看看。下面是Minitab工作表中的一些数据的屏幕截图。

  数据集由以下内容组成。年份: 比赛在哪一年进行的地点: 比赛地点,SA =南美洲,E =欧洲,其他=不在南美洲欧洲的国家团队团队的起源大陆: SA =南美洲,E =欧洲,其他=不在南美洲欧洲的国家平均年龄团队的平均年龄平均上限球员: 在国际比赛中代表他的国家的平均次数位置球队在比赛中取得的最终排名

  在迄今为止的20场世界杯比赛中,其中10场在欧洲举行,7场在南美举行,3场在欧洲或南美以外的国家举行。因为我们的响应变量是比赛的最终排名,这是个离散的变量,我们将使用顺序逻辑回归来进行分析。顺序逻辑回归用于模拟一组预测变量与离散响应之间的关系,在我们的例子中,我们在锦标赛中获得的1,2,3和4名是离散型变量,而且是有顺序的 。要开始分析,我将转到统计>回归>顺序逻辑回归,并填写如下所示的对话框。

  Minitab提供三种链接函数,可以提供多种不同的模型。链接函数将离散响应变量比赛排名转换为连续比例,一旦转换完成,预测函数和响应之间的关系可以用线性回归来建模。

  默认情况下,Minitab将最大数值视为响应的参考事件。但是,在这种情况下,我们希望专注于找出影响团队获胜的因素。因此,我将顺序从4 3 2 1更改为1 2 3 4.我还调整了分类因子的参考水平,因为我们希望关注名次。

  结果中的关键统计数据之一是优势比。它比较了两个事件的几率。事件的几率是事件发生的概率除以事件未发生的概率。优势比大于1表示第一事件和更接近第一事件的事件更有可能。优势比小于1表示最后一个事件和更接近它的事件更有可能。查看我们的数据,平均年龄预测值的优势比为0.98大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!。在我们的案例中,“第一”事件是获得第一名的事件,换言之,成为冠军。优势比意味着随着年龄的增长,团队获得这个成绩的可能性更小。换句话说,每增加一个单位的年龄,团队将成为冠军而不是获得第二、第三或第四名的几率减少大约2%。另一方面,平均上限预测值的比值比为1.04。这意味着,对于平均上限的每个单位增加,赢得冠军的机会增加1.04倍。除了优势比之外,我们还可以评估系数,以确定预测变量的变化是否会增加或减少事件发生的可能性。正系数使第一个事件和更接近它的事件更有可能随着预测值的增加而增加。负系数使最后一个事件和更接近它的事件更有可能随着预测值的增加而降低。平均年龄的系数是负的,这意味着随着球队的平均年龄的增加,球队更不可能获得第一名。另一方面,平均上限的系数是正的。因此,随着平均上限的提高,它更有可能赢得世界杯。至于类别预测变量,在与参考水平比较时,优势比比较了预测值在不同级别上发生的事件的概率。在本例中,参考水平为“Other”。因此,我们可以说,在欧洲举办的一场比赛中,该队获得第一名的概率是在其他地方举办获得第一名的1.36倍。这是有道理的,因为在比赛中有很多球队来自欧洲国家。用小的时间差来调整,就意味着玩家可以取得更好的成绩。参考团队预测,欧洲团队获得冠军的可能性是其他领域团队的三倍,而南美团队获得冠军的可能性是其他大陆团队的6倍。得到模型后,验证模型是否能够很好拟合是至关重要的。我们可以参考拟合优度表。

  因为p值很高,我们可以得出结论,该模型拟合的还不错。最后,但并非最不重要,逻辑回归可用于计算事件概率。事件概率是特定结果或事件发生的可能性。为了计算这一点,我再次重新运行分析并存储事件概率,如下所示。

  Minitab将事件概率存储在工作表中,不需要使用回归模型中的系数计算出数据。这就给出了在给定的预测值下获得不同响应级别的概率。默认的列名以EPROB开头,后面跟着一个数字。因为我们有四种不同的结果,每一行数据有四列概率。大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!

  有了这个有用的功能,我还可以预测新的观察结果。英格兰获胜的几率是多少?获得五次冠军巴西的机会如何?使用FIFA网站上的小队数据,我计算了这三支球队的平均年龄和上限,结果如下:

  将这些数字放入Minitab工作表后,我们可以使用其他设置重新运行分析,如图所示大佬们都在玩{精选官网网址: www.vip333.Co }值得信任的品牌平台!。

  基于上述情况,该模型表明英格兰获胜的概率约为0.21或21%(远高于文章所预测的),而巴西获胜的概率为0.45或45%。 我不知道英格兰会走多远,但我相信大家都会喜欢在球场上展开的激烈驰骋!

用顺序Logistic回归预测2018年世界杯

用顺序Logistic回归预测2018年世界杯

上一篇:有没有哪个软件,我只需要键入大纲和内容,就能直接生成PPT的?时间紧,我又是个阿蠢?
下一篇:2015世界杯女排中国对美国,中国女排的精彩对决 2015世界杯女排中国对塞尔维亚录像回放CCTV
相关文章
返回顶部小火箭