2024美赛 MCM Problem C: Momentum in Tennis 网球中的动力 完整思路以及源代码分享

在2023年温布尔登绅士队的决赛中,20岁的西班牙新星卡洛斯·阿尔卡拉兹击败了36 岁的诺瓦克·德约科维奇。这是德约科维奇自2013年以来首次在温布尔登公开赛失利 ,并结束了他在大满贯赛事中历史上最伟大的球员之一的非凡表现。

这场比赛本身就是一场非凡的战斗。[1]德约科维奇似乎注定要轻松获胜,他以6-1控制 了第一盘(7场比赛赢6场)。然而,第二盘比赛很紧张,最终阿尔卡雷兹以7-6的比分获 胜。第三盘与第一盘相反,阿尔卡拉兹以6-1轻松获胜。在第四盘开始时,年轻的西班牙 人似乎完全控制了局面,但不知怎么的,比赛又改变了方向,德约科维奇完全控制了局面,以6-3赢得了这一盘。第五盘也是最后一盘开始时,德约科维奇从第四盘领先,但方向又发生了变化,阿尔卡拉兹控制了局面,以6-4获胜。这场比赛的数据在所提供的“2023-温布尔登1701”的数据集“match_id”中。当德约科维奇使用“set_no”列等于1时,你可以看到第一回合的所有分数。令人难以置信的波动,有时是很多分数,甚至是 比赛,发生在那些似乎有优势的球员,通常被归因于“势头”。 字典中对动量的一种定义是“通过运动或一系列事件获得的力量或力”。[2]在体育运 动中,一个团队或球员可能会觉得他们在比赛/比赛中有动力,或“力量/力量”,但很 难衡量这种现象。此外,如果比赛中各种事件如何创造或改变势头,这并不明显。

提供2023年温布尔登男子比赛前两轮后的每一分数据。您可以自行选择包含额外的玩家 信息或其他数据,但您必须完全记录这些来源。将数据用于:(In the 2023 Wimbledon Gentlemen’s final, 20-year-old Spanish rising star Carlos Alcaraz defeated 36-year-old Novak Djokovic. The loss was Djokovic’s first at Wimbledon since 2013 and ended a remarkable run for one of the all-time great players in Grand Slams. The match itself was a remarkable battle.[1] Djokovic seemed destined to win easily as he dominated the first set 6 – 1 (winning 6 of 7 games). The second set, however, was tense and finally won by Alcarez in a tie-breaker 7 – 6. The third set was the reverse of the first, Alcaraz winning handily 6 – 1. The young Spaniard seemed in total control as the fourth set started, but

somehow the match again changed course with Djokovic taking complete control to win the set 6 – 3. The fifth and final set started with Djokovic carrying the edge from the fourth set, but again a change of direction occurred and Alcaraz gained control and the victory 6 – 4. The data for this match is in the provided data set, “match_id” of “2023-wimbledon-1701”. You can see all the points for the first set when Djokovic had the edge using the “set_no” column equal to 1. The incredible swings, sometimes for many points or even games, that occurred in the player who seemed to have the advantage are often attributed to “momentum.” One dictionary definition of momentum is “strength or force gained by motion or by a series of events.”[2] In sports, a team or player may feel they have the momentum, or “strength/force” during a match/game, but it is difficult to measure such a phenomenon. Further, it is not readily apparent how various events during the match act to create or change momentum if it exists. Data is provided for every point from all Wimbledon 2023 men’s matches after the first 2 rounds. You may choose to include additional player information or other data at your discretion,but you must completely document the sources. Use the data to:)


问题一:开发一个模型,捕捉得分发生时的比赛流程,并将其应用于一个或多个比赛。你的模型应该确定哪个球员在比赛的特定时间表现更好,以及他们的表现有多好。提供 一个基于模型的可视化功能来描述匹配流程。注:在网球比赛中,发球者赢得得 分的可能性要高得多。您可能希望以某种方式将其考虑到您的模型中(Develop a model that captures the flow of play as points occur and apply it to one or more of the matches. Your model should identify which player is performing better at a given time in the match, as well as how much better they are performing. Provide a visualization based on your model to depict the match flow. Note: in tennis, the player serving has a much higher probability of winning the point/game. You may wish to factor this into your model in some way):完整内容见文末附件:

针对问题一,我们需要开发一个模型来捕捉比赛中每一分的流程,并应用于一场或多场比赛。模型应能识别在比赛特定时刻哪位选手表现更佳,以及他们的表现优势有多大。此外,还需要提供一种可视化方式来展示比赛流程。以下是具体的解题思路和数学建模过程:

数据预处理:整理和清洗比赛数据,确保数据质量。

特征提取:从数据中提取重要特征,如得分、发球情况等。

模型建立

基本统计模型:计算选手在特定时间段(例如每个游戏或每个集合)的得分率和赢球率。

得分率 Ps​:对于每位选手,计算在某一时间段内的得分率,例如每个游戏或每个集合。

动量考量:考虑比赛中的动量变化,例如连续得分或失分可能对选手的心理和比赛表现产生影响。

发球优势调整:由于发球方在网球中通常更有优势,模型中应考虑这一因素。

模型评估与优化:通过比较模型输出与实际比赛结果来评估模型性能,并根据需要进行调整优化。

可视化:根据模型输出创建比赛流程图,直观展示比赛中双方表现的变化。

问题二:
网球教练怀疑“势头”是否在比赛中起着任何作用。相反,他假设一个球员的波动和 成功的跑动是随机的。使用您的模型/度量来评估此索赔。A tennis coach is skeptical that “momentum” plays any role in the match. Instead, he postulates that swings in play and runs of success by one player are random. Use your model/metric to assess this claim.)完整内容见文末附件:

问题二要求我们使用模型来评估网球教练的观点,即比赛中的动量变化(即一个选手连续取得成功的情况)是随机的,而不是由比赛的动量决定的。为了解决这个问题,我们需要利用之前开发的模型来分析比赛数据,并使用统计方法来评估比赛中的动量变化是否具有随机性。以下是解决这个问题的具体思路和数学建模过程

步骤 1: 动量指标计算

首先,我们利用第一问题中定义的动量指标 M,这个指标反映了选手在比赛中的连续得分趋势。

步骤 2: 序列随机性检验(Runs Test)

定义游程:在得分序列中,一连串的得分或失分被定义为一个“游程”。例如,连续几分由同一选手赢得构成一个游程。

计算实际游程数量:统计比赛中的总游程数量 N。

计算理论游程数量:

Z检验:

如果 Z 值远离 0(通常绝对值大于 1.96 对应于 5% 的显著性水平),则表示游程数量非常规,暗示非随机性。

步骤 3: 比较分析

将实际游程数量与理论游程数量进行比较。

如果实际游程数量显著不同于理论预期值,则表明比赛中存在非随机性,这可能与动量有关。

步骤 4: 结论

如果统计检验显示比赛中的游程数量显著地偏离随机分布,则拒绝零假设,支持存在动量效应的观点。

如果统计检验显示游程数量与随机分布相符,则无法拒绝零假设,这可能支持教练的观点,即比赛中的得分变化是随机的。

问题三:

教练们很想知道是否有指标可以帮助决定何时比赛的流程将从偏爱一个球员转向另

一个球员。

o利用至少一场比赛提供的数据,建立一个模型来预测比赛中的这些波动。哪

些因素似乎是最相关的(如果有的话)?

o考虑到过去比赛“势头”波动的差异,你如何建议一名球员与另一名球员进

行新的比赛?Coaches would love to know if there are indicators that can help determine when the flow of play is about to change from favoring one player to the other.

o Using the data provided for at least one match, develop a model that predicts

these swings in the match. What factors seem most related (if any)?

o Given the differential in past match “momentum” swings how do you advise a

player going into a new match against a different player?

为了解决问题三,我们需要开发一个模型,该模型能够预测比赛中动量的改变,即何时比赛的优势会从一方转移到另一方。以下是解决这个问题的具体思路和数学建模过程:

1. 动量指标定义

定义动量转变指标 M:比赛中的动量转变可以通过连续得分的变化来度量。

2. 特征提取

选择特征 F={f1​,f2​,…,fm​},如破发点赢得情况、非受迫性失误数、一发得分率等。

3. 相关性分析

计算特征与动量转变指标之间的皮尔逊相关系数ρ。

4. 模型选择

在这一步,我们考虑使用机器学习模型来预测比赛中的动量转变。

逻辑回归是一个广泛用于二分类问题的统计模型,它能够给出因变量(即动量转变是否发生)的概率预测。动量转变可以定义为比赛中优势从一位选手转移到另一位选手的事件。

我们可以定义一个二元变量 Y,它的值为 1,如果在接下来的几分中动量发生了转变(例如,一位选手连续得分后,对手开始连续得分),否则为 0。

5.2 特征选择

基于数据,选择一系列可能影响动量转变的特征X=[x1,x2,…,xn]

逻辑回归模型可以表示为:

5.4 参数估计

使用最大似然估计法来估计模型参数。

在一个或多个其他匹配项上测试您开发的模型。你对比赛波动的预测如何?如果模型 有时表现不佳,您能否确定可能需要包含在未来模型中的任何因素?你的模式对 其他比赛(如女子比赛)、锦标赛、球场表面和乒乓球等其他运动项目有多普遍

Test the model you developed on one or more of the other matches. How well do you predict the swings in the match? If the model performs poorly at times, can you identify any factors that might need to be included in future models? How generalizable is your model to other matches (such as Women’s matches), tournaments, court surfaces, and other sports such as table tennis.(完整内容见附件)

附件:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/364849.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Unity SRP 管线【第七讲:URP LOD实现以及Reflections反射探针】

目录 一、URP LOD 组件1、LOD Group的使用2、LOD切换原理Cross Fade(淡入淡出)模式Animated Cross-Fading如果未设置Clip,并且Fade Transition Width不为0LOD物体烘培 SpeedTree 模式 二、反射探针1. 获取反射探针数据2. 环境光照明 IBL3. 反射探针(Refl…

浅谈信号完整性分析

什么是信号完整性?在过去的低速时代,电平跳变时信号上升时间较长,通常几个 ns。器件间的互连线不至于影响电路的功能,没必要关心信号完整性问题。但在今天的高速时代,随着 IC输出开关速度的提高,很多都在皮秒级,不管信号周期如何,几乎所有设计都遇到了信号完整性问题。…

Python近似最近邻搜索库之annoy使用详解

概要 在大数据时代,处理高维数据集的需求越来越迫切,尤其是在机器学习、推荐系统和自然语言处理等领域。高维数据集中的一个常见问题是最近邻搜索,即找到与给定数据点最接近的数据点。Python Annoy库就是专为解决这类问题而设计的,它提供了高效的近似最近邻搜索算法,本文…

微服务—RabbitMQ

目录 初识MQ 同步和异步通讯 同步通讯的优缺点 异步调用方案 异步通信优缺点 常见MQ技术对比 RabbitMQ快速入门 安装RabbitMQ RabbitMQ整体架构与相关概念 常见消息模型​编辑 入门案例 SpringAMQP 基本介绍 SpringAMQP案例——模拟HelloWorld消息模型 Sprin…

vscode 如何修改c/c++格式化风格,大括号不换行

在Visual Studio Code(VSCode)中,若要修改C代码格式化的风格以实现大括号不换行,通常会借助于插件C/C扩展中的ClangFormat配置。以下是具体的步骤: 确保已安装了C/C扩展: 打开VSCode的扩展市场(…

力扣热门100题刷题笔记 - 1.两数之和

力扣热门100题 - 1.两数之和 题目链接:1.两数之和 题目描述: 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答…

༺༽༾ཊ—Unity之-04-原型模式—ཏ༿༼༻

首先创建一个项目, 在这个初始界面我们需要做一些准备工作, 建基础通用文件夹, 创建一个Plane 重置后 缩放100倍 加一个颜色, 任务1:使用 建造者模式 创建三种 金刚猿猴 零部件 拼接组合 首先资源商店下载 金刚猿猴 模…

上位机图像处理和嵌入式模块部署(二进制图像的读写)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 之前我们说过,对于图像处理而言,势必会涉及到文件的读写。但是不同格式文件的读写,这本身又是体力活&#xff0…

vue yarn certificate has expired

背景:我在用ant design pro框架进行初始化时,安装脚手架时,安装yarn时显示报错 原因分析:查了很久的资料,这种情况应该是开了服务器代理访问导致ssl安全证书失效了 解决办法: 在终端输入:yarn…

【2024.2.1练习】01迷宫

题目描述 题目思路 一开始想用动态规划,但是这道题没有明显的顺序性和递推关系可以找,起点也是自定义的,鉴于迷宫尺寸不大,考虑使用DFS或BFS。 在自己推算几遍后发现,假设可以在地图上畅通无阻,那么格子只…

书签管理和稍后阅读工具Readeck

什么是 Readeck ? Readeck 是一个简单的 Web 应用程序,可让您保存您喜欢并希望永久保留的网页的宝贵可读内容。将其视为书签管理器和稍后阅读工具。 网络上的内容每天都会消失。很可能您几个月前偶然发现的一篇文章或图片现在已经消失了。当您在 Readeck 中保存某些…

运维SRE-02 正则表达式、grep

1.特殊符号补充 1.1位置相关的特殊符号 . 当前目录 .. 当前目录的上级目录 ~ 当前用户家目录 / 根目录 cd - 返回上次所在目录1.2熟练掌握 # 注释符号,root命令提示符 | 管道符号.1.3了解其他特殊符号 $ 取值(取出变量的值),普通用户的提示符 ! % ^ & * (){} [] ; ? \…

Quick BI中lod函数之lod_fixed

一、lod函数简介 LOD函数的全称是详细级别表达式(Level Of Detail Expressisons)。它主要是为了克服一些表达式之间计算颗粒度不一致的问题。比如,要计算第一季度各月销售收入占比,这里分子计算颗粒度为’月’,但是分…

2024年美国大学生数学建模D题思路分析 - 大湖区水资源问题

# 1 赛题 问题D:大湖区水资源问题 背景 美国和加拿大的五大湖是世界上最大的淡水湖群。这五个湖泊和连接的水道构成了一个巨大的流域,其中包含了这两个国家的许多大城市地区,气候和局部天气条件不同。 这些湖泊的水被用于许多用途&#xff…

TypeScript 学习笔记(Day4)

「写在前面」 本文为 b 站黑马程序员 TypeScript 教程的学习笔记。本着自己学习、分享他人的态度,分享学习笔记,希望能对大家有所帮助。推荐先按顺序阅读往期内容: 1. TypeScript 学习笔记(Day1) 2. TypeScript 学习笔…

大力说视频号第三课:手把手教你视频号如何认证

视频号生态不断完善,越来越多的创作者认识到视频号认证的重要性。微信视频号认证不但能提升搜索排名,还能直播推流、与企业微信的关联等优势。 今天大力就来向大家介绍一下视频号如何做认证。 01 个人认证 个人认证又包括兴趣认证和职业认证。 A、兴趣…

基于Java SSM框架实现校园快领服务系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现校园快领服务系统演示 摘要 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,通过科技手段提高自身的优势;对于校园快领服务系统当然也不能排除在外,随着网络技术的不断成熟,带动了…

保姆级的指针详解(超详细)

目录 一.内存和地址  1.初识指针 2.如何理解编址 二. 指针变量 三.指针的解引用操作符 1.指针变量的大小 四.指针变量类型的意义 五.指针的运算 1.指针加减整数 2.指针减指针 3.野指针 3.1指针未初始化 3.2指针越界访问 3.3指针指向的空间被提前释放 3.4如何规…

Rust学习之Features

Rust学习之Features 一 什么是 Features二 默认 feature三 简单的features应用示例四 可选(optional)的依赖五 依赖的特性5.1 在依赖表中指定5.2 在features表中指定 六 命令行中特性控制七 特性统一路径八 其它8.1 相互排斥特性8.2 观察启用特性8.3 [Feature resolver version…

从源码角度透视QTcpServer:解构QTcpServer的底层原理与技术细节

深入了解QTcpServer的底层原理和技术细节 一、背景二、QTcpServer的基本原理2.1、TCP协议简介2.2、QTcpServer的概念 三、QTcpServer源码解析3.1、QTcpServer的构造函数3.2、调用listen函数启动tcpserver3.3、QSocketNotifier的实现 总结 一、背景 QTcpServer是Qt网络模块中的…