【已更新】2024美赛C题代码教学思路数据处理数学建模分析Momentum in Tennis

问题一完整的代码已给出,预计2号晚上或者3号凌晨全部给出。

代码逻辑如下:
C题第一问要求我们开发一个模型,捕捉得分时的比赛流程,并将其应用于一场或多场比赛。你的模型应该确定哪名球员在比赛的特定时间表现得更好,以及他们的表现有多好。那么换句话说,就是评价球员在比赛期间的一个实时的状态,
因此对于这个问题求解的关键在于如何从给出的数据中提取特征,而不是侧重于套用模型进行评价
在于我们需要根据提供的数据,分析出选手在场上的心态,体能的实时状态,随后根据提取出的选手特征对选手的表现进行评价,最后的结果会抽象成为一个数值用于表现选手在某一时刻下的表现得分,根据得分的差别反应选手的表现好坏程度

部分代码可视化图如下:

【腾讯文档】2024美赛C题详情docs.qq.com/doc/DVVp3WFVmTERTTlhC

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

核心代码如下:

数据预处理部分:

数据预处理

Convert elapsed_time to timedelta

match_data[‘elapsed_time_td’] = pd.to_timedelta(match_data[‘elapsed_time’])

Calculate the time difference in seconds within each match_id group

match_data[‘time_diff’] = match_data.groupby(‘match_id’)[‘elapsed_time_td’].diff().dt.total_seconds()

Fill NaN values with the first elapsed_time value in each group, converted to seconds

match_data[‘time_diff’] = match_data.groupby(‘match_id’)[‘time_diff’].fillna(
match_data[‘elapsed_time_td’].dt.total_seconds()
)

Show the updated dataframe to verify changes

match_data[[‘match_id’, ‘elapsed_time’, ‘time_diff’]].head()

Group by [‘match_id’, ‘set_no’, ‘game_no’] and collect the corresponding ‘p1_points_won’, ‘p2_points_won’ into lists

grouped_data = match_data.groupby([‘match_id’, ‘set_no’, ‘game_no’])[[‘p1_points_won’, ‘p2_points_won’]].apply(lambda x: x.values.tolist()).reset_index(name=‘points_won_list’)

Convert the grouped data to a list of lists as requested

points_won_lists = grouped_data[‘points_won_list’].tolist()

Convert the ‘p1_points_won’, ‘p2_points_won’ values into their differences

points_diff_lists = [[p1 - p2 for p1, p2 in match] for match in points_won_lists]

Display the first few elements to verify the transformation

points_diff_lists[:5]

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

def Calculate_Performance(df):
df[‘p1’] = df[‘time_diff’]/100 + df[‘p1_sets’]*0.5 + df[‘p1_games’]*0.1 + df[‘p1_ace’] + df[‘p1_winner’]*0.5 - df[‘p1_unf_err’]*0.5
df[‘p2’] = df[‘time_diff’]/100 + df[‘p2_sets’]*0.5 + df[‘p2_games’]*0.1 + df[‘p2_ace’] + df[‘p2_winner’]*0.5 - df[‘p2_unf_err’]*0.5

for index in range(len(df)):
    if index == 0:
        if df.at[index, 'point_victor'] == 1:
            df.at[index, 'p1'] += 0.5
        else:
            df.at[index, 'p2'] += 0.5
        continue
        
    if df.at[index, 'point_victor'] == 1:
        if df.at[index-1, 'point_victor'] == 1:
            df.at[index, 'p1'] += 0.5 * 1.2
        else:
            df.at[index, 'p1'] += 0.5
    else:
        if df.at[index-1, 'point_victor'] == 1:
            df.at[index, 'p2'] += 0.5
        else:
            df.at[index, 'p2'] += 0.5 * 1.2

return df['p1'], df['p2']

调用函数并获取结果

p1_scores, p2_scores = Calculate_Performance(match_data[match_data[‘match_id’]==‘2023-wimbledon-1301’])
p1_scores, p2_scores

在这里插入图片描述

问题分析
问题围绕2023年温网男单决赛中,20岁的西班牙新星卡洛斯·阿尔卡拉兹击败36岁的诺瓦克·德约科维奇的比赛。德约科维奇自2013年以来首次在温布尔登输球,结束了他在大满贯赛事中的杰出表现。这场比赛被认为是一场精彩的较量,经历了多次势头的转换,这些势头转换通常被归因于“动量”。在体育运动中,团队或球员可能会在比赛/比赛中感觉到自己有动量,或“力量/力量”,但很难衡量这种现象。此外,还不清楚比赛中的各种事件是如何产生或改变势头的。

提供了2023年温布尔登网球公开赛前两轮之后所有男子比赛的每一分数据。您可以自行选择包含其他玩家信息或其他数据,但必须完整记录来源。

也就是说,我们需要通过对已有的数据进行处理,找到其中包含动量特征的因素,构建一个模型去衡量这些因素是否使得我们选手的表示更加生猛,下面是我们的一个具体思路。

数据预处理
确保每个比赛的数据完整性,包括比赛时间、比分、发球情况等。
转换时间格式,统一比分表示方法。
将数据转换成可处理的数值数据,如在玩家的得分中,包含了AD这一项,这不利于我们后续的数据处理,可以将其转换成50

特征提取
目标是找到可以为运动员积累获胜“动量”的特征,可以从以下角度考虑是否存在连胜的“动量”。
比分变化:记录每一分后的总比分变化。
发球优势:统计每位运动员的发球局中赢得的分数比例。
破发点:记录每位运动员赢得和失去的破发点数量。
连续得分:运动员连续得分的次数,反映比赛势头。
回球成功率:根据返回深度和速度评估回球成功率。
运动员移动距离:反映体能和比赛中的活跃度。

模型设计
使用逻辑回归或随机森林等机器学习方法来评估每位运动员的表现。模型的输入是上述特征,输出是每位运动员的表现评分。

模型应用
选择具体的比赛数据应用模型,比较不同运动员的表现评分。

结果分析
根据模型的评分结果,分析哪位运动员在比赛中表现更好及其显示出的优势。

接下来,我们将开始实现这些步骤。首先进行数据预处理和特征提取。我们将从提供的比赛数据中提取关键特征。左图展示了比赛中每个得分点后选手之间比分差异的变化。这可以帮助我们理解比赛的势头和选手间的竞争状态。右图展示了比赛过程中两位选手总移动距离的变化,反映了选手的体能消耗和场上活跃度。
在这里插入图片描述

下图通过计算选手1在其发球局中赢得的分数比例,我们绘制了一个折线图来展示选手在不同round下的总共的移动距离以及得分比例。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/367969.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C系列-动态内存管理

🌈个人主页: 会编程的果子君 ​💫个人格言:“成为自己未来的主人~” 目录 为什么要有动态内存分配 malloc和free malloc free calloc和realloc calloc realloc 常见的动态内存的错误 对NULL指针的解引用操作 ​编辑 对动态开辟空间的越界访问…

Three.js学习3:第一个Three.js页面

一、一图看懂Three.js 坐标 这个没什么好说的,只是需要注意颜色。在 Three.js 提供的编辑器中,各种物体的坐标也这样的色彩: 红色:x 轴 绿色:y 轴 蓝色:z 轴 Three.js 提供的编辑器可以在本地 Three.js …

python算法与数据结构(搜索算法和拓扑排序算法)---广度优先搜索和拓扑排序

广度优先搜索BFS 定义&基本内容 广度优先是按照层次由近及远的进行搜索,在当前层次所有可及节点都搜索完毕后才会继续往下搜索,其本质就是寻找从起点到终点的最短路程。 树的广度优先搜索 树的广度优先遍历,可以看成是层序遍历。 访问…

java数据结构与算法刷题-----LeetCode15. 三数之和

java数据结构与算法刷题目录(剑指Offer、LeetCode、ACM)-----主目录-----持续更新(进不去说明我没写完):https://blog.csdn.net/grd_java/article/details/123063846 解题思路 和LeetCode1.两数之和一样,但是这道题边界条件更多。…

基于协同过滤的个性化电影推荐系统分析设计python+flask

本系统为用户而设计制作个性化电影推荐管理,旨在实现个性化电影推荐智能化、现代化管理。本个性化电影推荐自动化系统的开发和研制的最终目的是将个性化电影推荐的运作模式从手工记录数据转变为网络信息查询管理,从而为现代管理人员的使用提供更多的便利…

2401Idea用GradleKotlin编译Java控制台中文出乱码解决

解决方法 解决方法1 在项目 build.gradle.kts 文件中加入 tasks.withType<JavaCompile> {options.encoding "UTF-8" } tasks.withType<JavaExec> {systemProperty("file.encoding", "utf-8") }经测试, 只加 tasks.withType<…

谷粒商城【成神路】-【4】——分类维护

目录 1.删除功能的实现 2.新增功能的实现 3.修改功能的实现 4.拖拽功能 1.删除功能的实现 1.1逻辑删除 逻辑删除&#xff1a;不删除数据库中真实的数据&#xff0c;用指定字段&#xff0c;显示的表示是否删除 1.在application.yml中加入配置 mybatis-plus:global-config:…

俩种方法解决 VScode中 NPM 脚本消失,NPM 脚本未显示在资源管理器侧栏中

npm脚本是npm包管理器的一个功能&#xff0c;允许开发者在package.json文件中定义一系列命令脚本&#xff0c;用于执行各种开发任务。 今天打开准备运行的时候发现找不到NPM脚本了&#xff0c;左侧的一栏完全没有显示&#xff0c;在网上查阅了很多资料后总结出俩个方法可以用来…

寒假作业2月3号

第二章 引用内联重载 一&#xff0e;选择题 1、适宜采用inline定义函数情况是&#xff08;C&#xff09; A. 函数体含有循环语句 B. 函数体含有递归语句 C. 函数代码少、频繁调用 D. 函数代码多、不常调用 2、假定一个函数为A(int i4, int j0) {;}, 则执行“A (1);”语句…

解密二进制世界:Hex-Rays IDA Pro forMac/win交互式反汇编工具

在当今数字化时代&#xff0c;软件和硬件的安全性成为了重中之重。为了保护软件和硬件免受黑客和恶意攻击的威胁&#xff0c;人们需要了解和分析代码的内部结构和工作原理。而Hex-Rays IDA Pro作为一款强大的交互式反汇编工具&#xff0c;为安全专业人士提供了解密二进制世界的…

Juc07_乐观锁和悲观锁、公平锁和非公平锁、递归锁(可重入锁)、死锁及排查、自旋锁

1、 乐观锁和悲观锁 ①. 悲观锁(synchronized关键字和Lock的实现类都是悲观锁) 什么是悲观锁&#xff1f;认为自己在使用数据的时候一定有别的线程来修改数据&#xff0c;因此在获取数据的时候会先加锁&#xff0c;确保数据不会被别的线程修改适合写操作多的场景&#xff0c;…

lua 语法介绍与 NGINX lua 高级用法实战操作

文章目录 一、概述二、lua 安装三、lua 语法1&#xff09;lua 数据类型2&#xff09;lua 变量3&#xff09;lua 拼接字符串4&#xff09;lua 循环5&#xff09;lua 函数6&#xff09;lua 条件控制7&#xff09;lua 库模块 四、NGINX lua 高级用法 一、概述 lua是一种轻量小巧的…

【AI绘画UI+Windows部署】Fooocus:Controlnet原作者结合了sd的开源和Midjourney重新设计的UI

代码&#xff1a;https://github.com/lllyasviel/Fooocus windows一键启动包下载&#xff1a;https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_2-1-831.7z B站视频教程&#xff1a;AI绘画入门神器&#xff1a;Fooocus | 简化SD流程&#xff0c…

Boosting semantic human matting with coarse annotations

前向推理在modelscope中开源了&#xff0c;但是训练没开源&#xff0c;且是基于TensorFlow的&#xff0c;复现起来是比较麻烦的。 1.Introduction 分割技术主要集中在像素级二元分类&#xff0c;抠图被建模为前景图像F和背景图像B的加权融合&#xff0c;大多数matte方法采用指…

不做中位剧的腾讯,能靠精品撑起长视频会员吗?

回顾腾讯视频的2023年,马化腾用“厚积薄发”来形容。 在腾讯年会上,马化腾回顾了过去一年长视频业务板块的发展情况,同时也清晰地提出了未来的规划,总结来说就是以下三点: 1、《繁花》《三体》《漫长的季节》是腾讯过去一年特别出彩的剧集,几部大剧撑起了长视频会员业务…

设计模式——2_1 命令(Command)

文章目录 定义图纸一个例子&#xff1a;空调和他的遥控器只有控制面板的空调遥控器可以撤销的操作 碎碎念命令和Runnable命令和事务 定义 把请求封装成一个对象&#xff0c;从而使你可以用不同的请求对客户进行参数化&#xff0c;对请求排队或记录请求日志&#xff0c;以及支持…

Spring Bean 生命周期常见错误

虽然说 Spring 容器上手简单&#xff0c;可以仅仅通过学习一些有限的注解&#xff0c;即可达到快速使用的目的。但在工程实践中&#xff0c;我们依然会从中发现一些常见的错误。尤其当你对 Spring 的生命周期还没有深入了解时&#xff0c;类初始化及销毁过程中潜在的约定就不会…

超越现实,体验无限可能——VMware Workstation 的魅力之旅

随着科技的飞速发展&#xff0c;虚拟化技术已经深入人心&#xff0c;成为现代人工作与学习的必备工具。在这其中&#xff0c;VMware Workstation以其卓越的性能和稳定的运行环境&#xff0c;成为众多电脑爱好者和专业人士的首选。今天&#xff0c;让我们一起探索VMware Worksta…

初探unity中的ECS

ECS是一种软件架构模式&#xff0c;就像MVC一样。ECS最早在游戏《守望先锋》中提及到的相关链接。ECS具体是指实体&#xff08;entity&#xff09;、 组件&#xff08;component&#xff09;和系统&#xff08;system&#xff09;&#xff1a; 实体&#xff1a;实体是一个ID&a…

docker踩坑记录

踩坑记录 1.1 后台启动容器&#xff0c;实际没有启动 现象&#xff1a; 后台启动centos&#xff0c;结果执行docker ps命令&#xff0c;容器没启动。 原因&#xff1a; docker是以容器启动的&#xff0c;必须要有个前台进程&#xff0c;若是全部都是后台deamon守护进程&…