记录一次“top负1”比赛经历

获奖啦!

比赛题目:中文语义病句识别与纠正挑战赛
比赛链接:https://challenge.xfyun.cn/topic/info?type=identification-and-correction&option=phb

“请介绍你们团队”

“各位评委老师,我是来自WOT团队的选手AMBT,口号是将中文语义病句识别与纠正提升到新高度”

“你们参加比赛的初衷是什么?”

“为了中文自然语言处理崛起而奋斗”
“为了学术交流”

“请AMBT务实一点”

“为了参赛拿奖金买坦克”

“请介绍你们解决问题的思路”

“我们将中文语义病句识别与纠正分成【识别】与【纠正】两个流水线任务,先识别出哪些是病句,然后对病句进行修正。识别是否病句基于传统预训练模型+是否为病句进行二分类微调,修正基于端到端以及LLM进行微调,生成病句纠正之后的正确句子”

文字过多,下面直接贴图了:

“你们比赛思路确实很全面,恭喜你们团队获得第一”

醒醒吧!

某日下午,“叮叮叮”,“叮叮叮”,“叮叮叮”,扭头一看桌面上手机响了,接了电话。

“请问你是来自中文语义病句识别与纠正挑战赛的top1团队是吧”

“对,请问你是”

“赛题方审核结果是存在违规使用其他标注数据行为,直接取消比赛成绩”

“请问赛题方检测出什么了”

“你们使用了2022年数据的标注”

后来扯皮了很久,后来苦苦婆心解释了一达通,就是直接取消成绩,对,就是这么残忍。

因为比赛规则里面确实规定了禁用额外标注数据,主办方说取消成绩也只能强忍头皮认了。

感触!

  • 为什么会使用2022年的数据。

一个是没注意到比赛规则。另外一个就是大家可以翻一番这两个比赛任务和主办方是一样的,所以一开始做任务1的时候就理所当然用了去年数据:
2023年比赛链接:https://challenge.xfyun.cn/topic/info?type=identification-and-correction&option=phb
2022年比赛链接:https://challenge.xfyun.cn/topic/info?type=sick-sentence-discrimination


为什么有同样格式的、同样比赛任务、同样出题方的数据,能提升效果为啥不能用呢?是学术倒退还是野鸡反噬?是选手眼瞎还是规则严厉?

都不是!可能就是太“理所当然了”,太小看一个国内比赛剧本精彩程度了!

自己在复现方案里面如实提到了,也不是故意使用的,下面就是提交的复现说明。后来和他们沟通,重新跑一次没有使用去年数据的模型提交也不行,就是直接取消成绩!主办方应该是从这里看到的吧。

  • 主办方与选手的关系

主办方到底有没有认真去复现选手的代码?

结合以往经历选手辛苦准备的从1GB到20GB代码和权重有没有去看过,更有甚者选手准备的百度云文件他们下载次数为0?

主办方确实可以拿着一个规则否定选手几个月的付出,这个时候选手略显苍白无力

你在键盘巧了几百字,几十行微信消息,可能被别人搪塞一句“我和主办方沟通了,确实不行”,其实是不是她下班回家,懒的管你?

  • 选手应该怎么保护自己呢

仔仔细细看好规则,在规则下玩比赛。

野鸡有野鸡的玩法,用平常心态对待比赛,不要拿Kaggle视角对待国内比赛

记录证据,比赛和微信等相关,互联网是有痕迹的?

国内比赛还是挺香的,恰钱是不是挺香的,权衡利弊下好好想想怎么做到高性价比

比赛过程中的隐性利益冲突很多,学会躲避

国内倒霉蛋!

记一次很有趣的数据挖掘竞赛答辩经历

分割线
其实还是不理解为什么不是故意使用同样比赛数据集直接取消成绩?为什么重新跑也不可以?

如果看到“不让用之前的数据集”我绝对不会用,也不会傻白甜写在复现方案里面。因为当时主办方是一家,然后赛题任务是一样的就用了,kaggle类似fb系列和common系列数据集都是可以用的,另外这个数据和本次比赛是有交集的,就是多了额外新的数据。其实怎么说我们理亏的,因为里面写不能让用额外标注的数据,虽然后续提出重新跑也不行,反正结果也认了,当作一次警戒吧。

分割线
主办方有没有认真复现每个人的代码?只有参加这个比赛才能深入了解吧,想表达的是要是每个人代码复现都可以,主要是自己也不是故意,要是故意的自己也隐藏了,然后想的是重新跑下提交主办方说也没机会。因为这次确实规则写了,所以没办法,重点是后面写点感触以及其中沟通的过程了,不针对本次比赛。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/91359.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

知识储备--基础算法篇-动态规划

1.前言 第一次接触动态规划,不知道具体什么意思,做了题才发现动态规划就是把大问题变成小问题,并解决了小问题重复计算的方法称为动态规划。比如上楼梯,一次上一阶或二阶,求有多少种算法,就可以拆成最后一…

【Flutter】Flutter 使用 infinite_scroll_pagination 实现无限滚动分页

【Flutter】Flutter 使用 infinite_scroll_pagination 实现无限滚动分页 文章目录 一、前言二、安装和基本使用1. 添加依赖2. 基础配置和初始化 三、实际业务中的用法1. 与 API 集成2. 错误处理 四、完整示例1. 创建一个无限滚动列表2. 使用在你的应用中3. 完整代码示例 五、总…

SFM structure from motion

struction就是空间三维点的位置 motion 就是相机每帧的位移 https://www.youtube.com/watch?vUhkb8Zq-dnM&listPL2zRqk16wsdoYzrWStffqBAoUY8XdvatV&index9

VBA Excel自定义函数的使用 简单的语法

一个简单的教程,实现VBA自定义函数。 新建模块 复制后面的代码放进来 函数的入口参数不定义,则认为是一块区域; 反之,如FindChar1 As String,则认为是输入的单值。 循环和分支如下例子,VB比较接近自然语…

Ubuntu22.04安装中文输入法►由踩坑到上岸版◄

Ubuntu22.04安装中文输入法►由踩坑到上岸版◄ 了解入坑上岸 更新一发:Gedit中文乱码问题的解决 为了方便回忆和记录甚至后面继续重装系统,我还是写一下以便将来用到或参考~ 了解 安装Ubuntu22.04(截至2023年08月26日11&#xff…

Docker架构及原理

一、Docker的架构图 二、底层原理 Docker是怎么工作的? Docker是一个Client-Server结构的系统,Docker守护进程运行在主机上, 然后通过Socket连接从客户端访问,守护进程从客户端接受命令并管理运行在主机上的容器。 容器&#xf…

wireshark流量分析

一、题目一(1.pcap) 题目要求: 1.黑客攻击的第一个受害主机的网卡IP地址 2.黑客对URL的哪一个参数实施了SQL注入 3.第一个受害主机网站数据库的表前缀(加上下划线例如abc) 4.第一个受害主机网站数据库的名字 看到题目SQL注入&#xff0…

微服务(多级缓存)

目录 多级缓存 1.什么是多级缓存 2.JVM进程缓存 2.2.初识Caffeine 2.3.实现JVM进程缓存 2.3.1.需求 2.3.2.实现 3.Lua语法入门 3.1.初识Lua 3.1.HelloWorld 3.2.变量和循环 3.2.1.Lua的数据类型 3.2.2.声明变量 3.2.3.循环 3.3.条件控制、函数 3.3.1.函数 3.3.…

机器学习简介[01/2]:简单线性回归

Python 中的机器学习简介:简单线性回归 一、说明 简单线性回归为机器学习提供了优雅的介绍。它可用于标识自变量和因变量之间的关系。使用梯度下降,可以训练基本模型以拟合一组点以供未来预测。 二、技术背景 这是涵盖回归、梯度下降、分类和机器学习的其…

下载的文件被Windows 11 安全中心自动删除

今天从CSDN上下载了自己曾经上传的文件,但是浏览器下载完之后文件被Windows安全中心自动删除,说是带病毒。实际是没有病毒的,再说了即便有病毒也不应该直接删除啊,至少给用户一个保留或删除的选项。 研究了一番,可以暂…

springboot整合第三方技术邮件系统

springboot整合第三方技术邮件系统,发邮件是java程序的基本操作,springboot整合javamail其实就是简化开发。不熟悉邮件的小伙伴可以先学习完javamail的基础操作,再来看这一部分内容才能感触到springboot整合javamail究竟简化了哪些操作。简化…

vue ui 创建项目没有反应

问题 cmd中输入 vue ui 没有反应 解决办法 vue ui命令需要vue3.0以上的版本才可以 1、查看当前版本 vue --version vue版本在3.0以下是没有ui命令的 2、查看版本所拥有的命令 vue -h 3、卸载之前版本的vue npm uninstall vue-cli -g 卸载完成,检查是否已经…

elementui table 在浏览器分辨率变化的时候界面异常

异常点: 界面显示不完整,表格卡顿,界面已经刷新完成,但是表格的宽度还在一点一点变化,甚至有无线延伸的情况 思路: 1. 使用doLayout 这里官方文档有说明, 所以我的想法是,监听浏览…

HTML5-1-标签及属性

文章目录 语法规范标签规范标签列表通用属性基本布局 页面的组成: HTML(HyperText Markup Language,超文本标记语言)是用来描述网页的一种语言,它不是一种编程语言,而是一种标记语言。 HTML5 是下一代 HTM…

第四章:树形结构的关联式容器(map+set)

系列文章目录 文章目录 系列文章目录前言1、关联式容器与序列式容器1.1 键值对 2、set的介绍3、multiset的介绍3.1 接口count与容器multiset 4、map的介绍4.1 接口insert4.2 operator[]和at 5、multimap的介绍 前言 根据应用场景的不桶,STL总共实现了两种不同结构的…

Elasticsearch(十四)搜索---搜索匹配功能⑤--全文搜索

一、前言 不同于之前的term。terms等结构化查询,全文搜索首先对查询词进行分析,然后根据查询词的分词结果构建查询。这里所说的全文指的是文本类型数据(text类型),默认的数据形式是人类的自然语言,如对话内容、图书名…

springboot+mp完成简单案例

目录 1.框架搭建 2.前端搭建 3.后端编写 需求&#xff1a;完成简单的连表条件查询以及添加即可 1.框架搭建 1.创建springboot项目 2.相关依赖 <!--web依赖--><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boo…

Leetcode每日一题:1448. 统计二叉树中好节点的数目(2023.8.25 C++)

目录 1448. 统计二叉树中好节点的数目 题目描述&#xff1a; 实现代码与解析&#xff1a; dfs 原理思路&#xff1a; 1448. 统计二叉树中好节点的数目 题目描述&#xff1a; 给你一棵根为 root 的二叉树&#xff0c;请你返回二叉树中好节点的数目。 「好节点」X 定义为&…

基于MATLAB开发AUTOSAR软件应用层Code mapping专题-part 4 Data store标签页介绍

这篇文章我们继续讲解code-mapping的Data stores页,这个页的内容对应的SIMULINK中的模块是Data store memory。 我们首先在模型中创建一个Data store memory模块,如图: Data store memory模块的作用相当于一个全局变量,我们可以在模型的功能逻辑里将一个信号存进去,在另…

docker harbor私有库

目录 一.Harbor介绍 二.Harbor的特性 三.Harbor的构成 四.Harbor构建Docker私有仓库 4.2在Server主机上部署Harbor服务&#xff08;192.168.158.25&#xff09; 4.2.1 这时候这边就可以去查看192.168.158.25网页 4.3此时可真机访问serverIP 4.4通过127.0.0.1来登陆和推送镜…