论文AI率:检测原理是什么?该如何降低论文AI率?

我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。

图片

上一篇介绍了10个检测AI率的在线工具。本篇来说说AI率到底是如何检测出来的?该如何有效降低论文的AI率?

和AI大模型一样,AI检测的核心也是机器学习模型,它们在包含人类创作和AI生成文本样本的大型数据集上进行训练,通过学习每种文本中存在的模式和特征,以此来区分人类创作的文本和AI生成文本。

AI检测器查找的一些关键特征包括:

单词分布和重复性:

与人类写作相比,AI语言模型有时会过度使用某些单词或短语,使得单词频率分布显得不自然。比如,之前有个调查,pubmed数据库中自2023年以来,delve into的使用频次剧增,而这个词组正是ChatGPT的使用偏好之一。



此外,在同行评审中,某些词语(如“commendable值得称赞的”、“meticulous细致的”和“intricate复杂的”)的使用频率发生了显著变化。

详见:斯坦福最新研究:ChatGPT除了写论文,竟有17%的同行评审也是AI生成。


2 连贯性和逻辑性

虽然AI生成的文本在语法上可能是正确的,但它有时可能缺乏人类写作所自然具备的深层次语义理解、逻辑连贯性。比如,中文写作中出现的“首先、其次、然而、并且”等读起来很生硬的转折和连词。

逻辑性方面,有时候AI生成的文本并不具备意思上的因果关系,也就是它在“一本正经的胡说八道”。需要人类来确认这些内容的合理性。


3 创造力和原创性的局限:

在人类擅长的创造性隐喻、类比或提出真正新颖的观点方面,AI生成的内容逊色很多,因为这些内容超出了它的训练数据范畴。


4 内容的可预测性和困惑度:

这个检测指标是说,比如困惑度分数这样的统计指标可以反映一段文本内容的可预测性或意外性。与AI生成的文本相比,人类写作往往更加多样化和充满惊喜。而AI生成的文本则会显得很平淡和稍显乏味。


5 句子结构的单一性:

人类作者的文本在句子长度和结构上表现出更大的变化性,比如长句短句结合,各种语气的句子结合,而AI生成的文本则可能较为单一。


6 风格和语调一致性:

人类作者的写作通常风格、语调和语气在一篇文章中是一致的,而AI生成的文本则可能在同一篇文章中会出现风格上的突然转变。

AI检测工具的可靠性如何?

我在对比那10款AI检测工具的时候就发现,同样的一段文本内容,不同的工具显示出的AI率有很大差异。其实最早ChatGPT也生产过一款AI检测工具,后来下架了,因为它也发现测不准。

因为,一方面,AI能够生成文本也是在大量人类文本预训练的基础上获得的,只要提示语用得好,它可以无限接近人类风格。比如我的课程中的“论文润色提示语”,AI检测率为0.

另一方面,它也可能出现误报。一个精心润色、结构化的人类写作文本,可能因为其完美无瑕的特性而被错误标记为AI生成。

此外,AI检测器需要不断追赶快速发展的生成AI技术。随着AI模型变得更加先进,曾经容易识别的机器生成内容现在越来越接近人类的个性化特征,AI文本检测器的可靠性在很大程度上取决于检测算法的持续开发和改进。


如何有效降低论文的AI率?

1 使用更精细化的提示语prompt:

简单的改写可能不足以绕过AI检测器,它们能够识别出典型的生成式AI的模式。

但是,使用更加精细化的提示语,让AI更深度的在句子结构、语法、风格上模仿并生成人类语言,从而更贴近人类写作风格。

2 混合数据来源:

从多个多样化的来源获取数据或研究内容,可以有效地掩盖AI检测工具追踪的数字足迹。

数据来源的多样性不仅丰富了内容的真实性和复杂性,而且让AI检测器更难检测。

3 增强人类元素:

即使是使用AI写作工具,融入独特的人类洞察力和经验也至关重要。

为了降低AI检测率,尝试将你的个人独特风格融入写作,比如:独特语气语调,展示细节的真实生活的例子。

4 融入习语语言:

AI生成的内容往往缺乏人类写作中特有的习语、行话和口语表达。通过融入口语和地区习语,让你的内容显得更真实、更易于得到人类的认同。

5 在修改过程中使用AI检测器:

这种预防性检测,帮助你找出容易被标记为AI生成的文本元素,比如某些重复的模式或不自然的措辞。然后再通过重构句子、改变词序、替换同义词和重组段落的方式,来针对性降低AI率。

6 持续跟踪AI技术的发展:

随着AI能力的增长,检测此类内容的技术也在不断发展。持续保持对AI进展的关注,可以有效提升你利用AI的创作效率,并避免AI检测过高。

随着AI大模型的不断进化,这些AI检测工具也需要不断改进。

AI大模型和AI检测工具的具备竞赛在不断升级。对于我们人类创作者来说,跟上技术的进展,左右大模型,右手检测工具,让这些效率工具都为“我”所用,提升论文产出效率和质量,就对了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/618873.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

实验0.0 Visual Studio 2022安装指南

Visual Studio 2022 是一个功能强大的开发工具,对于计算机专业的学生来说,它不仅可以帮助你完成学业项目,还能为你将来的职业生涯打下坚实的基础。通过学习和使用 Visual Studio,你将能够更高效地开发软件,并在编程领域…

VBA_NZ系列工具NZ07:日期录入控件

我的教程一共九套及VBA汉英手册一部,分为初级、中级、高级三大部分。是对VBA的系统讲解,从简单的入门,到数据库,到字典,到高级的网抓及类的应用。大家在学习的过程中可能会存在困惑,这么多知识点该如何组织…

在MySQL中如何创建数据库和表

创建数据库 代码格式: CREATE DATABASE (IF NOT EXISTS) 数据库名 (CHARSET utf8) 代码如下: CREATE DATABASE IF NOT EXISTS test CHARSET utf8; 运行完代码之后,右键rootlocalhost,点击刷新对象浏览器即可 注意:mysql数据库一旦创建名字不能修改,只能修改字符…

2024最新最全【网络安全】逆向工程教学

逆向工程 以设计方法学为指导,以现代设计理论、方法、技术为基础,运用各种专业人员的工程设计经验、知识和创新思维,对已有产品进行解剖、深化和再创造。 逆向工程不仅仅在计算机行业、各行各业都存在逆向工程。 计算机行业逆向工程 计算…

Ansible之playbook剧本

目录 1. playbook的组成 2. 剧本示例test1 2.1 剧本制作 2.2 准备http.conf 2.3 运行剧本 2.4 查看webserbers服务器 3. 剧本示例test2--定义、引用变量 3.1 剧本制作 3.2 运行剧本 3.3 查看dbservers服务器 3.4 修改剧本中的变量设定 3.5 在命令行定义变量运行剧本…

Tableau-BI仪表盘搭建

目录 经营数据总览 经营数据详情 每日营收数据 每日流量数据 新老客占比 平台占比 门店占比 投放情况 订单分布 配送分布 汇总搭建仪表板 构思仪表盘布局 经营数据总览 数据总览表,显示的是数据,就拖入文本中,其他同样加入到已经…

vscode打开esp-idf工程,找不到头文件,有波浪线

就像这样 多半是因为原始的工程不是用vscode的插件新建的,因此没有相关的路径。需要在工程文件夹下的.vscode文件夹中的c_cpp_properties.json文件中增加路径,可以参考插件自动新建的工程里面的写法 {"configurations": [{"name":…

1064 朋友数

solution 给出n个整数&#xff0c;统计可能的位数和&#xff0c;并按升序输出&#xff08;考虑用set实现&#xff09; #include<iostream> #include<set> using namespace std; int main(){set<int> st;int n, x, sum;scanf("%d", &n);while…

猫头虎分享已解决Bug || 已解决ERROR: Ruby Gems安装中断 ⚠️ Bug 报告:Gem::RemoteFetcher::FetchError

猫头虎分享已解决Bug || 已解决ERROR: Ruby Gems安装中断 ⚠️ Bug 报告&#xff1a;Gem::RemoteFetcher::FetchError 博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; …

Unity图形图表XChart插件使用

最近做了一款数字孪生项目,其中涉及到了图形图表的应用,网上找了一下,找到了XChart插件,使用起来蛮方便的,不过还有待继续研究,很多细节性的知识点需要进行学习探索。以下是项目中的应用。 官方应用: ![](https://img-blog.csdnimg.cn/direct/ab9de8e84e7b4be4a50ea…

数据库 MySQL 四种事务隔离级别代码演示 -- 读未提交;读已提交;可重复读;串行化

前提 # 设置数据库隔离级别 SET SESSION TRANSACTION ISOLATION LEVEL 隔离级别;# 查询事务隔离级别 select transaction_isolation;事务处理的分离水平对应的数据整合情况&#xff1a; 隔离级别非提交读取&#xff08;脏读&#xff09;不可重复读取幻读READ UNCOMMITED√√√…

浏览器执行渲染原理

一、事件循环 事件循环&#xff08;Event Loop&#xff09;是JavaScript的执行环境的核心概念之一&#xff0c;它负责处理JavaScript中的异步操作和执行顺序。事件循环使得JavaScript能够在单线程上有效地处理并发&#xff0c;同时保持编程模型的简单性。 以下是事件循环的一…

浅谈SiC MOSFET之MOSFET

1.掺杂后的半导体 P型半导体&#xff0c;多子是空穴&#xff0c;少子是自由电子。 N型半导体&#xff0c;多子是自由电子&#xff0c;少子是空穴。 2.电中性 尽管他们分别有着空穴带正电&#xff0c;自由电子带负电&#xff0c;但是整体上是电中性的。 以P型半导体为例&…

开发时如何快速分析代码和生成测试方法(Baidu Comate插件帮我一键分析)

目录 前言 Baidu Comate智能编码助手简介 安装教程 使用RabbitMQ一个绑定队列方法进行演示 进行测试现有功能 使用感觉 测试结果 前言 因为在开发代码的时候&#xff0c;发现有很多都是废话也不是很想写注释 的&#xff0c;毕竟程序员最讨厌的两件事情&#xff0c;一…

scrum项目管理系统,免费scrum管理工具

Leangoo领歌是一款永久免费的专业的敏捷开发管理工具&#xff0c;提供端到端敏捷研发管理解决方案&#xff0c;涵盖敏捷需求管理、任务协同、进展跟踪、统计度量等。 Leangoo领歌上手快、实施成本低&#xff0c;可帮助企业快速落地敏捷&#xff0c;提质增效、缩短周期、加速创新…

一款简约大气的个人单页介绍主页(附加源码)

一款简约大气的个人单页介绍主页&#xff08;附加源码&#xff09; 效果图部分源码领取源码下期更新预报 效果图 部分源码 .box_bg{width: 100%;height: 100%; }.wenzi{text-align: center;float: left;display: inline;width: 112px;line-height: 48px; } .wenzi2{text-align…

LORA学习笔记2——训练集处理

前言 对于ai训练来说&#xff0c;处理训练集是模型训练的重要环节。训练集的质量对最终模型的质量影响巨大。这里以二次元角色为例&#xff0c;记录下训练集处理的流程和一些心得。 素材准备 素材准备有以下几个需要注意的点&#xff1a; 通常训练二次元角色需要30张以上的…

Selenium操作对象的方法汇总(如click/clear/submit/sendKeys/getText/getSize等)

天行健&#xff0c;君子以自强不息&#xff1b;地势坤&#xff0c;君子以厚德载物。 每个人都有惰性&#xff0c;但不断学习是好好生活的根本&#xff0c;共勉&#xff01; 文章均为学习整理笔记&#xff0c;分享记录为主&#xff0c;如有错误请指正&#xff0c;共同学习进步。…

idea选中一个词修改时光标进入悬浮框无法修改

idea选中一个词修改时光标进入悬浮框无法修改 设置参数信息悬悬浮时间&#xff1a; File-->Settings-->Editor-->Code Completion-->Show parameter info popup

LeetCode 题目 121:买卖股票的最佳时机

❤️❤️❤️ 欢迎来到我的博客。希望您能在这里找到既有价值又有趣的内容&#xff0c;和我一起探索、学习和成长。欢迎评论区畅所欲言、享受知识的乐趣&#xff01; 推荐&#xff1a;数据分析螺丝钉的首页 格物致知 终身学习 期待您的关注 导航&#xff1a; LeetCode解锁100…