我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。
上一篇介绍了10个检测AI率的在线工具。本篇来说说AI率到底是如何检测出来的?该如何有效降低论文的AI率?
和AI大模型一样,AI检测的核心也是机器学习模型,它们在包含人类创作和AI生成文本样本的大型数据集上进行训练,通过学习每种文本中存在的模式和特征,以此来区分人类创作的文本和AI生成文本。
AI检测器查找的一些关键特征包括:
1 单词分布和重复性:
与人类写作相比,AI语言模型有时会过度使用某些单词或短语,使得单词频率分布显得不自然。比如,之前有个调查,pubmed数据库中自2023年以来,delve into的使用频次剧增,而这个词组正是ChatGPT的使用偏好之一。
此外,在同行评审中,某些词语(如“commendable值得称赞的”、“meticulous细致的”和“intricate复杂的”)的使用频率发生了显著变化。
详见:斯坦福最新研究:ChatGPT除了写论文,竟有17%的同行评审也是AI生成。
2 连贯性和逻辑性
虽然AI生成的文本在语法上可能是正确的,但它有时可能缺乏人类写作所自然具备的深层次语义理解、逻辑连贯性。比如,中文写作中出现的“首先、其次、然而、并且”等读起来很生硬的转折和连词。
逻辑性方面,有时候AI生成的文本并不具备意思上的因果关系,也就是它在“一本正经的胡说八道”。需要人类来确认这些内容的合理性。
3 创造力和原创性的局限:
在人类擅长的创造性隐喻、类比或提出真正新颖的观点方面,AI生成的内容逊色很多,因为这些内容超出了它的训练数据范畴。
4 内容的可预测性和困惑度:
这个检测指标是说,比如困惑度分数这样的统计指标可以反映一段文本内容的可预测性或意外性。与AI生成的文本相比,人类写作往往更加多样化和充满惊喜。而AI生成的文本则会显得很平淡和稍显乏味。
5 句子结构的单一性:
人类作者的文本在句子长度和结构上表现出更大的变化性,比如长句短句结合,各种语气的句子结合,而AI生成的文本则可能较为单一。
6 风格和语调一致性:
人类作者的写作通常风格、语调和语气在一篇文章中是一致的,而AI生成的文本则可能在同一篇文章中会出现风格上的突然转变。
AI检测工具的可靠性如何?
我在对比那10款AI检测工具的时候就发现,同样的一段文本内容,不同的工具显示出的AI率有很大差异。其实最早ChatGPT也生产过一款AI检测工具,后来下架了,因为它也发现测不准。
因为,一方面,AI能够生成文本也是在大量人类文本预训练的基础上获得的,只要提示语用得好,它可以无限接近人类风格。比如我的课程中的“论文润色提示语”,AI检测率为0.
另一方面,它也可能出现误报。一个精心润色、结构化的人类写作文本,可能因为其完美无瑕的特性而被错误标记为AI生成。
此外,AI检测器需要不断追赶快速发展的生成AI技术。随着AI模型变得更加先进,曾经容易识别的机器生成内容现在越来越接近人类的个性化特征,AI文本检测器的可靠性在很大程度上取决于检测算法的持续开发和改进。
如何有效降低论文的AI率?
1 使用更精细化的提示语prompt:
简单的改写可能不足以绕过AI检测器,它们能够识别出典型的生成式AI的模式。
但是,使用更加精细化的提示语,让AI更深度的在句子结构、语法、风格上模仿并生成人类语言,从而更贴近人类写作风格。
2 混合数据来源:
从多个多样化的来源获取数据或研究内容,可以有效地掩盖AI检测工具追踪的数字足迹。
数据来源的多样性不仅丰富了内容的真实性和复杂性,而且让AI检测器更难检测。
3 增强人类元素:
即使是使用AI写作工具,融入独特的人类洞察力和经验也至关重要。
为了降低AI检测率,尝试将你的个人独特风格融入写作,比如:独特语气语调,展示细节的真实生活的例子。
4 融入习语语言:
AI生成的内容往往缺乏人类写作中特有的习语、行话和口语表达。通过融入口语和地区习语,让你的内容显得更真实、更易于得到人类的认同。
5 在修改过程中使用AI检测器:
这种预防性检测,帮助你找出容易被标记为AI生成的文本元素,比如某些重复的模式或不自然的措辞。然后再通过重构句子、改变词序、替换同义词和重组段落的方式,来针对性降低AI率。
6 持续跟踪AI技术的发展:
随着AI能力的增长,检测此类内容的技术也在不断发展。持续保持对AI进展的关注,可以有效提升你利用AI的创作效率,并避免AI检测过高。
随着AI大模型的不断进化,这些AI检测工具也需要不断改进。
AI大模型和AI检测工具的具备竞赛在不断升级。对于我们人类创作者来说,跟上技术的进展,左右大模型,右手检测工具,让这些效率工具都为“我”所用,提升论文产出效率和质量,就对了。