期刊如何反击一波可疑图像

出版商正在部署基于人工智能的工具来检测可疑图像,但生成式人工智能威胁着他们的努力。

一位裁剪的男性科学家正在查看DNA测试结果的特写后视图。

期刊正在努力检测用于分析蛋白质和DNA的凝胶的操纵图像。图片来源:Shutterstock

似乎每个月都会有一系列针对研究人员的新高调指控,这些研究人员的论文——其中一些是几年前的——包含可能操纵图像的迹象。

科学家侦探正在使用他们自己训练有素的眼睛,以及基于人工智能(AI)的商业软件,来发现图像复制和其他可能暗示记录保存不严或更糟的问题。他们在 PubPeer 等地方揭露了这些担忧,这是一个在线论坛,每天都有许多新帖子标记图像问题。

其中一些努力已经导致了行动。例如,上个月,位于马萨诸塞州波士顿的丹娜-法伯癌症研究所(DFCI)表示,它将要求期刊撤回或更正其工作人员撰写的大量论文。在一位观察人士对报纸上的图像表示担忧之后,披露了这一信息。该研究所表示,它正在继续调查这些问题。

这一事件只是众多事件之一。面对公众的监督,学术期刊越来越多地采用技巧和工具,包括基于人工智能的商业系统,在出版前而不是出版后发现有问题的图像。在这里,《自然》杂志回顾了这个问题以及出版商如何试图解决这个问题。

发现了哪些类型的图像问题?
有问题的图像做法包括在多个图表中使用相同的数据、复制照片或部分照片,以及删除或拼接图像。例如,此类问题可能表明有误导的意图,但也可能是由于无辜地试图改善人物的审美而造成的。尽管如此,专家说,即使是无辜的错误也可能损害科学的完整性。

这些问题有多普遍,它们是否在上升?
此类事件的确切数量尚不清楚。“撤稿观察”网站维护的数据库列出了超过51,000份记录在案的撤稿、更正或关切表达。其中,大约4%的人表示对图像的担忧。

量化这个问题的最大努力之一是由加利福尼亚州旧金山的科学图像侦探和顾问伊丽莎白·比克(Elisabeth Bik)和她的同事进行的1.他们检查了1995年至2014年间发表的20,000多篇论文中的图像。总体而言,他们发现近4%的论文包含有问题的数字。该研究还显示,从2003年左右开始,不适当的图像重复有所增加,这可能是因为数码摄影使改变照片变得更加容易,Bik说。

比克指出,现代报纸包含的图像也比几十年前的图像更多。“与十年前相比,每天发表的论文要多得多,科学家发表的压力越来越大,再加上所有这些,就会发现更多的问题。

图像问题报告率高也可能是由于“由于全球社会对诚信问题的认识提高而导致举报人数增加”,在加利福尼亚州旧金山的PLOS出版伦理团队工作的Renee Hoch说。

Dana-Farber 癌症研究所发生了什么?
今年1月,位于英国庞特普里德的生物学家和调查员肖尔托·戴维(Sholto David)在博客上发表了一篇关于DFCI科学家发表的50多篇生物学论文中可能的图像操纵的博客,DFCI隶属于马萨诸塞州剑桥市的哈佛大学。作者包括 DFCI 主席 Laurie Glimcher 和她的副手 William Hahn;DFCI发言人表示,他们没有与记者交谈。David的博客强调了近20年来论文中的重复或其他图像异常。该帖子最初由The Harvard Crimson报道。

DFCI已经在调查其中一些问题,正在寻求撤回几篇论文和更正许多其他论文。DFCI的研究诚信官员巴雷特·罗林斯(Barrett Rollins)表示,“尽快纠正科学记录很重要,也是具有强大研究诚信的机构的常见做法”。

“值得重申的是,论文中存在图像重复或差异并不是作者有欺骗意图的证据,”他补充道。

期刊正在采取哪些措施来提高图像完整性?
为了减少处理不当图像的发表,一些期刊,包括《细胞科学杂志》(Journal of Cell Science)、《PLOS 生物学》(PLOS Biology)和《PLOS ONE》,要求或要求作者提交原始图像,以及其图中裁剪或处理过的图像。

许多出版商还将基于人工智能的工具(包括 ImageTwin、ImaCheck 和 Proofig)纳入一致或现场出版前检查中。《科学》系列期刊在一月份宣布,它现在正在使用Proofig来筛选其所有投稿。《科学》系列期刊的主编霍尔顿·索普(Holden Thorp)说,Proofig已经发现了导致编辑决定不发表论文的事情。他说,作者通常很感激他们的错误被发现。

这些基于人工智能的系统会标记哪些类型的问题?
例如,所有这些系统都可以快速检测同一张纸中图像的重复,即使这些图像已被旋转、拉伸或裁剪或改变其颜色。

不同的系统有不同的优点。例如,Proofig 可以发现通过切出或拼接图像部分而创建的拼接。Bik说,ImageTwin的优势在于允许用户将图像与其他论文的大量数据集进行交叉检查。包括施普林格·自然(Springer Nature)在内的一些出版商正在开发自己的AI图像完整性软件。(《自然》杂志的新闻团队在编辑上独立于其出版商施普林格·自然(Springer Nature)。

人工智能工具标记的许多错误似乎是无辜的。在一项对 2021 年和 2022 年初提交给 9 家美国癌症研究协会期刊的 1,300 多篇论文的研究中,Proofig 将 15% 标记为可能存在图像重复,需要对作者进行跟进。作者的回答表明,在207个重复中,有28%是故意的,例如,作者使用相同的图像来说明多个观点。63%是无意的错误。

这些人工智能系统的运作情况如何?
用户报告说,基于人工智能的系统无疑可以更快、更容易地发现某些类型的图像问题。《临床研究杂志》(Journal of Clinical Investigation)在2021年至2022年期间试用了Proofig,发现它使具有潜在问题图像的手稿比例增加了两倍,从1%增加到3%2.

但他们不太擅长发现更复杂的操作,Bik说,或者人工智能生成的伪造。这些工具“对于检测错误和低级完整性漏洞很有用,但这只是更大问题的一个小方面”,EMBO Reports的主编Bernd Pulverer表示同意。“现有的工具充其量只是冰山一角,可能会急剧增长,目前的方法很快就会被淘汰。

出版前检查是否能解决图像问题?
专家团队、技术工具和提高警惕的结合似乎正在发挥作用——目前是这样。“我们已经应用了十多年的系统筛查,并且第一次看到检出率下降,”Pulverer说。

但随着图像处理变得越来越复杂,捕捉它将变得越来越困难,他说。“几年后,我们目前所有的图像完整性筛查仍然有助于过滤错误,但肯定不能用于检测欺诈,”Pulverer说。

从长远来看,如何最好地解决图像处理问题?
Bik说,最终,消除图像处理将涉及对科学研究方式的复杂改变,更加关注严谨性和可重复性,以及对不良行为的影响。她说:“有太多关于欺凌和要求很高的PI在实验室里花费的时间太少的故事,这只会创造一种可以作弊的文化。“这需要改变。”

自然 626, 697-698 (2024)

doi: https://doi.org/10.1038/d41586-024-00372-6

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/473191.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

软件的安装与卸载(YUM)

YUM:yum 是一个方便的"应用商店",你可以通过它轻松地安装、更新和删除软件包,就像从应用商店中下载和安装应用程序一样。(这个得用root身份,普通用户权限不够) 常用命令: 1.安装软件…

阿里云2核4G服务器支持多少人在线?2C4G多少钱一年?

2核4G服务器支持多少人在线?阿里云服务器网账号下的2核4G服务器支持20人同时在线访问,然而应用不同、类型不同、程序效率不同实际并发数也不同,2核4G服务器的在线访问人数取决于多个变量因素。 阿里云2核4G服务器多少钱一年?2核4…

python_django网红基地孵化园场地管理系统flask

作为一个管理孵化园的网络系统,数据流量是非常大的,所以系统的设计必须满足使用方便,操作灵活的要求。所以在设计孵化园管理系统管理系统应达到以下目标: (1)界面要美观友好,检索要快捷简易&…

3.20网络编程

练习: 1> 创建一个工人信息库,包含工号(主键)、姓名、年龄、薪资。 2> 添加三条工人信息(可以完整信息,也可以非完整信息) 3> 修改某一个工人的薪资(确定的一个&#xf…

应用改进SA算法实现MATLAB-HFSS交互仿真与天线优化

应用改进SA算法实现MATLAB-HFSS交互仿真与天线优化 第一章SA算法及其简单应用1.1 SA算法简介1.2 SA算法原理1.2.1 SA算法原理 1.3 Metropolis准则及退火过程中的参数控制1.3.1 Metropolis准则1.3.2退火过程中的参数控制 1.4 SA算法简单应用 第二章 改进SA算法2.1 改进方向2.2 改…

企业如何选择一个开源「好」项目?

开源 三句半 oss-roast 需求明确是关键 风险考量要周全 开源虽好不白捡 别忘合规! 显然,开源已成为一股不可阻挡的洪流,企业拥抱开源,积极参与开源项目不仅是响应技术潮流的必然选择,更是实现自身技术创新、市场拓展等…

新火种AI|国产手机抢滩“AI+折叠屏”赛道,行业洗牌大战就此开启?

作者:小岩 编辑:彩云 从2023年到2024年,随着新一波人工智能浪潮的加速,消费电子产品也迎来了全新的话题——AI。更重要的是,这场战争看似没有硝烟,但各大厂商都已经暗自角力了许久,特别是手机…

PHP全新美化广告横幅在线制作源码

源码简介 可以做网站的引流不需要安装上传就可以使用,在第一版基础上做了二次开发更加好用 注意:主机和服务器均可架设搭建,如果使用宝塔架设点击访问的时候提示找不到文件路径的时候,记得点击网站目录把防跨站攻击先关闭,这样就可以正常访问了,这款是…

华为openEuler系统卸载jdk

华为openEuler系统卸载jdk 1.查看openEuler上已安装的 Java 版本: 在终端中运行以下命令,查看系统中已经安装的 Java 版本。 sudo alternatives --config java这将列出已安装的 Java 版本,你可以看到当前使用的是哪个版本 2.卸载 Java&am…

java static

1、static概念 (1)static 关键字是静态的意思,可以修饰成员方法,成员变量 (2)static 修饰的特点 ① 被类的所有对象共享,这也是我们判断是否使用静态关键字的条件。 ② 可以通过类名调用&…

ActiViz三维场景的基本要素——相机

文章目录 前言一、基本属性和方法二、相机操作三、高级功能四、 示例代码和应用五、总结前言 在ActiViz中,vtkCamera是一个非常重要的类,用于定义观察场景的视角和位置。作为三维可视化的核心组件之一,vtkCamera决定了用户在三维场景中所看到的图像内容和视角,因此它对于呈…

Linux之文件管理与重定向

文件的管理 最开始说到过, 一个进程是可以打开多个文件的并且可以对这些文件做出不同的操作, 也就是说加载到内存中的文件可能存在多个. 操作系统要不要管理这些打开的文件呢? 当我们在程序里面打开多个文件时, 操作系统肯定是得对这些文件进行管理的, 而管理的本质就是对数…

openKylin系统安装ssh服务结合内网穿透实现固定公网地址访问

文章目录 1. 安装SSH服务2. 本地SSH连接测试3. openKylin安装Cpolar4. 配置 SSH公网地址5. 公网远程SSH连接小结 6. 固定SSH公网地址7. SSH固定地址连接 openKylin是中国首个基于Linux 的桌面操作系统开发者平台,通过开放操作系统源代码的方式,打造具有自…

cnetos7将普通用户的权限提升为超级用户

将普通用户的权限提升为超级用户 现象:当我们初次使用sudo命令时,会遇到下面的问题 解决步骤: 显示你当前登录用户的用户名。 whoami将自己的用户切为超级用户,密码为你第一次使用Linux登录时的密码 su -使用vim编辑器打开配…

Dockerfile Docker Compose(实战总结)

Dockerfile & Docker Compose(实战总结) Dockerfile Dockerfile 是用来构建Docker镜像文件,是由一条条构建镜像所需的指令构成的脚步。 步骤: 编写Dockerfile 文件docker build 构建镜像docker run 运行镜像docker push 发…

Hive SQL必刷练习题:日期交叉问题(两种思路)

思路一: ​ 首先想到的是借助炸裂函数,一行变成多行,就可以进行去重操作,然后再统计日期。 用到炸裂函数,就首先需要可以拿到起始和终止日期差大小的数组,然后再炸裂​ 那这个指定长度数组怎么获取呢&…

如何利用生成式AI准备面试?

面试准备的重要性 面试是求职过程中至关重要的一环,它是你与梦想职位之间的桥梁。充分的准备不仅能够增加你获得工作的机会,还能提高你在面试中的自信心。为什么要重视面试准备?因为通过它,你能更好地展示自己的专业能力、个人魅…

Linux chapter1 常用命令 cp

note 1 : netstat、curl、ip、nmap、dig 这些都是常用的网络诊断工具,它们的全称如下: netstat:Network Statistics,网络统计,用于显示网络连接,路由表,网络接口统计等网络信息。curl&#xf…

第七节:使用SMB发布Web前端程序

一、概述 一直以来,多数人都使用Apache、IIS、Tomcat等开源或商业Web服务器来运行Web程序,各种参数太多,与我们简单易用逻辑相左。所以在架构设计的时候,我们也在考虑,我们公司的Web程序是否能运行在SMB中,…

维度建模理论之维度表

维度表概述 维度表是维度建模的基础和灵魂。前文提到,事实表紧紧围绕业务过程进行设计,而维度表则围绕业务过程所处的环境进行设计。维度表主要包含一个主键和各种维度字段,维度字段称为维度属性。 维度表设计步骤 1)确定维度&…