在整个价值链构建负责任的 AI

在整个价值链构建负责任的 AI:从数据到部署,以合乎伦理道德的方式构建 AI

构建合乎伦理道德的 AI 是所有人工智能企业的责任,这一点再怎么强调都不为过。负责任或合乎伦理道德的 AI 能够做到公正、公平,并能改善AI服务人群的生活质量。在实践中,这要求 AI 实践者将伦理道德框架应用于构建 AI 的每项工作之中,确保所涉及的人员、流程和工具服务于这项更重大的使命。

在整个 AI 价值链中,负责任的 AI 应该在一些关键接触点发挥作用。如果 AI 开发者忽略了任何一个接触点,就会导致 AI 项目因不符合公平公正原则而面临风险。AI 实践者在构建负责任的 AI 时,首先应了解价值链各环节间如何相互影响,以及每一环节需要考虑的因素。

AI 开发周期

在开发 AI 项目之前,您的团队可以先采取一些行动,为打造合乎伦理道德的 AI 产品奠定基础。

了解产品必须遵守的法规。这些法规因地区不同而有所差异;例如,《通用数据保护条例》(GDPR) 适用于欧盟地区的 AI 开发应用。

从负责任的角度出发,建立一个 AI 治理框架。在框架中列出指导性问题,帮助您明确 AI 开发生命周期中需要考虑的关键因素。数据治理尤其应该成为重点关注领域,因为它对模型性能具有重大影响。

招募多元化的数据科学家和研究人员团队,为 AI 开发带来不同的视角和经验。

完成上述几个初始行动后,您可以更好地在 AI 构建过程中做出负责任的决策。一旦确定了需要解决的业务问题,AI 价值链便从数据采集开始,通过部署逐步向前推进,然后在后期制作的再训练过程中不断循环。我们将介绍每个环节需要考虑的与负责任的 AI 有关的关键因素:

数据采集

在采集数据时,要尽可能保证数据的完整性和广泛性。数据所代表的最终用户类型(尤其是数据各自的使用场景)越多,您的 AI 就能更好地服务于各类群体。只有当 AI 产品公平地为每一个人服务时,才能构建合乎伦理道德的 AI,而代表性数据就是建立公平的基础。

如果是从第三方获取数据,则理应由双方共同承担责任,确保数据无偏见。此外,最好不要做任何假设。例如,在采集科学家的图像数据时,不能假设数据集或所有统计数据已代表全部类型的科学家。即使您早已了解数据的完整性和广泛性有多重要,最后您还需要付诸行动,仔细检查数据质量,以确保数据涵盖所有可能存在的使用场景。

数据准备

通常,当我们在谈论负责任的 AI 并提到与数据准备有关的内容时,我们的关注点是标注过程本身,并且目标是采用准确和无偏见原则进行标注。确实,这一点十分关键,会影响到最终模型性能中的偏见程度。数据准备的关键在于通过招募多元化群体(最好能够广泛代表您的最终用户)来提供数据标注。多元化群体能够带来不同的视角,并减少片面化的判断。

在数据准备中,我们往往会忽略数据背后的个体待遇。作为 AI 实践者,必须确保这些个体得到公平对待,因为他们是 AI 价值链中重要却不被重视的一部分。公平待遇包括提供公平薪酬、保护隐私权以及提供开放的反馈渠道。(想要了解澳鹏是如何为标注员提供福祉,请参阅《众包伦理道德规范》)。

模型训练和测试

负责任的 AI 不仅与数据有关。当您构建好模型并开始使用准备好的数据对模型进行训练时,您将需要监测模型性能。性能评估的最常见指标是模型预测的准确性(例如,对于捕捉人们过马路的图像,模型是否总能识别出其中的行人?)。

然而,在评估准确性时需要关注更多细微差别。您需要针对各个最终用户群体来评估模型的准确性。您选择的群体取决于您需要解决的问题,但在与受保护群体(即在种族或性别等方面具有共同特征并且受法律保护的群体)接触时,请时刻留意一个问题,即在为保护群体与非保护群体提供服务时,模型是否能够做到公平公正?如果无法做到,您可能需要使用其他数据重新训练模型,这些数据要能够代表被模型差别对待的群体。

除了评估模型准确性外,还可以考虑增加一个直接评估偏见的指标。虽然增加偏见评估指标可以帮助您快速发现与偏见有关的实例,但不应以此取代常规的人工质量检查。请注意,如果您需要进一步了解如何将这项指标添加到任务面板,可以使用提供此功能的软件选项。

后期处理

在完成模型部署后,持续评估模型在各用户群体中的表现,并检查模型是否按照预期运作。在这过程中,确保用户能轻松提供反馈是一项重要工作,这能够帮助您尽快发现并解决问题。

如果您从不对模型进行重新训练,模型性能就会随着时间的推移而逐渐降低;大多数模型并不在静态环境中运行,而是会经常遇到新的不断变化的数据。您需要重新采集数据并在剩余的 AI 开发周期中,定期使用新数据来重新训练模型。

构建负责任的 AI 的后续步骤

如果从全局来看,我们仍然需要不断推动负责任的 AI 向前发展。更多企业需要明白,负责任的 AI 是获得成功的必要条件,它是一项重要的工作任务,而不仅仅只是一种锦上添花。如果有更多企业能够接受这一概念,或许未来就不需要制定可能会妨碍 AI 发展的严格法规。

作为 AI 实践者,您目前还能采取哪些行动来推动负责任的 AI 继续向前发展?您可以持续关注与符合伦理道德的 AI 有关的最新消息,了解不同行业对负责任的 AI 的看法,以及向客户和标注员寻求定期反馈。详细记录您在开发过程中所做的选择和使用的工具,帮助解决 AI 的可解释性问题,协助我们所有人更好地了解这些创新理念的运作方式。最重要的是,在整个 AI 开发周期中,以公平和包容的方式开展各种项目。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/433055.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024年主攻外贸爆款产品,聚焦10个重要国家

2024年中企出海趋势明显,中小微企业纷纷布局。提供15个国家重点进口产品供参考,助力选品和行业开发。 以下是15个重点国家的爆款产品: 一、美国进口频次前10位 二、俄罗斯进口频次前10位 三、英国进口频次前10位 四、越南进口频次前10位 五…

Claude 3超越GPT-4?Anthropic发布新一代AI模型,Opus在多领域展现行业新水准,你不得不看的全面解析!

Anthropic发布了新一代AI模型——Claude 3。 这个系列包括Haiku、Sonnet和Opus三个模型。 特别是Opus,在多个基准测试中,它的表现都超过了我们熟知的GPT-4和Gemini 1.0 Ultra。 在数学、编程、多语言理解和视觉处理等多个方面,Opus都展现了…

期货开户交易切勿满仓操作

平时我们交易主要是仓位管理风险,切勿不要满仓操作,满仓相当于一锤子买卖,我们做交易要有交易计划,计划中除了开仓点.止损点.止盈点外,还有加仓点,所以我们要留下充足的加仓仓位,有很多投资者是…

如何处理Docker容器占用空间不断变大

在使用Docker容器时,一个常见的问题是容器占用的空间会不断增大,导致磁盘空间的快速耗尽。这种情况可能会给系统带来不必要的负担,因此需要及时处理。本文将介绍一些解决Docker容器占用空间不断增大问题的方法。 首先,我们需要了…

基于vgg16进行迁移学习服装分类

pytorch深度学习项目实战100例 的学习记录 我的环境: 白票大王: google colab 用其他的话,其实实现也行,但是让小白来重环境来开始安装的话,浪费时间 数据集 Clothing dataset 20 个不同类别的 5000 多张图片。 该…

基于springboot+vue实现电子商务平台管理系统项目【项目源码+论文说明】

基于springboot实现电子商务平台管理系统演示 研究的目的和意义 据我国IT行业发布的报告表明,近年来,我国互联网发展呈快速增长趋势,网民的数量已达8700万,逼近世界第一,并且随着宽带的实施及降价,每天约有…

【机器学习】包裹式特征选择之递归特征消除法

🎈个人主页:豌豆射手^ 🎉欢迎 👍点赞✍评论⭐收藏 🤗收录专栏:机器学习 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进…

基于Arduino的智能寻迹小车设计

目 录 摘 要 Ⅰ Abstract Ⅱ 引 言 1 1系统方案设计 3 1.1 方案论证 3 1.2 项目的总体设计 4 2 项目硬件设计 6 2.1 Arduino平台简介 6 2.2 ATmega328P单片机的最小系统 8 2.3 寻迹模块的设计 9 2.4 驱动模块的设计 11 2.5 电源模块的设计 14 2.6 按键电路的设计 15 2.7 蜂鸣器…

c++|内存管理

c|内存管理 C/C内存分布strlen 和 sizeof的区别 c语言动态内存管理方式malloccallocrealloc例题 c管理方式new/delete操作内置类型new/delete操作自定义类型证明 new 和 delete 的底层原理operator new与operator delete函数operator new 和 operator delete的 用法构造函数里面…

独家揭秘:AI大模型的神秘面纱

AI大模型,是当下人工智能领域里备受瞩目的技术,在推动科技进步和社会发展方面发挥着重要作用。然而,AI大模型的神秘面纱始终让人们充满好奇和探究。 首先,让我们来揭开AI大模型的面纱。在人工智能领域中,大模型是指参…

Idea 开启热部署 Devtools

一、背景 当我们在 idea 中修改代码的时候,idea 并不会自动的重启去响应我们修改的内容,而是需要我们手动的重新启动项目才可以生效,这个是非常不方便,但是可以在 idea 中开启这个自动热部署的功能。 我的 idea 版本为 2022.3.3 。…

Mosquitto介绍

一、Mosquitto介绍 Eclipse Mosquitto是一个开源的MQTT消息代理(服务器)软件。提供轻量级的,支持可发布/可订阅的的消息推送模式,使设备对设备之间的短消息通信变得简单,比如现在应用广泛的低功耗传感器,手…

怎么将电脑excel文档内的数据转换为图片形式

你平时在办公室会遇到格式转换的问题吗?比如PDF转Word,WPS转PDF,PDF转TXT,图片转PDF等。边肖最近在工作过程中遇到了类似的问题。为了更方便的查看表格,需要将Excel表格转换成图片格式。遇到这样的问题,很多…

Excel小技巧 (2) - 如何去除和增加前导0

1. 如何去除前导0 公式:SUBSTITUTE(A2,0,""),然后拖动十字架,同步所有列数据,轻松搞定。 2. 如何补充前导0 公式:TEXT(D2,"0000000") ,0的个数是数字的完整位数。然后拖动十字架&a…

LiveNVR监控流媒体Onvif/RTSP功能-视频广场点击在线或离线时展示状态记录快速查看通道离线原因

LiveNVR视频广场点击在线或离线时展示状态记录快速查看通道离线原因 1、状态记录1.1、点击在线查看1.2、点击离线查看 2、RTSP/HLS/FLV/RTMP拉流Onvif流媒体服务 1、状态记录 1.1、点击在线查看 可以点击视频广场页面中, 在线 两个字查看状态记录 1.2、点击离线查…

解决Windows自定义快捷键打开快捷方式慢的问题

主要是微软拼音的自学习在捣鬼。 关闭自学习即可。

免费IP地址证书

IP地址证书,又称为IP证书或IP地址所有权证书,是一种证明特定IP地址归属和合法使用的电子凭证。它通常由权威机构颁发,如互联网地址分配机构(IANA)或其下属的区域互联网注册管理机构(RIRs)。IP地…

MySQL 元数据锁及问题排查(Metadata Locks MDL)

"元数据"是用来描述数据对象定义的,而元数据锁(Metadata Lock MDL)即是加在这些定义上。通常我们认为非锁定一致性读(简单select)是不加锁的,这个是基于表内数据层面,其依然会对表的元…

第106讲:Mycat实践指南:范围分片下的水平分表详解

文章目录 1.Mycat水平拆分的分片规则2. Mycat水平拆分之范围分片2.1.使用范围分片水平分表的背景2.2.水平分表范围分片案例2.3.准备测试的表结构2.4.配置Mycat实现范围分片的水平分表2.4.1.配置Schema配置文件2.4.2.配置Rule分片规则配置文件2.4.3.配置Server配置文件2.4.4.重启…

高级语言讲义2018计专(仅高级语言部分)

1.编写完整程序解决中国古代数学家张丘健在他的《算经》中提出的”百钱百鸡问题“:鸡翁一,值钱五;鸡母一,值钱三;鸡雏三,值钱一;百钱买百鸡,翁,母,雏各几何 …