AI风险管理新利器:SAIF CHECK利用Meta Llama 3保障合规与安全

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

随着人工智能越来越多地融入商业运营和日常生活,公司必须意识到潜在风险并遵守当地法律,否则可能面临严厉的后果,包括法律诉讼和巨额罚款。

虽然跟上风险变化不易,但却是必要的。位于沙特阿拉伯利雅得的公司SAIF CHECK (https://www.saifcheck.ai/)使用Meta Llama 3构建了一个模型评估系统,帮助解决这一挑战。SAIF CHECK与中东和北非地区的客户合作,提供评估、审计和认证服务,帮助公司检查其AI模型在法律、监管、隐私和数据安全方面的风险。

公司的一大工作部分是扫描全球监管环境,然后创建、获取和整理描述这些监管环境的具体文档。SAIF CHECK将这些发现整合到其不断增长的知识库中,涵盖各种监管领域。基于Llama 3的系统能够快速更新综合知识库,使机器代理能够理解客户AI模型的环境及其监管环境。通过使用在大量AI法规语料库上训练的检索增强生成(RAG)框架,该系统支持简便的对话查询,能够对用户的监管问题给出相关答案。

“SAIF CHECK的目标是使模型评估成为一个技术或非技术用户都能完成的对话工作流程,”SAIF CHECK的创始人兼CEO Shaista Hussain博士说,“我们已将Llama 3集成到一个系统中,该系统设计用于保留客户的独特业务背景(运营国家、监管机构),同时从多种来源检索和综合信息。”

保持上下文的幽灵注意力

SAIF CHECK团队首次关注到Llama是在阅读了2023年Llama 2团队发表的论文时。Hussain表示,他们特别感兴趣于Llama团队解决对话AI系统常见问题的方法——这些系统往往在对话过程中会忘记上下文。例如,如果告诉AI模型只用俳句回复,它可能在几次对话后就忘记这个初始指令,除非每次新请求时重复指令。重复指令会占用宝贵的tokens,限制对话的整体长度。

为解决这一问题,Llama团队开发了一种名为幽灵注意力(GAtt)的训练技术,使用人类反馈的强化学习来微调模型的响应,牢记初始指令。结果是,AI模型在多轮对话中更能保持初始指令。

“因为我们的AI模型评估调查在多次运行中进行,我们利用Llama的GAtt机制,帮助控制多轮对话的流程,”Hussain说,“通过这样做,我们的平台可以为用户提供更精确和信息丰富的响应,提高我们服务的输出质量。”

为了定制Llama以适应其用例,SAIF CHECK通过加法微调过程配置了多层。使用Llama 3 Instruct,生成层接收用户的提示和上下文,其输出被输入一个受SAIF CHECK综合知识库中各种监管机构和国家特定监管文档训练的监管分类器。这使得模型能够将提示和上下文分类到特定的国家和监管机构中。

通过伦理对齐建立信心

在了解了用于训练Llama的负责任AI原则后,团队决定使用Llama模型进行文本生成。Meta在蓝队和红队对其Llama模型进行显著努力,这让SAIF CHECK团队有信心Llama模型与他们的优先事项一致。

“使用Llama,我们在核心流程中使用了一个伦理训练和来源的模型,使我们的流程与我们的价值观一致,”Hussain说。

她承认,正确定位文档、查询它们以及生成适合每个人上下文和具体要求的响应仍然是挑战。

“每个机器学习模型都是不同的,每家公司使用其模型的过程也独一无二,”她补充道。

Hussain对团队的“分块”文档内容的方法充满信心,认为这一策略将取得成功。

“我们相信Llama是验证我们关于分块策略假设并监控我们服务响应效果的优秀模型,”她说。

AI与人类合作的未来

Llama的负责任基础和透明性对团队的价值观和他们对AI如何在全球产生影响的看法至关重要。SAIF CHECK认为,AI的真正作用在于补充和增强人类对计算机的使用。

为此,人们需要信任他们使用的AI模型。这种信任是SAIF CHECK的基石——无论是他们自己的AI模型,还是他们为客户验证的模型。

“由于Llama是开源的,我们可以清楚地看到其发展过程,信任其文档,并确信在理解和实施这一模型进入现实世界服务方面,我们不是孤军奋战,”Hussain说。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/739903.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

react-native在IOS上集成百度地图详解

export default class BaiDuMapTest extends Component { render() { return ( ); } } const styles StyleSheet.create({ container: { flex: 1, justifyContent: ‘center’, alignItems: ‘center’, backgroundColor: ‘#F5FCFF’, }, welcome: { fontSize:…

电子设备抗震等级与电子设备震动实验

若该文为原创文章,转载请注明原文出处 本文章博客地址:https://hpzwl.blog.csdn.net/article/details/139923445 红胖子(红模仿)的博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软…

RK3588上手踩坑之启动卡死2

同事开发了一块RK3588Q,记录下上手的踩坑过程。 RK3588上手踩坑实录_-CSDN博客https://blog.csdn.net/huntenganwei/article/details/135213035?spm1001.2014.3001.5501 按照之前的搞法,一通操作。 上电 莫名其妙的duang了 各种检查,核对…

2024年国内顶尖的在线文档协作工具大对比

近几年国内主流使用的9款在线文档协作工具对比:PingCode 知识库、WPS Office 云协作、腾讯文档、语雀、Filez 企业网盘、360亿方云、石墨文档、Confluence、Notion。 在线文档协作工具因其能够提供实时编辑、共享和管理文档的能力,成为了很多团队提升工作…

制造业工厂急需一套erp系统帮他降本增效

随着全球制造业竞争的日益激烈,制造业工厂面临着越来越多的挑战,包括成本控制、生产效率、市场响应速度等方面。在这样的背景下,一套高效的ERP(企业资源规划)系统成为了制造业工厂降本增效的必备工具。本文将探讨ERP系…

一文读懂交换机MAC地址表:五大关键点,图解21步

HCIA 新班开课了华为HCIA课程介绍苏州面授班 | 全国直播班循环开班,免费重学前言 什么是MAC地址表?MAC地址表有什么作用?MAC地址表里面包含了哪些要素?今天带你好好唠唠。 我们以一个案例为例: 如上图:PC1和PC2通…

基于机理状态模型的约束预测控制

1、约束优化问题描述 考虑如下线性离散时间系统的状态空间增量模型: Δ x ( k 1 ) A Δ x ( k ) B u Δ u ( k ) B d Δ d ( k ) y c ( k ) C c Δ x ( k ) y c ( k − 1 ) y b ( k ) C b Δ x ( k ) y b ( k − 1 ) (1) \begin{aligned} \Delta x(k1)&am…

反激开关电源UC3842芯片介绍

1、VCC端有个36V的稳压管,说明供电电压最高为36V,当然也不能过低,过低就有个欠压锁定电路(UVLO); 2、输出经过一个稳压器得到高精度的5V电压,其中一路输出给RC充放电,产生一定频率的…

如何进行外贸SEO优化?

你需要了解目标市场的搜索习惯。不同国家的人使用的搜索引擎和关键词可能不同,所以要先做市场调研,找出你要推广的产品在目标市场最常用的关键词。可以使用像Ahrefs、SEMrush等工具来帮助你分析和选择合适的关键词。 网站的结构也很重要。一个清晰、易导…

08较成功的降低干扰获得较好的波形

08较成功的降低干扰获得较好的波形 波形数据当前数据调整后的数据后续 结语其他以下是废话 试验,本身就是一个摸索的过程,在上一阶段的试验中,我们优化了采集装置,更换了导电性较好的电极。 目前数据美观程度较之前提升了不少&…

持续增强国产适配 | 宁盾身份域管与南大通用、飞腾完成产品兼容性认证

随着党政、央国企、金融信创国产化改造日益深入,企业对国产 IT 基础设施生态兼容适配的需求日益迫切。为践行给企业提供“开箱即用”的交付体验承诺,宁盾身份域管持续增强多元异构产品的兼容适配。近日,宁盾身份域管与天津南大通用数据技术股…

QT事件处理系统之二:窗口部件的事件拦截,以及事件的传递顺序

1、案例说明 在父窗口中为selfLineEdit窗口安装事件过滤器,这样我们可以在父窗口中首先拦截来自于selfLineEdit本身产生的事件,并且决定该事件最终是否继续传递到selfLineEdit窗口本身。 2、关键代码 selfLineEdit.cpp #include "selfLineEdit.h" #include &l…

如何使用Python和PaddleOCR轻松识别图片中的文字

在这个数字化时代,文本识别技术变得越来越重要,它广泛应用于文档自动化处理、内容审核、智能交互等场景。本文将引导你如何使用Python结合PaddleOCR库,轻松实现图片中的文字识别功能。 必备工具包安装 在开始编写代码之前,你需要…

vantUI upload 上传组件v-model绑定问题

直接绑定一个数组会有问题,删除失效/上传不了等等 解决在v-model绑定的数组外包一个对象即可

跨境电商货源渠道哪里找?盘点11个拿货产业带

一、跨境货源渠道哪里找? 说到找货源,应该很多卖家都上过阿里巴巴1688“淘货”,阿里巴巴1688作为一个全球采购批发平台,在2017年上线了个跨境专供板块,专为跨境卖家供货,跨境专供板块的供货商需要经过严格…

【每日刷题】Day74

【每日刷题】Day74 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 1394. 找出数组中的幸运数 - 力扣(LeetCode) 2. 1518. 换水问题 - 力扣&…

有什么能和ai聊天的软件?5个软件教你快速和ai进行聊天

有什么能和ai聊天的软件?5个软件教你快速和ai进行聊天 当今数字化时代,人工智能(AI)技术已经逐渐渗透到我们的日常生活中,而与AI进行聊天也成为了一种趋势和乐趣。以下是五款可以和AI进行聊天的软件,它们提…

【PA交易】BackTrader(一): 如何使用实时tick数据和蜡烛图

背景和需求 整合Tick数据是PA交易的回测与实盘基本需求。多数交易回测框架往往缺乏对大规模Tick数据直接而全面的支持。Tick数据因其体量庞大(例如,某棕榈油主力合约四年间的数据达8GB)为结合价格趋势与PA分析带来挑战,凸显了实时…

C语言基础——函数(2)

ʕ • ᴥ • ʔ づ♡ど 🎉 欢迎点赞支持🎉 文章目录 前言 一、return语句 二、数组做函数参数 三、嵌套调用和链式访问 3.1 嵌套调用 3.2 链式访问 四、函数声明和定义 4.1 单个文件 4.2 多个文件 总结 前言 大家好啊,继我们上一…

深入测评:ONLYOFFICE 8.1 桌面编辑器究竟有多强大?

ONLYOFFICE 8.1桌面编辑器 文章目录 ONLYOFFICE 8.1桌面编辑器一、ONLYOFFICE的简介二、ONLYOFFICE 8.1新功能和改进2.1 轻松编辑器 PDF 文件2.2 用幻灯片版式快速修改幻灯片2.3 无缝切换文档编辑、审阅和查看模式2.4 改进从右至左语言的支持 & 新的本地化选项2.5 隐藏“连…