AI大模型报告:2023大模型可信赖研究报告

今天分享的AI系列深度研究报告:《AI大模型报告:2023大模型可信赖研究报告》。

(报告出品方:中国信通院)

报告共计:48页

大模型发展现状

大模型驱动新一轮科技革命

近十余年间,人工智能技术泛化能力、创新能力及应用效能不 断提升,成为了推动经济及社会发展的重要引擎。2015 年前后,人 脸识别算法达到接近人眼的识别能力,被视为人工智能技术工业级 应用水平的代表性事件。2022 年,以 ChatGPT 为代表的大模型为用户带来了全新交互体验。通过其在内容生成、文本转化和逻辑推理 等任务下的高效、易操作表现,大模型正逐步成为当前主流应用程 序的重要组成部分。

随着数据、算法和算力的不断突破,大模型将不断优化演进。 在数据方面,海量、多模态数据将持续应用于大模型预训练,提升 大模型的知识、理解和推理能力。在算法方面,将转向跨知识领域、 跨语种、多模态特征的海量知识挖掘及执行等复杂任务的处理。在 算力方面,智算中心及算力网络等基础设施加速建设,为大模型的 开发和服务提供充足性能支持。到 2026 年,Gartner 预测超过 80% 的企业将使用生成式人工智能的 API 或模型,或在生产环境中部署支持大模型应用。以通用智能体、具身智能和类脑智能等为代表的 大模型应用可能会带来新一轮的科技革命和产业变革。

大模型加速赋能产业应用

“大模型+”模式加速应用赋能,助推人工智能产业升级。当前, 人工智能已经成为全球新兴技术领域的核心竞争力,各国政府加快研发、部署人工智能技术,推动产业高速发展。据统计1,我国人工 智能核心产业规模已达 5000 亿美元,企业数量超过 4300 家。2023 年始,我国大模型市场火爆,百度、商汤科技、科大讯飞、阿里巴 巴等单位先后发布自研大模型,并于 2023 年下半年逐步面向用户提 供服务。大模型广泛应用于能源、金融、教育、医疗、交通、政务 等领域,主要应用场景聚焦数据分析、客服、营销、办公等。其中, 以能源、金融为首的两大行业结合行业数据建设基础,积极布局大 模型应用落地,加速行业智能化转型。

大模型技术生态逐步完善,大幅降低行业应用门槛。一方面, 开源大模型加速大模型应用渗透,打通预训练、微调、部署、评测 等开发阶段,进一步降低大模型研发应用成本。2023 年 7 月,上海 人工智能实验室正式开源了书生·浦语大模型 70 亿参数的轻量级版 本 InternLM-7B,并推出首个面向大模型研发与应用的全链条开源体 系,同时提供免费商用,受到了学术和产业界的广泛关注。同年 7 月,OpenAI 向用户正式开放了代码解析插件 Code Interpreter,使得 ChatGPT 和 GPT-4 可以根据用户问题来编写和执行代码,从而拓展 了模型在数据分析、复杂计算与功能调用方面的能力。另一方面, 大模型正在逐步向智能体方向进化,从理解生成迈向复杂任务处理 能力。通过将大模型与动作执行器结合,智能体可以在接受用户输 入后,通过大模型进行规划和决策,并对第三方插件或工具进行调 用,从而实现复杂的任务处理能力,进一步降低了应用门槛。

大模型风险分析

大模型风险视图

大模型快速部署和广泛应用的同时,也诱发了更多的风险隐患: 一是框架风险,深度学习框架面临物理、网络层面的恶意攻击,导致大模型所依赖的基础设施稳定性和安全性难以保障;二是数据风 险,采集及处理海量、多模态的训练数据可能会引入更多的有害数据,容易引发个人隐私泄露、知识产权侵权、数据偏见等问题;三 是模型风险,现阶段,大模型抗干扰能力相对较弱,存在遭受恶意 攻击、决策偏见以及模型运营风险等问题;四是生成内容风险,大 模型存在“幻觉”现象,答非所问、违规不良信息生成等问题成为 大模型最受关注的风险。大模型高效、便捷的内容生成能力大幅降低了诈骗、钓鱼邮件等恶意行为的门槛,而针对生成内容的追溯保 障机制目前尚未完善,使得恶意内容生成的监管更加困难。

本报告以可靠性、健壮性、安全性、公平性、可问责、可解释 等大模型可信赖目标为重点方向,从框架、数据、模型、生成内容 等大模型风险要素角度分析,并结合数据采集、模型预训练、模型微调、部署运行、优化更新等大模型全生命周期治理理念,提出大 模型可信赖实践方案,全面提升大模型的可信赖表现。

框架层面,软件漏洞是现有深度学习框架短板

大模型领域的基础设施风险主要包括深度学习框架和开发套件等软件层面的漏洞,以及运行环境的不稳定性。可能的风险涵盖物 理攻击、网络攻击、运行环境篡改、运维故障等多个方面。

深度学习框架的运行环境容错性低,核心资产保护面临挑战。 大模型的运行环境不稳定性风险主要来自大模型服务的运维以及模 型迭代更新时稳健性较差所导致的服务等级协议(SLA)服务水平 不足,从而可能影响大模型服务可用性。在训练和推理过程中,由 于设备、网络或通信故障,可能导致模型训练或推理任务中断。此 外,大模型的运行环境同样面临安全性风险。一方面,缺乏基础设 施与其他系统的严格网络隔离可能导致来自内部其他系统的横向渗 透风险。如果攻击者成功侵入基础设施系统并注入后门、木马等恶 意程序,整个系统将面临严重的安全风险。另一方面,大模型的运 行环境缺乏面向训练数据、模型和网络通信的安全防护措施,使得 训练数据、模型参数文件等核心资产容易受到泄露、篡改和窃取等 威胁。

大模型可信赖实践

框架层面,可信框架与执行环境保障运行安全

针对深度学习框架面临的软件漏洞风险与运行环境不可靠问题, 一方面通过采用漏洞管理、恶意程序检测以及访问控制等技术措施, 降低深度学习框架受恶意访问和攻击的可能性,另一方面通过构建 AI 核心资产保护机制,保障深度学习框架运行环境的安全可信。

数据层面,安全检测及处理助力大模型可靠

数据的使用贯穿大模型全生命周期,安全保障与有效处理是保 障大模型可靠的关键举措。在数据层面,可信赖实践主要涉及数据 全流程的安全合规处理、数据安全沙箱技术、投毒检测以及数据分析等措施。

模型层面,全流程防控增强大模型可信

在模型层面,可信赖实践可从设计开发、模型训练和部署运行 三个阶段展开。设计开发阶段主要涉及大模型研发前期的安全和伦理设计评估;在模型训练阶段,主要涉及大模型预训练、微调过程的可信赖能力检测、加固措施;在部署运行阶段,主要涉及大模型在运营过程中的运维能力,以增强用户对于模型运营的信任度。

生成内容层面,过滤与标识实现内容可控可问责

在生成内容方面,可信赖实践主要涉及生成内容评测、内容审 核机制以及内容可追溯能力的建设,实现内容安全可控并具备一定 程度的可追溯能力。为缓解大模型“幻觉”现象,生成内容评测主 要聚焦真实性、准确性以及安全性。为降低生成内容的安全性风险, 内容审核机制通常会采取机器审核和人工复审结合的形式。为进一 步提升二次编辑导致生成内容难以追溯的问题,数字水印技术正在逐渐提升健壮性能力。

报告共计:48页

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/238639.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

源码级详解Spring的三级缓存,循环依赖的处理流程

一.什么是三级缓存 1.一级缓存:存放已经初始化完成的Bean 2.二级缓存:存放半成品Bean,既实例化完成未初始化的Bean。 3.三级缓存:存放bean工厂 二.为什么是三级缓存 一级缓存是必须的,这个我们没有什么疑问。那为…

第6章:知识建模:概述、方法、实例

💗💗💗欢迎来到我的博客,你将找到有关如何使用技术解决问题的文章,也会找到某个技术的学习路线。无论你是何种职业,我都希望我的博客对你有所帮助。最后不要忘记订阅我的博客以获取最新文章,也欢…

后缀数组模板

详细理解后缀数组求sa数组的函数,该函数可以看为主要分为三个部分,第一个部分是预处理;第二个部分是进行基数排序,首先根据第二关键词排序,然后根据第一关键字排序;第三个部分是根据排序后的结果重新为每个…

等保二级和三级的区别

等保二级和三级定级标准有什么区别?定级原则和方法介绍 网络安全等级保护,简称等保,是我国为了保障信息系统的安全运行,防止信息泄露、篡改、破坏等威胁,制定的一套信息安全管理制度。根据《信息安全技术网络安全等级保…

6.21二叉搜索树的最近公共祖先(L235-M)

算法: 可以和上一题一样做,但是最好还是要用上二叉搜索树的特性 遍历顺序无所谓,因为中不用写逻辑代码。 假如p3,q5 若当前遍历节点(比如6)比p和q都大,说明p和q一定在当前节点的左子树里面 …

Python数值类型(整形、浮点型和复数)及其用法

数值类型是计算机程序最常用的一种类型,既可用于记录各种游戏的分数、游戏角色的生命值、伤害值等,也可记录各种物品的价格、数量等,Python 提供了对各种数值类型的支持,如支持整型、浮点型和复数。 Python整型 Python 3 的整型…

Intel® Enclave Operation(三)

文章目录 前言一、Constructing an Enclave1.1 ECREATE1.2 EADD and EEXTEND Interaction1.3 EINIT Interaction1.4 Intel SGX Launch Control Configuration 二、Enclave Entry and Exiting2.1 Controlled Entry and Exit2.2 Asynchronous Enclave Exit (AEX)2.3 Resuming Exe…

web服务器之——建立两个基于ip地址访问的网站

目录 准备工作:web服务器搭建 第一步:挂载 第二步:编辑配置文件 第三步:安装软件包 第四步:启动httpd 查看配置文件: 第五步:设置防火墙状态: 重启服务: 查看状态&#xff1…

自己开发App,如何能兼顾效率与体验?

今天来聊聊一个现实但不简单的问题:如何能够做到自己开发App。 首先,在搜索引擎搜索“自己开发App”,会冒出一大堆类“手把手”的内容,超级详细、稍微浏览一些内容的引言部分,乍一看好像还挺合理,但点击进…

多地远程视频监控,如何集中连接与管理?

如今,远程视频监控已广泛应用于商超零售、酒店、工厂工地、IT机房、农业生产、医疗保健、公共安全等多种场景。其中,网络通信技术是远程监控技术中最为关键的技术,远程监控数字化应用的增长对广域网等基础IT建设提出更高的需求。 以广东某连锁…

python实战教学之python版“张万森,好久不见”

前言 WINTER IS COMING 最近《一闪一闪亮星星》的电影在火热预售中,家人们抢到票了嘛,前两天小编写了一篇“张万森,下雪了”的文章后,收到了不少小伙伴的反馈:“代码的运行结果只有文字,没有雪花啊”&#…

气温波动 C语言xdoj45

问题描述 最近一段时间气温波动较大。已知连续若干天的气温,请给出这几天气温的最大波动值是多少,即在这几天中某天气温与前一天气温之差的绝对值最大是多少。 输入说明 输入数据分为两行。 第一行包含了一个整数n,表示给出了连续n天…

JNPF低代码——全源码、免费部署的开发框架

低代码平台的概念很火爆,产品也是鱼龙混杂。 对于开发人员来说,在使用绝大部分低代码平台的时候都会遇到一个致命的问题:我在上面做的项目无法得到源码,完全黑盒。一旦我的需求平台满足不了,那就是无解。 与其他平台的…

便签电脑版下载教程,电脑便签用哪个

现在大家所熟知的电脑便签软件通常以电脑软件为主,过去那种贴满五颜六色的,几百张成一叠的桌面便利贴,可以实现随处粘贴,现在几乎已经被淘汰了,取而代之的是科技化的电脑便签软件。 在查找电脑便签软件时,…

helpdesk的工作流程是什么?

helpdes在IT部门中是一个非常重要的部门,负责为用户提供技术支持和问题解决方案。为了有效地提供这些服务,helpdesk需要建立一个清晰而高效的工作流程。本文将介绍helpdesk工作的典型流程,并探讨每个阶段的重要性。 1、用户报告问题 通常&…

RCG Self-conditioned Image Generation via Generating Representations

RCG: Self-conditioned Image Generation via Generating Representations TL; DR:将图像的无监督表征作为(自)条件(而非是将文本 prompt 作为条件),生成与原图语义内容一致的多样且高质量结果。视觉训练能…

Android :Paging (分页)加载数据-简单应用

1.Paging介绍: 安卓Paging是一种分页加载数据的方法,它基于无限滚动模式而设计,可以帮助应用更高效地利用网络带宽和系统资源。Paging库可以加载和显示来自本地存储或网络中更大的数据集中的数据页面,适用于以列表的形式加载大量…

VSCode配置记录

1. 修改代码背景颜色 1)Shift Command P,搜索框输入:settings.json 2)输入配置 {"workbench.colorCustomizations": {"editor.lineHighlightBackground": "#86e9e93d", # 修改鼠标所在行背景色…

自动化测试 —— Web自动化三大报错

Web自动化三大报错有哪些呢?接下来给大家讲讲。 Web自动化三大报错(Exception) 1. Exception1:no such element(没有在页面上找到这个元素) reason1:元素延迟加载了 solution: …

功率放大器有哪些功能和作用

功率放大器是一种电子设备,主要用于将输入的低功率信号放大为更大的功率信号。功率放大器的主要功能和作用包括: 信号放大:功率放大器可以将输入的低功率信号放大为更大的功率信号。这对于一些需要输出更大功率的应用来说非常重要&#xff0c…