生成式人工智能备案办理指南,深度解析大模型备案全流程

早在2023年年初,国家互联网信息办公室、工业和信息化部、公安部针对深度合成服务制定的《互联网信息服务深度合成管理规定》(“《深度合成管理规定》”)顺利施行,其明确了深度合成服务相关方的义务与主体责任,强化了对互联网信息服务深度合成领域的管理。同年8月15日实施了《生成式人工智能服务管理暂行办法》,主要是针对提供生成式人工智能服务需要做大模型备案。这样就形成了由算法备案制度生成式人工智能备案(下称“大模型备案”)构成的“双备案制”的实践机制。

《互联网信息服务深度合成管理规定》第十九条规定“具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行或办理备案、变更、注销等相关手续。而大模型备案自《生成式人工智能服务管理暂行办法》施行之日起仅有半年多,对于大模型备案的流程、规则以及安全评估相关的具体事项,企业相关的经验也相对较少。

下面,众森企服小编就来给大家详细讲解下生成式人工智能大模型备案办理指南。

一、什么是大模型?

大模型,即Foundation Models,通常是指具有大量参数和复杂结构的深度学习模型。这些模型的参数量较大,通常需要数十亿甚至上百亿个参数,相较于传统的较小规模模型,大模型具有更高的容量和表达能力。大模型可以通过训练大规模数据集,以实现更准确的预测和更高的性能,并依据相关指令,完成各种目标任务。我们熟知的OpenAI的ChatGPT与Google的Alpha Go就是典型的语言类大模型:ChatGPT以Transformer模型为基础,具有1750亿个参数;而Alpha Go具有超过1亿个参数。

目前企业应用大模型主要体现为以下三种模式:

1、自主构建基础大模型,但是考虑到训练大模型的成本和技术壁垒都非常高,因此只有少数企业会自建大模型。

2、建立行业大模型,通常是了解行业know-how的企业,结合自身掌握的行业数据,用基础大模型精调出更贴合实际场景的垂类行业大模型。

3、在基础大模型和行业大模型之上,开发AI应用,这也是目前大多数企业采取的模式。

二、大模型上线的合规要素

在我国当前的监管体系下,大模型合规要素主要涉及的范畴包括平台运营合规、内容合规、平台管理合规、网络安全与数据合规、算法技术合规、国际联网合规等方面,具体合规要素以及相应的法律法规依据详见下图:

三、大模型上线备案如何申请

1、大模型上线备案所需资料

(1)大模型上线备案表,包含以下具体内容:

  • 基本情况:模型名称、主要功能、适用人群、服务范围等。

  • 模型研制:模型备案情况、训练算力资源(自研模型)、训练语料和标注语料来源与规模、语料合法性、算法模型的架构和训练框架等。

  • 服务与安全防范:推理算力资源、服务方式及对象等、非法内容拦截措施、模型更新升级信息等。

  • 安全评估:基本情况、评估情况。

  • 自愿承诺:承诺所填信息真实性,并签字确认。

  • 附件及备注:附件包括安全评估报告、模型服务协议、语料标注规则、拦截关键词列表、评估测试题。

(2)安全评估报告:提交的报告应包含语料安全评估、模型安全评估以及安全措施评估,并应在评估报告中形成整体评估结论。

(3)模型服务协议:一般包含产品及服务的各项规则及隐私条款等,需协同法务共同制定提交。

(4)语料标注规则:包括标注团队介绍、功能性及安全性标注细则,标注流程等。

(5)拦截关键词列表:总规模不宜少于10000个,应至少覆盖《生成式人工智能服务安全基本要求》A.1以及A.2中17种安全风险,A.1中每一种安全风险的关键词均不宜少于200个,A.2中每一种安全风险的关键词均不宜少于100个。

(6)评估测试题集:

  • 该测试题集需要包括生成内容测试题库、拒答内容测试题库、非拒答测试题库。

  • 测试题分类满足《生成式人工智能服务安全基本要求》中相关的风险类型,并有最小的数量要求。

  • 测试题建议是“问题”(包含主谓宾),不可只是短词、长文章。

  • 生成内容测试题库中建议明确标记出哪些问题是需要拒答的、哪些是需要回答的。

2、大模型上线备案流程

  • 向属地网信办报备,拿到备案表;

  • 企业根据表格及评估要点准备填写材料;

  • 企业内部展开评估,编写相关材料,准备测试账号;

  • 材料附件及测试账号提交属地网信办审核;

  • 属地网信办材料审核及技术测试审核通过后,属地上报中央网信办;未通过,修改材料或调整模型能力后再次提审,具体调整哪方面根据属地网信反馈进行;

  • 中央网信办进行材料复审及技术评审,通过,企业下发备案号;未通过,需重新进行上线备案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/716683.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

RERCS系统开发实战案例-Part06 FPM Application添加列表组件(List UIBB)

在FPM Application中添加搜索结果的List UIBB 1)添加List UIBB 2)提示配置标识不存在,则需要新建配置标识(* 每个组件都必须有对应的配置标识); 3)选择对应的包和请求 4)为List UIB…

一键掌控,4G红外插座引领智能生活新潮流!

随着科技的进步,市场上出现大量带语音、手机APP可控制的智能插座产品,由此可看出客户对产品的功能要求也越来越高,追求舒适的体验感,特别是对操控性的要求越来越高。但是目前大部分红外遥控插座均为WiFi插座类型,WiFi红…

【一步一步了解Java系列】:认识String类

看到这句话的时候证明:此刻你我都在努力 加油陌生人 个人主页:Gu Gu Study专栏:一步一步了解Java 喜欢的一句话: 常常会回顾努力的自己,所以要为自己的努力留下足迹 喜欢的话可以点个赞谢谢了。 作者:小闭…

Java异常和文件

一、异常 1.定义 异常:异常就是代表程序出现的问题 体系结构: 最上层的是 Throwable 类,下面有两个子类: ① Error:代表系统级别的问题(属于严重问题,比如:内存溢出)。…

企业该怎么进行流程管理?

众所周知,流程管理在企业中是一种有效的方法,可以帮助组织优化运营、提高效率并降低成本。 下面是一些步骤,可以帮助大家在企业中实施流程管理: 确定目标:首先,明确企业的目标和愿景。这将帮助您确定需要…

Python画箱线图展示数据分布情况

箱线图(Boxplot)是一种常用的统计图表,用于展示数据的分布情况。 它由五个统计量组成:最小值、第一四分位数(Q1)、中位数(Q2)、第三四分位数(Q3)和最大值。 …

ffmpeg封装和解封装介绍-(10)综合完成视频重编码为h265,解封装解码编码再封装

主函数逐句解析: 由于代码太多我们只解析主函数,(其他封装函数见前面文章,同时用到了解码编码封装代码)。 初始化和参数处理 int main(int argc, char* argv[]) {/// 输入参数处理string useage "124_test_x…

1.华为路由器-三层交换机-二层交换机组网连接

AR1配置GE 0/0/0接口IP [Huawei]int g0/0/0 [Huawei-GigabitEthernet0/0/0] [Huawei-GigabitEthernet0/0/0]ip add 1.1.1.1 24 [Huawei]iP route-static 192.168.0.0 16 1.1.1.2三层交换机配置如下 创建vlan [Huawei]vlan batch 10 20配置接口ip [Huawei]int g0/0/1 [Huawei…

让AI 赋予人类超强的记忆力

遗忘曲线告诉我们,绝大部分新掌握的知识约在一周后被遗忘,一个月左右基本忘光。「好记性不如一个烂笔头」,借助AI还真能做出这样「烂笔头」。 提升个人的记忆力-个人搜索引擎 个人搜索引擎的想法是一个强大而诱人的想法。如果有一个应用程序可…

你的iPhone安全吗?想要保护个人隐私一定要这么做

在这个数字化时代,个人隐私安全显得尤为重要,尤其是对于那些依赖智能手机处理日常事务的用户而言。作为市场上最受欢迎的智能手机之一,iPhone的安全性备受关注,但即便如此,它也可能成为黑客攻击和非法监控的目标。如何…

慎投!新增1本中科院1区顶刊被“On Hold”

本周投稿推荐 SSCI • 中科院2区,6.0-7.0(录用友好) EI • 各领域沾边均可(2天录用) CNKI • 7天录用-检索(急录友好) SCI&EI • 4区生物医学类,0.5-1.0(录用…

CC1310 LaunchPad开发板底噪测试

测试射频底噪时,主要关注的是在无信号输入时,系统或器件产生的最小噪声功率。这通常涉及到使用频谱分析仪(频谱仪)来测量输出噪声功率谱密度。以下是进行射频底噪测试的几种方法: 使用频谱仪直接测量: 通过…

做LLM推理时,常见的显卡如何选择?

随着开源LLM越来越成熟,业务接入LLM推理也成为必然,如何选模型大小和显卡,主要看下面这些。 一、选GPU显卡 在选择显卡进行大型语言模型推理时,主要要看下面几个指标: 1、 VRAM(视频随机存取存储器&…

Docker部署Nginx下载站点服务

1、下载镜像 由于docker官方镜像站点被封了,所以我把镜像上传到阿里云镜像仓库了 docker pull registry.cn-hangzhou.aliyuncs.com/qinzt-tools/file-nginx:1.18.02、运行容器实例 运行变量解释: 变量名称默认值解释USERhyadmin访问下载站点的认证用…

Typora—适用于 Mac 和 Win 系统的优秀 Markdown 文本编辑器

Typora 是一款适用于 Mac 和 Win 系统的优秀 Markdown 文本编辑器,它以其简洁易用的界面和强大的功能受到了众多用户的喜爱。 首先,Typora 的界面设计非常简洁直观,没有过多繁杂的菜单和按钮,让用户能够专注于写作本身。它采用实时…

C#结合JS 修改解决 KindEditor 弹出层问题

目录 问题现象 原因分析 范例运行环境 解决问题 修改 kindeditor.js C# 服务端更新 小结 问题现象 KindEditor 是一款出色的富文本HTML在线编辑器,关于编辑器的详细介绍可参考我的文章《C# 将 TextBox 绑定为 KindEditor 富文本》,这里我们讲述在…

如何利用被动DNS(Passive DNS)加强网络安全

通过收集和分析被动DNS数据,可以帮助识别恶意站点,打击钓鱼和恶意软件,本文将介绍如何利用被动DNS(Passive DNS)加强网络安全。 在过去的一些年里,我们目睹了对DNS基础设施的攻击日益增多:对权…

【嵌入式】CAN总线详解

【嵌入式】CAN总线详解 一、CAN总线简介 CAN总线是一种控制器局域网总线,每一个挂载在CAN局域网的设备,都可以利用CAN去发送信息,也可以接收局域网的各种信息,每个设备都是平等的,共享CAN的资源。广泛应用于汽车、嵌…

101.qt qml-自定义日历控件2-附带动画效果

黑色风格截图如下所示: 白色风格如下所示: GIF效果如下所示: 1.控件使用介绍 QianWindow2.5版本及以上提供,源码位于:qrc:/common/qmlQianDateTime/QianCalendarInputField.qml QianWindow2.5版本及以上提供,示例使用代码位于:qrc:/pages/QianControlPages/QianDateTimeP…

金鸣识别:图片转excel的“黑科技”神器

近期,我意外发现了一个令人惊艳的工具——金鸣表格文字识别系统。起初,我只是出于好奇尝试了一下,但使用体验远远超出了我的预期,让我深感其价值。 在日常生活和工作中,我们经常需要从各类图片中提取文字信息&#xf…