“开放”的大模型到底有多“开放”?!

大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在某个环节出现卡点,可以回到大模型必备腔调或者LLM背后的基础模型重新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于具身智能感兴趣的请移步具身智能专栏。技术宅麻烦死磕AI架构设计。

过去一年,声称开放的生成式人工智能系统数量急剧增加。但它们到底有多开放?鉴于即将出台的欧盟人工智能法案对开源系统会进行不同进行了不同的监管,生成式人工智能中什么算作开源的问题将变得尤为重要,迫切需要进行实际的开放性评估。

有趣的是研究人员使用一个基于证据的框架,该框架区分了开放性的 14 个维度,从训练数据集到科学和技术文档,从许可到访问方法。通过调查 45 多个生成式人工智能系统(包括文本和图像)。虽然开源一词被广泛使用,但许多模型只是“开放权重”,许多模型的拥有者并没有提供完整的有关训练和微调数据的信息来进行科学、法律和监管审查。

本次的研究调查产生了40个被描述为“开源”或“开放”的文本生成大模型。使用上述的评估框架检查每个系统的开放性,并按开放性分数对系统进行排名。作为参考,我们还添加了ChatGPT。

的确从业人员在选择“开源”大模型的时候,需要考虑很多维度。虽然本次研究,小编私下认为评估模型类型还是不够多,尤其是打分规则的设计值得商榷。但是它最大的贡献在于提出了一套基本的评估标准(方向),这些方向对于企业在进行模型选择的时候能够提供决策依据。为后面大模型使用涉及的应用适配、维护升级以及商业风险都能够提前进行评估。当然还少考虑了免费的因素。!

例如:BloomZ和 Llama均不会通过pypi等有索引和版本控制的公共代码存储库以软件包形式分发模型。相反,两者主要用于本地部署。BloomZ可通过 Petals API获得,而Llama的API仅在注册后可用。

这些模型在许可方面也有所不同。BloomZ有两个相关许可证。其源代码是Apache 2.0,这是OSI批准的开源许可证,而模型权重是在负责任的AI 许可证 (RAIL)下发布的。Llama 2是在Meta自己的社区许可证下发布的。这两个许可证都旨在限制有害用例,但它们在实现模型输出的表示方式上存在一个关键区别。RAIL规定用户不得“在未明确且清晰地声明文本由机器生成的情况下生成内容”,而Llama规定用户不得“表示Llama 2输出由人类生成”。

随着框架可以深入研究生成式AI系统的细节,BloomZ实质上算是开源状态,而Meta的Llama最多是开放权重,并且在几乎所有其他方面都是封闭的。Llama在所有当前可用版本中都是一个典型的例子,该模型声称开放性的好处在于模型权重。

每个单元都记录了一个三级开放性判断(︎ ✔开放、~ 部分或✘封闭)。其中✔︎为 1,~为0.5,✘为0分。请注意,RL可能是指RLHF或其他形式的微调

从上图可以观察到两种广泛的工作方式。一种是AllenAI的OLMo Instruct、BloomZ和LLM360的AmberChat等系统中所见的广泛开源方法,这些系统正在接近完全开放状态并位居开放排行榜榜首。这些系统背后的组织竭尽全力提供训练数据、代码、训练管道和文档。

大量系统(后三分之一)只提供模型权重,但很少或根本不分享有关其系统其他部分的细节。这些系统最好被称为开放权重,而不是开源。

值得注意的是,所有大型商业参与者——Meta、Google、Cohere、Microsoft和Mistral——都处于较低的排名,许多以它们为基础的替代方案也是如此。文本生成器的当前开放状态是混合的。存在一些非常开放的系统,但最著名的模型只是开放权重。许多系统很少共享有关指令调整步骤或元提示技术的信息。用于训练和微调的数据集和方法很少被共享或披露。系统、数据和代码文档通常不完整,缺乏学术严谨性。

训练数据缺乏开放性尤其令人担忧。<小编认为也是合理,毕竟数据才是真正的资产>,下半部分的大多数模型没有提供任何有关数据集的详细信息,除了通用的描述符。

上图为图像生成,与文本生成相比,大模型要少得多。目前可用的图像数据集相对较少,文本转图像生成器在机器学习架构方面也有所不同<可以移步了解!>。

与基于证据的开放性评估最相关的是文本转图像生成器如何实现跟踪合成图像来源的方法,以及设置防止创建不良内容的护栏。一些系统使用水印来实现某种形式的来源跟踪。对于审核,文本转图像系统通常依赖于及时审核的形式,通常是文本过滤或分类。这种来源和安全措施的状态并不总是有记录的。鉴于各种文本转图像的特色,评估框架的各个维度都做相应的调整。

在开放性、透明度和文档方面,Stable Diffusion脱颖而出。其他一些评估系统都是建立在Stable Diffusion的各种模型之上或对其进行了微调。其他一些系统仅是开放权重的。Open AI的DALL-E完全闭源。

其实开放性并不是解决文本生成器的科学和伦理挑战。开放数据不会减轻轻率部署大型语言模型的有害后果,也不会减轻从互联网上抓取所有公开数据的可疑版权影响。然而,开放性确实使原创研究成为可能,包括努力构建可重复的工作流程和理解指令调优LLM架构的基本原理。开放性还实现了制衡,培养了对数据及其管理以及模型及其部署的问责文化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/727124.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

FRP内网穿透及多级代理的使用

目录 0、前言 1、场景介绍 2、环境准备 2.1 下载frp 2.2 配置一台VPS 2.3 socks5客户端 2.5 网络环境准备 3、Frp设置 3.1 一层代理 3.1 二层代理 4、Frp总结 0、前言 FRP是比较老牌的也是比较流行的反向代理、内网穿透软件。FRP用途和使用场景可以看官方文档&#xff0c;…

【Linux工具】yum软件包管理器与Vim编辑器的高效运用

目录 Linux 软件包管理器 YUM 什么是软件包 安装工具 rzsz 及注意事项 查看软件包 安装和卸载软件 安装软件 卸载软件 Linux 开发工具 编辑器 - Vim 使用 ​编辑 Vim 与 Vi 的区别 Vim 的基本概念 三种模式 Vim 的基本操作 操作尝试&#xff1a; Vim 命令集解释…

【有趣分享】火柴人VS数学

今天看到一个很有趣的视频&#xff0c;是火柴人VS数学&#xff0c;大家感兴趣的可以看一下&#xff1a; 火柴人 VS 数学(Math)https://www.bilibili.com/festival/jzj2023?bvidBV1ph4y1g75E&spm_id_from333.337.search-card.all.click

[Linux] 系统的基本架构特点

Linux系统的基本结构 Linux is also a subversion of UNIX,it follows the basic structure of UNIX 内核(kernel)&#xff1a; 操作系统的基本部分 管理与硬件相关的功能&#xff0c;分模块进行 常驻模块&#xff1a;进程控制IO操作文件\磁盘访问 用户不能直接访问内核 外壳(s…

java学习--集合(大写一.1)

看尚硅谷视频做的笔记 1.集合框架概述 1.1生活中的容器 首先知道集合是来解决什么问题的&#xff1f; 1.1.1内存层面需要针对于多个数据进行存储&#xff0c;此时&#xff0c;可以考虑的容器有&#xff1a;数组、集合类 对于内存层面的来说&#xff0c;断电后数据就不复存…

Python和OpenCV图像分块之图像边长缩小比率是2

import cv2 import numpy as npimg cv2.imread("F:\\mytupian\\xihuduanqiao.jpg") # 低反光 cv2.imshow(image, img) # # 图像分块 # dst np.zeros(img.shape, img.dtype) ratio 2 #图像边长缩小比率是2&#xff0c;也就是一张图片被分割成四份 height, wi…

模型预测控制MPC详解(附带案例实现)

模型预测控制MPC详解&#xff08;附带案例实现&#xff09; 文章目录 模型预测控制MPC详解&#xff08;附带案例实现&#xff09;1. 最优控制问题2. 什么是MPC3. 二次规划Quadratic Programming4. MPC为什么可以转换成QP问题&#xff08;推导过程&#xff09;5. MPC总结5.1 MPC…

希喂、K9、弗列加特主食冻干测评:这次,我们去了美国的实验室

主食冻干你有喂过吗&#xff1f; 作为有七年养猫经验的铲屎官&#xff0c;我强烈推荐&#xff0c;真的值得一试&#xff01; 在宠物经济蓬勃发展的今天&#xff0c;养猫已经成为了一门学问。人们开始追求更加科学、健康的养猫方式。大量喂养案例表明&#xff0c;传统的商业猫粮…

【ARMv8/v9 GIC 系列 2.1 -- GIC SPI 中断的 pending 和 clear pending 配置】

文章目录 GIC Pending 和 Clear PendingGICD_ISPENDR<n>GICD_ICPENDR<n>参数<n>编号解释使用举例设置中断ID 100为挂起状态清除中断ID 100的挂起状态 代码实现小结 GIC Pending 和 Clear Pending 在ARMv8体系结构中&#xff0c;GICD_ISPENDR<n> 和 GI…

C# WPF入门学习番外篇——C#使用WPF连接MySQL数据库

在 C# 中使用 WPF 连接 MySQL 数据库涉及几个步骤&#xff0c;包括安装必要的库&#xff0c;配置连接字符串&#xff0c;编写代码以执行数据库操作等。下面是一个详细的入门教程&#xff0c;帮助你理解如何在 WPF 应用程序中使用 MySQL 数据库。 1. 安装 MySQL 数据库连接器 …

两个方法,批量替换PPT中的字体

经常制作ppt的朋友可能会遇到需要批量替换字体的情况&#xff0c;如果我们想要更换ppt中的字体&#xff0c;今天分享PPT批量替换字体的两个方法。 方法一&#xff1a; 找到功能栏中的编辑选项卡&#xff0c;点击替换 – 替换字体&#xff0c;在里面选择我们想要替换的字体就可…

Humanize,一个很有人情味的 Python 库

目录 01初识 Humanize 为什么选择 Humanize&#xff1f; 安装 Humanize 02时间与日期的处理 时间差的展示 日期的展示 03数字的处理 数字的单位转换 数字的精确度控制 数字的千位分隔符 04文件大小的处理 文件…

JAVA语言开发的一套(智慧工地监管系统源码)让工地变得更加“聪明”

JAVA语言开发的一套&#xff08;智慧工地监管系统源码&#xff09;让工地变得更加“聪明” 数字智慧工地是指利用物联网、大数据、云计算、人工智能等先进技术&#xff0c;对工地进行全面数字化改造和智能化升级&#xff0c;实现工地管理的精细化、高效化和智能化。它通过实时…

ETO MARKETS:美债高额利息——美国财政的不可承受之重

摘要 2024年&#xff0c;美国联邦政府债务的利息支出预计将达到8920亿美元&#xff0c;这一数字比国防开支还要多&#xff0c;凸显了政府债务和利率上升的双重压力。国会预算办公室&#xff08;CBO&#xff09;预测&#xff0c;利息支出占GDP的比例将继续上升&#xff0c;这意…

Apple Phone Memory

Apple Phone Memory 苹果手机内存查询&#xff0c;哪些应用程序&#xff08;app&#xff09;占用内存&#xff1a; 设置 通用 iPhone储存空间 清理下QQ音乐&#xff1a;

远程桌面无法连接,远程桌面连接登录没有成功

在信息技术领域&#xff0c;远程桌面连接作为一种便捷的管理和操作工具&#xff0c;对于企业和个人用户而言都具有极其重要的价值。然而&#xff0c;在实际使用过程中&#xff0c;远程桌面无法连接的问题时常出现&#xff0c;这不仅影响了工作效率&#xff0c;还可能对数据安全…

Matlab数学建模实战应用:案例2 - 传染病传播

目录 前言 一、问题分析 二、模型建立 三、Matlab代码实现 四、模型验证 灵敏度分析 五、模型应用 实例总结 总结 前言 传染病传播模型是公共卫生和流行病学的重要研究内容&#xff0c;通过数学建模可以帮助我们理解传染病的传播规律和趋势&#xff0c;以便制定有效的…

多组学双疾病串扰怎么做?PAN-AD九个机器学习+MR+单细胞,工作量不少

说在前面 “串扰”这个名词听起来高级了一个level&#xff0c;其实就是MR-通路的双疾病联合分析。虽然是筛选标志物的思路&#xff0c;但是工作量不小&#xff0c;作者还收集了13个不同AD自身免疫疾病数据集用于验证自己的机器学习模型&#xff0c;分析就是一些常规的WGCNA、P…

VMware虚拟机三种网络模式设置 - NAT(网络地址转换模式)

一、前言 在前一篇《Bridged&#xff08;桥接模式&#xff09;》中&#xff0c;我详细介绍了虚拟机网络模式设置中的桥接模式。今天详细讲解一下NAT&#xff08;网络地址转换模式&#xff09;。 在虚拟机&#xff08;VM&#xff09;中&#xff0c;NAT&#xff08;Network Addre…

CSS--解决图片变形的方法

原文网址&#xff1a;CSS--解决图片变形的方法_IT利刃出鞘的博客-CSDN博客 简介 本文介绍html文件中图片变形的解决方法。 问题描述 我们经常需要指定所有图片的大小&#xff0c;让它们排列起来时看起来更整齐。但是&#xff0c;如果我们指定了width和height&#xff0c;那…