Google炸场!最强轻量级、开放模型Gemma发布,个人PC就能用,内部员工:强是强,但名字取得让我混乱

想参与根多多学术讨论,请加qq群

链接直达:00后编程交流qq群

如果想要聊天交友,可以加qq群

链接直达:00后聊天交友处cp  欢迎大家加入

不同于OpenAI的闭源大模型,科技巨头如Google和Meta正积极投入开放模型的开发,以期实现技术上的领先。

2月21日,Google推出了其新一代开放AI模型——Gemma(https://ai.google.dev/gemma)。这款轻量级模型在技术上可与Meta的Llama 2模型相媲美。

从名称上看,新推出的Gemma与Google之前的Gemini模型容易混淆。对此,Google在官方公告中解释道,Gemma的设计灵感来源于Gemini,而拉丁语中的“Gemma”意为“宝石”。两者之间的主要区别如下:

首先,Gemma可以被视为Gemini的更小、更轻量级的版本。

其次,Gemma的设计初衷是为了让开发人员和研究人员更容易访问和使用,而Gemini的设计则更侧重于处理更复杂的任务。

尽管两种模型均可免费使用,但Gemma的免费套餐功能相对有限。

更为重要的是,Gemma模型可以在台式机或笔记本电脑上本地运行。

这款最新的模型提供了两种尺寸选择:Gemma 2B(拥有20亿参数)和Gemma 7B(拥有70亿参数)。每种尺寸都分别有预训练版本和指令调整版本可供使用。

模型权重将以许可商业授权的方式发布,同时 Google 也会发布一个新的负责任的生成式人工智能工具包,指导开发者、研究人员负责任地使用 Gemma 模型。

在 AI 中,参数是神经网络中确定 AI 模型行为的值,权重是存储在文件中的这些参数的子集。

Gemma 的发布,也是 Google 自 2022 年 OpenAI 推出 ChatGPT 以来发布的首个开放式 LLM,但这并不是 Google 对开放式 AI 研究的第一个贡献。在官方博客中,Google AI 团队表示, 其在过去带来了 Transformers、TensorFlow、BERT、T5、JAX、AlphaFold 和 AlphaCode 等重要的 AI 架构和工具集。

所以这一次,其也为所有主要框架提供推理和监督微调 (SFT) 工具链:JAX、PyTorch 和 TensorFlow(通过本地 Keras 3.0)。

还有随时可用的 Colab 和 Kaggle 笔记本,以及与 Hugging Face、MaxText 和 NVIDIA NeMo 和 TensorRT-LLM 等流行工具进行了集成,方便开发者更容易上手使用 Gemma。

经过预训练和指令调整的 Gemma 模型可在笔记本电脑、工作站或 Google Cloud 上运行,并能够部署在 Vertex AI 和谷歌 Kubernetes Engine 上。

除此之外,英伟达在今天宣布与 Google 合作,在包括本地 RTX AI PC 在内的所有英伟达 AI 平台上启动优化,用来加速 Gemma 的性能。

同尺寸下,最先进的性能

当然新模型的发布,难免要和业界已存在的大模型一较高下。Google 在发布一份 16 页的 Gemma 技术报告时,将其与 Meta 的 LLaMA 2(7B)、LLaMA 2(13B),以及 Mistral(7B)进行了性能对比。

Google 表示,“Gemma 2B 和 7B 与其他开放式模型相比,在其规模上实现了同类最佳的性能。”

Gemma 技术报告评测结果如下:

从学术基准角度来看,Gemma 7B 在数学、Python 代码生成、常识和常识推理任务的几个基准测试中,优于 Meta 的 Llama 2 7B 和 13B 模型。

详细来看,在 MMLU 基准测试中,Gemma 7B 模型不仅超过了所有规模相同或更小的开源模型,还超过了一些更大的模型,包括 Llama 2 13B。

Google:Gemma 是负责任的设计

对于 AI 模型的发布,Google 一直采取比较谨慎的态度。

这一次,Google 也特别强调,「Gemma 的设计是将 AI 原则放在首位。为了使 Gemma 预训练模型安全可靠,Google 使用自动化技术从训练集中过滤掉某些个人信息和其他敏感数据。此外,他们还使用了大量的微调和人类反馈强化学习(RLHF),使指令调整模型与负责任的行为保持一致。为了了解并降低 Gemma 模型的风险,我们进行了严格的评估,包括人工红队、自动对抗测试和危险活动模型能力评估。」

此外,Google 还与 Gemma 一起发布了新的《负责任的生成式人工智能工具包》(https://ai.google.dev/responsible),以帮助开发人员和研究人员优先构建安全、负责任的人工智能应用。该工具包包括:

安全分类:发布 codelab(https://codelabs.developers.google.com/codelabs/responsible-ai/agile-classifiers),可使用最少的示例构建稳健的安全分类器。

调试:带来最新的模型调试工具 LIT(https://codelabs.developers.google.com/codelabs/responsible-ai/lit-gemma#0),可帮助开发者调查 Gemma 的行为并解决潜在问题。

指导:你可以根据 Google 在开发和部署大型语言模型方面的经验,获取模型构建者的最佳实践。

开放模型并不是指开源

最后,在很多专家学者来看,开源和开放权重的人工智能模型是确保聊天机器人透明度和隐私的重要步骤。

不过在发布 Gemma 之际,Google 特别强调了开源和开放模型的区别。其表示,“开放源代码的一个好处是,一旦发布,许可证就赋予用户完全的创作自主权。这为开发人员和最终用户获取技术提供了有力保障。另一个好处是,开放源码技术可以不受限制地进行修改,以适应最终用户的独特使用情况。”

但是 Gemma 遵循的规则是「开放模型」而非开源。开放模型的特点是可以免费获取模型权重,但使用、再分发和变体所有权的条款根据模型的具体使用条款而有所不同,这些条款可能不是基于开源许可证。

Gemma 模型的使用条款规定,个人开发者、研究人员和商业用户均可自由访问和重新分配这些模型。用户还可自由创建和发布模型变体。在使用 Gemma 模型时,开发者同意避免有害使用,这体现了 Google 对负责任地开发人工智能的承诺,同时也增加了对这项技术的使用。

之所以不用开源一词来形容 Gemma 的属性,在 Google 看来,现有的开源概念并不总能直接应用于 AI 系统,这就提出了如何在人工智能中使用开源许可证的问题。Google 所需要做的是,要澄清开源 AI 的概念,并解决衍生作品和作者归属等概念。

以下是修改后的内容:

Gemma 这个名字是否让你感到困惑呢?自从 Gemma 发布以来,它引起了众多 AI 从业者的关注,并有多家媒体将其与 Google 与 Meta 的 LLama 进行对比。

根据网友的分享,他们在 X 社交平台上展示了在 Macbook Pro M1 Max 32G 上安装了 Google 刚刚开源的 LLM gemma-7b 的经历,并表示“gemma-7b 的速度超过了 Llama 13 B”。

以下是他们进行的一个测试示例:

对 Gemma 感兴趣的朋友们,现在可以访问 Google 的官方网站(https://ai.google.dev/gemma)来亲自体验。

最后,回顾过去的三个月,Google 推出了多个产品。先是 Gemini,之后将 Bard 品牌名更名为 Gemini,并推出了更高级的版本 Gemini Advanced(类似于 ChatGPT Plus 的付费服务,请勿与 Gemini Ultra 混淆,该模型可与 OpenAI 的 GPT-4 相提并论)。

紧接着,Google 又推出了 Gemini 1.5,并带来了 Gemini for Workspace。据媒体报道,Google 内部还开发了一款名为“Goose”的产品,它是 Gemini 的后续版本,仅供内部使用,旨在帮助员工更高效地编写代码。

面对这些以“G”开头的名字不断涌现,据 Business Insider 报道,甚至连 Google 内部员工都感到有些无所适从,各种内部员工吐槽的表情包在网络上流传,有人甚至质疑:“哪位 VP 的 OKRs 是以 AI 产品名称的数量来衡量的?”

至此,你能准确分得清 Google 的各种模型吗?对最新发布的开放模型 Gemma 又有何看法?欢迎留言分享。

Google Gemma 官方博客:https://blog.google/technology/developers/gemma-open-models/

技术报告:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

使用地址:https://ai.google.dev/gemma

加入我们:

想参与根多多学术讨论,请加qq群

链接直达:00后编程交流qq群

如果想要聊天交友,可以加qq群

链接直达:00后聊天交友处cp  欢迎大家加入

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/408114.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Qt的QFileSystemModel与QTreeView、QTableView、QListView的组合使用

1.相关描述 QFileSystemModel与QTreeView、QTableView、QListView的组合,当QTreeView点击发生改变,QTableView和QListView也会发生变化 2.相关界面 3.相关代码 mainwindow.cpp #include "mainwindow.h" #include "ui_mainwindow.h"…

Flutter开发进阶之Package

Flutter开发进阶之Package 通常我们在Flutter开发中需要将部分功能与整体项目隔离,一般有两种方案Plugin和Package,Application是作为主体项目,Module是作为原生项目接入Flutter模块。 当独立模块不需要与原生项目通讯只需要Plugin就可以&a…

990-05产品经理:为什么商业价值是 IT 成功的关键

In today’s digital era, CIOs must shift(转移) their priorities from cost cutting to driving revenue(收入), and from process engineering to exploiting data if they want to achieve a set of broader business outcomes. Furthermore, understanding how to measur…

讯度云网络云服务器商

讯度云网络云服务器商 讯度云服务商能够为客户提供安全、稳定、高性能的云计算服务确保数据的安全性和可靠性而且有良好的用户反馈与评价靠着良好的 高防国内云/十堰/海外/美国/G口/香港/日本/物理机/挂机宝/大量有货香港4-4 20元起 亚太scdn节点50 0.01起!&#x…

计网 - 深入理解HTTPS:加密技术的背后

文章目录 Pre发展历史Http VS HttpsHTTPS 解决了 HTTP 的哪些问题HTTPS是如何解决上述三个风险的混合加密摘要算法 数字签名数字证书 Pre PKI - 数字签名与数字证书 PKI - 借助Nginx 实现Https 服务端单向认证、服务端客户端双向认证 发展历史 HTTP(超文本传输协…

Yolo v9 “Silence”模块结构及作用!

论文链接:👿 YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information 代码链接:👿 https://github.com/WongKinYiu/yolov9/tree/main Silence代码 class Silence(nn.Module):def __init__(self):supe…

win10开机黑屏,只有鼠标,解决方案

问题描述 win10进不去桌面,可以进去锁屏,只有鼠标,也能进去任务管理器(ctrlwindelete), 问题分析 进入任务管理器->文件->运行新任务 然后输入 explorer.exe 发现找不到了 原因:误删explorer.exe …

AI时代显卡如何选择,B100、H200、L40S、A100、H100、V100 含架构技术和性能对比

AI时代显卡如何选择,B100、H200、L40S、A100、H100、V100 含架构技术和性能对比。 英伟达系列显卡大解析B100、H200、L40S、A100、A800、H100、H800、V100如何选择,含架构技术和性能对比带你解决疑惑。 近期,AIGC领域呈现出一片繁荣景象&a…

SpringMVC 学习(三)之 @RequestMapping 注解

目录 1 RequestMapping 注解介绍 2 RequestMapping 注解的位置 3 RequestMapping 注解的 value 属性 4 RequestMapping 注解的 method 属性 5 RequestMapping 注解的 params 属性(了解) 6 RequestMapping 注解的 headers 属性(了解&…

检索增强生成(RAG) — 高级提示工程方法

Thread of Thought,ThoT Thread of Thought Unraveling Chaotic Contexts 大型语言模型(LLMs)在自然语言处理领域开启了一个变革的时代,在文本理解和生成任务上表现出色。然而,当面对混乱的上下文环境(例…

【day02】每天三道 java后端面试题:Java、C++和Go的区别 | Redis的特点和应用场景 | 计算机网络七层模型

文章目录 1. Java、C和 Go 语言的区别,各自的优缺点?2. 什么是Redis?Redis 有哪些特点? Redis有哪些常见的应用场景?3. 简述计算机网络七层模型和各自的作用? 1. Java、C和 Go 语言的区别,各自的…

CUDA C++ 编程指南

目录 1. Introduction1.1. The Benefits of Using GPUs1.2. CUDA: A General-Purpose Parallel Computing1.3. A Scalable Programming Model CUDA C Programming Guide 1. Introduction 1.1. The Benefits of Using GPUs 在相似的价格和功耗范围内,图形处理单…

二刷代码随想录算法训练营第四天 |24. 两两交换链表中的节点、19.删除链表的倒数第N个节点 面试题 、02.07. 链表相交 、142.环形链表II

目录 一、24. 两两交换链表中的节点 二、19. 删除链表的倒数第 N 个结点 三、面试题 02.07. 链表相交 四、142. 环形链表 II 一、24. 两两交换链表中的节点 题目链接:力扣 文章讲解:代码随想录 视频讲解: 帮你把链表细节学清楚&#xff…

了解人工智能计算: 人工智能入门

回顾历史,各种数学仪器在人类进步的历程中发挥了重要作用。从算盘和六分仪到滑尺和计算机,这些工具推动贸易、助力航海,增强理解,并提高了我们的生活质量。然而,在科学和工业领域,推动我们前进的前沿且强大…

OpenCV 4基础篇| OpenCV像素的编辑

目录 1. 前言1. 像素的访问1.1 数组索引访问1.2 img.item() 2. 像素的修改2.1 数值索引修改2.2 img.itemset() 1. 前言 像素是构成数字图像的基本单位,像素处理是图像处理的基本操作。 对像素的访问、修改,可以使用 Numpy 方法直接访问数组元素。 1. 像…

华为HCIP Datacom H12-831 卷25

多选题 1、某OSPF路由器R1的部分配置如图所示。以下关于该部分配置的分析描述。正确的有哪些项? A、R1开启了两个OSPF进程.若要VPN tt的路由信息显示在进程1的路由表中,需要在进程1中引入OSPF进程2路由 B、R1开启了两个OSPF进程,相关网段都通告进了骨…

Nodejs+vue图书阅读评分个性化推荐系统

此系统设计主要采用的是nodejs语言来进行开发,采用 vue框架技术,对于各个模块设计制作有一定的安全性;数据库方面主要采用的是MySQL来进行开发,其特点是稳定性好,数据库存储容量大,处理能力快等优势&#x…

改进Yolov5目标检测与单目测距 yolo速度测量-pyqt界面-yolo添加注意力机制

当设计一个结合了 YOLOv5 目标检测、单目测距与速度测量以及 PyQt 界面的毕业设计时,需要考虑以下几个方面的具体细节: 计算机视觉、图像处理、毕业辅导、作业帮助、代码获取,私聊会回复! YOLOv5 目标检测: 首先,选择…

go语言的理解,看这一篇就够了

1.来源 Go语言是谷歌2009年发布的第二款开源编程语言 2.谷歌为什么要创建Go语言 计算机硬件技术更新频繁, 性能提高很快,默目前主流的编程语言发展明显落后于硬件,不能合理利用多核多CPU的优势提升软件系统性能软件系统复杂度越来越高,维护成本越来越高,目前缺乏一个简洁而高效…

AI:135-基于卷积神经网络的艺术品瑕疵检测与修复

🚀点击这里跳转到本专栏,可查阅专栏顶置最新的指南宝典~ 🎉🎊🎉 你的技术旅程将在这里启航! 从基础到实践,深入学习。无论你是初学者还是经验丰富的老手,对于本专栏案例和项目实践都有参考学习意义。 ✨✨✨ 每一个案例都附带关键代码,详细讲解供大家学习,希望…