谷歌发布Gemini 1.0,开启生成式AI模型新时代!

个人头像
🎥 屿小夏 : 个人主页
🔥个人专栏 : IT杂谈
🌄 莫道桑榆晚,为霞尚满天!

文章目录

  • 📑前言
  • 一. Gemini的发布前期
    • 1.1 Gemini的准备
    • 1.2 DeepMnid
  • 二. Gemini的三大杀手锏
    • 2.1 多模态能力
    • 2.2 可拓展性
    • 2.3 新硬件,新架构
  • 三. 生成式人工智能领域的新格局会是什么样?

image-20231218202658001

📑前言

北京时间 12 月 6 日晚,Google 给近期稍显沉寂的 AI 模型战场扔下了一颗新的炸弹:号称多模态任务处理能力首次超越人类的 AI 模型,Gemini 1.0 正式发布。

一. Gemini的发布前期

1.1 Gemini的准备

在Gemini正式发布之前,外媒就有诸多关于 Google 这款全新 AI 模型的消息流出,Google 最早在今年五月的 IO 大会期间透露了 Gemini 的存在,但与之前外界预期的不同,Google 声称 Gemini 的发布并未因为任何内部原因而延期,表示其 AI 模型的研发进程从 2012 年已经开始,直到最近 2023 年发布 PaLM2 与 Bard 之后,就开始为 Gemini 的正式发布做准备。

1.2 DeepMnid

DeepMind本就是 AI 领域顶尖研究机构,早在 OpenAI 踏入聚光灯下之前,DeepMind 就凭借 AI 围棋棋手 —— AlphaGo 赢得了全世界对 AI 时代的关注,如今名为「双子座」的新一代 AI 大模型正式对外发布,也颇有抢回 AI 模型领域主导地位的感觉:双子座在神话本身就对应着「快速思维」的能力,同时也有着包罗万象、善于沟通等寓意。

image-20231218202900640

二. Gemini的三大杀手锏

2.1 多模态能力

Gemini是一款由Google开发的AI模型,它是史上第一款原生支持多模态能力的模型。与以往的多模态模型不同,Gemini在不同的模态上进行预训练,并利用额外的多模态数据进行微调,从而在处理复杂问题时表现更为出色。Gemini Ultra在行业标准MMLU基准测试中取得了90%的成绩,超过了人类专家和GPT-4同类测试的结果,并在九项独立基准测试中击败了竞争对手。这一突破性的训练架构让Gemini能够快速理解和推理人类的各种内容,为解决复杂问题提供了更加高效的解决方案。

image-20231218203433174

Gemini展示了其多模态理解能力,包括根据简笔画实时解读、根据视频中的颜色比例推荐编织玩具、以及玩猜硬币游戏。它与其他生成式AI模型最大的区别在于能够同时处理多种形态的信息输入。Google强调了Gemini在数学领域的复杂理解能力,展示了通过视频输入数学题,Gemini辅助解决的场景。这展示了Gemini在处理复杂逻辑的数学问题中的优势。

image-20231218203601183

2.2 可拓展性

到 2023 年下半年,大模型并行发展成为行业主流,尤其是端侧大模型在生成式 AI 应用中备受瞩目。vivo、小米、OPPO等手机品牌推出了端侧大模型与云端大模型的结合应用。在Gemini 1.0中,Google发布了三个版本:Gemini Ultra最聪慧,需要更大的计算量;Pro最均衡,适用于多场景;Nano体积最小最高效,主打部署在Android手机等设备上的端侧大模型。

image-20231218203908773

Gemini Nano具备完全在端侧离线运行的能力,已适配Pixel系统自带的录音App,可生成AI摘要,甚至在无网络连接时也可运行。Gemini Nano的能力已整合进Android系统,第三方应用开发者也可通过应用适配调用其能力。Google计划将Gemini适配到其他Android智能手机,但目前仅有Pixel 8 Pro适配。虽未正面回应是否超越GPT-4,但Gemini Ultra在MMLU中获得的评分比GPT-4更高,是唯一超越人类专家测试结果的AI模型。

img

img

2.3 新硬件,新架构

Google的TPU(张量处理单元)是专为神经网络机器学习开发的专用硬件,从2015年发布TPU v1至今已经迭代了五个大版本。

Gemini 1.0基于Google数据中心的TPU v4和TPU v5e大规模阵列训练而来。TPU阵列不仅用于训练Gemini,也应用在Gmail、YouTube、Google Play等Google生态应用中,并从2018年开始开放给第三方客户使用。

Gemini在TPU上的运行速度也明显优于早期的小模型。同时,Google展示了最新的TPU v5p系列,提升了可拓展性,浮点运算能力相比v4提升了两倍,训练速度也提升了2.8倍以上。

此外,还推出了代号为「AI Hypercomputer」的超级计算机架构,可以与Google Cloud计算中心的硬件协同工作,支持现代AI模型开发的工作负载。

image-20231218203827197

三. 生成式人工智能领域的新格局会是什么样?

最近OpenAI经历了一些领导层的变动,包括首席执行官被罢免后又回归,导致了一些不确定性。谷歌发布了Gemini,与OpenAI的GPT-4进行了对比,显示出在大型语言模型领域的激烈竞争。OpenAI也在密切关注谷歌的动向,并推出了一系列更新,包括GPT-4的升级版、将个性化GPT赋予用户的功能以及计划开放GPT应用商店等。OpenAI目前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

前的重点是开发下一代GPT-5,因为谷歌的Gemini在多个方面显示出对GPT-4的超越,这也让人们对GPT-5充满期待。

image-20231218205446562

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/256850.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux 音视频SDK开发实践

一、兼容性适配处理 为什么需要兼容处理? 1、c兼容处理 主要有ABI兼容性问题,不同ubuntu系统依赖的ABI版本如下: ubuntu 18.04ubuntu 16.04ubuntu 14.04g7.55.44.8stdc版本libstdc.so.6.0.25libstdc.so.6.0.21libstdc.so.6.0.19GLIBCXXG…

详解YOLOv5网络结构/数据集获取/环境搭建/训练/推理/验证/导出/部署

一、本文介绍 本文给大家带来的教程是利用YOLOv5训练自己的数据集,以及有关YOLOv5的网络结构讲解/数据集获取/环境搭建/训练/推理/验证/导出/部署相关的教程,同时通过示例的方式让大家来了解具体的操作流程,过程中还分享给大家一些好用的资源…

电脑备忘录小工具怎么添加?怎么在电脑桌面添加备忘录?

作为一名天天用电脑办公的上班族,如果你需要对某个项目或问题进入深入思考,想要快速记录想法和思路,这时候会选择什么样的记事方式呢?如果你需要记录常用的工作文字内容、工作注意事项、项目流程、待办的工作安排等,用…

vue 将后端返回的二进制流进行处理并实现下载

什么是二进制流文件? 二进制文件是一种计算机文件格式,它的数据以二进制形式存储,与文本文件不同。二进制文件可以包含任意类型的数据,例如图像、音频、视频、可执行文件、压缩文件等,而文本文件则仅仅包含 ASCII 码或…

PCL 点云匹配 之NICP(Normal ICP)

一、概述 上面一篇中我们已经得出了一个结论,就是ICP虽然简单,但是也有明显的缺点 1、计算速度慢,收敛慢,迭代次数多 2、对内存的开销比较大 3、很容易陷入局部最优的困局 因此我们在经典ICP的基础上添加一两个约束: 第…

鸿蒙开发之简单登录页面

Entry Component struct Index {State loading:booleanfalse;build() {Row() {Column({ space: 5 }) {Image($r("app.media.app_icon")).width(100).height(100).borderRadius(10).margin({top: 60})Text("登录界面").fontSize(40).fontWeight(FontWeight.…

Apollo Planning——PathLaneBorrowDecider

引用 组件数据缓存 DependencyInjector DependencyInjector:依赖注入器,这是一个过于专业的名词,来自软件设计模式的依赖倒置原则的一种具体实现方式,起到模块解耦作用。“依赖倒置原则(Dependence Inversion Principle)是程序要…

全国国控监测点点位数据,shp/excel格式,已可视化

基本信息. 数据名称: 全国国控监测点点位数据 数据格式: shpexcel 时间版本:2023年 数据几何类型: 点 数据精度:全国 数据坐标系: WGS84 数据来源:网络公开数据 数据字段: 序号字段名称字段说明1province省名称2city城市…

设计模式 原型模式 与 Spring 原型模式源码解析(包含Bean的创建过程)

原型模式 原型模式(Prototype模式)是指:用原型实例指定创建对象的种类,并且通过拷贝这些原型,创建新的对象。 原型模式是一种创建型设计模式,允许一个对象再创建另外一个可定制的对象,无需知道如何创建的细节。 工作原…

SQLturning:定位连续值范围起点和终点

在上一篇blog说到,如何去优化查询连续值范围,没看过的朋友,上篇blog链接[在此]。(https://blog.csdn.net/weixin_42575078/article/details/135067645?spm1001.2014.3001.5501) 那么今天来说说怎么将连续的数据合并,然后返回合并…

Android的组件、布局学习

介绍 公司组织架构调整,项目组需要承接其他项目组的android项目,负责维护和开发新需求,故学习下基础语法和项目开发。 组件学习 Toolbarheader布局部分 就是app最顶部的部分 他的显示与否,是与F:\androidProject\android_lear…

HTML有哪些列表以及具体的使用!!!

文章目录 一、HTML列表二、列表的应用1、无序列表2、有序列表3、自定义列表 三、总结 一、HTML列表 html的列表有三种&#xff0c;一种是无序列表&#xff0c;一种是有序列表&#xff0c;还有一种为自定义列表。 二、列表的应用 1、无序列表 <ul> <li>无序列表…

【ONE·English || 翻译作业 Development: Mendel‘s Legacy to Genetics】

总言 作业&#xff1a;没有严格按照语句结构进行翻译&#xff0c;有不规范之处。下述目录中每一小节是按照原文段落划分。   相关链接&#xff1a;pubmed中查阅的链接&#xff0c;提供了两处文章平台。 文章目录 总言part11.11.21.3 part2&#xff1a;Entwicklung and develo…

LabVIEW开发自动驾驶的双目测距系统

LabVIEW开发自动驾驶的双目测距系统 随着车辆驾驶技术的不断发展&#xff0c;自动驾驶技术正日益成为现实。从L2级别的辅助驾驶技术到L3级别的受条件约束的自动驾驶技术&#xff0c;车辆安全性和智能化水平正在不断提升。在这个过程中&#xff0c;车辆主动安全预警系统发挥着关…

hive企业级调优策略之Join优化

测试所用到的数据参考&#xff1a; 原文链接&#xff1a;https://blog.csdn.net/m0_52606060/article/details/135080511 本教程的计算环境为Hive on MR。计算资源的调整主要包括Yarn和MR。 Join算法概述 Hive拥有多种join算法&#xff0c;包括Common Join&#xff0c;Map …

Android 应用基准分析

先推荐一个作者的开源项目 最快的Json解析方式 参考 benchmark数据参考 benchmark的例子 可以参考json-benchmark 应用基准分析 是衡量时间维度的框架,是App界的鲁大师跑分,常用于耗时判断,冷启动,热启动,框架对比 预热对比等方面 开局一张图 下面再编 今天要做的是Microbe…

使用Python编写简单网络爬虫实例:爬取图片

&#x1f34e;个人主页 &#x1f3c6;个人专栏&#xff1a;日常聊聊 ⛳️ 功不唐捐&#xff0c;玉汝于成 目录 ​编辑 简介 步骤 1. 安装依赖库 2. 创建目录 3. 发送HTTP请求并解析页面 4. 查找图片标签并下载图片 注意事项 结语 我的其他博客 简介 网络爬虫是一种…

我的游戏被DDoS攻击了怎么办?

“我的游戏最近一直在被攻击&#xff0c;有什么办法可以解决”&#xff0c;最近遇到不少用户来问德迅云安全提到了自己目前遇到的这个攻击问题&#xff0c;询问有没有什么好的解决办法&#xff1f; 那遇到用户反馈的DDOS攻击&#xff0c;德迅云安全是怎么做的。 很多用户现在遇…

js数组方法总结,数组遍历方法,判断数组方法总结

目录 原生数组方法数组方法用法说明数组乱序和数组拆解会改变数组的方法不改变数组的方法JS 中的数组存储 判断数组的方法数组遍历的方法forEach和map方法有什么区别 原生数组方法 1.数组和字符串转换方法&#xff1a;toString&#xff0c;toLocalString&#xff0c;join&…

如何使用Qu1ckdr0p2快速通过HTTP或HTTPS实现文件托管

关于Qu1ckdr0p2 Qu1ckdr0p2是一款功能强大的文件托管工具&#xff0c;在该工具的帮助下&#xff0c;广大研究人员可以快速通过HTTP或HTTPS托管包括Payload和后渗透代码在内的任何文件。 Qu1ckdr0p2提供了别名和搜索功能&#xff0c;相关功能模块位于qu1ckdr0p2-tools库中。默…