【全网首发】上周申请的谷歌Gemini 1.5 Pro已通过!百万token的Gemini 1.5 Pro开箱测试(一)

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024谷歌一起变强。

一些结论

  1. 谷歌已开始陆续发放Gemini 1.5 Pro的体验权限,我是上周提交的waitlist申请,于昨天通过。

  2. Gemini 1.5 Pro是谷歌最新发布的一款Gemini系列模型,采用MoE架构,上下文窗口高达100万个tokens(对比目前GPT-4 Turbo的上下文窗口长度为128K,即12.8万个tokens),支持跨模态理解、分析和推理,即支持对图片和视频的分析。

  3. 逻辑推理测试结果:ChatGPT4.0 > 文心一言4.0 ≈ Gemini Ultra > Gemini 1.5 Pro

  4. 超长上下文测试结果:Gemini 1.5 Pro效果惊艳,测试对象是一本27万token的PDF电子书,Gemini 1.5 Pro均能正确的回答我提出的总结及查找、解释的问题。

上周申请的谷歌Gemini 1.5 Pro已通过!

我是Gemini 1.5发布第一天提交的waitlist申请,于昨天通过,等待时长大约1周。通过申请会收到一封主题为“It’s your turn to try Gemini 1.5 Pro”的邮件,点击“Try it now in Google AI Studio”即可在Google AI Studio体验Gemini 1.5 Pro模型。注意,目前是免费使用,那还要啥自行车,冲起来!

详细情况以及申请链接可以看我这篇文章: 重磅更新!谷歌发布Gemini 1.5 Pro!多模态,1000K上下文!附Waitlist链接!

谷歌Gemini系列模型介绍

谷歌的Gemini系列是谷歌最强大的多模态LLM模型,在图像、音频、视频和文本理解方面表现出优秀的能力。这一系列包括三个不同规模的模型:

Gemini 1.5 Pro

Gemini 1.5 Pro是谷歌最新发布的一款Gemini系列模型,采用MoE架构,上下文窗口高达100万个tokens(对比目前GPT-4 Turbo的上下文窗口长度为128K,即12.8万个tokens),支持跨模态理解、分析和推理,即支持对图片和视频的分析。

目前Gemini 1.5 Pro才刚刚发布,仅支持先申请waitlist,通过后可在Google AI Studio免费体验使用。

Gemini Ultra

Gemini Ultra:作为最大、功能最强大的类别,根据网上信息它的参数规模达到了1.56万亿,仅次于目前最先进的GPT-4(1.76万亿),在32个学术基准测试中的30个上刷新了SOTA(业内最佳)水平,甚至在MMLU测试集中超越了人类专家的得分12。

Gemini Ultra模型目前仅供Gemini Advanced付费会员使用。Gemini Advanced是谷歌推出的对标ChatGPT Plus的收费会员项目,费用为$20/月,附加2T的谷歌云盘空间,总体来看还是很香的!更重要的是,目前可以免费白嫖2个月的Gemini Advanced会员,详情请看我这篇文章: 来自谷歌的新年礼物!速来免费领取2个月谷歌Gemini Advanced会员!价值280元!对标ChatGPT Plus!

Gemini Pro

Gemini Pro:优化用于高级推理、规划和理解等任务,是一个强大的中等规模模型。

目前免费的Gemini用户即可使用这款模型,对标的是ChatGPT-3.5。并且谷歌免费提供Gemini Pro的API给用户使用,“AI信息Gap”公众号对话功能搭载的就是这款模型。

Gemini Nano

Gemini Nano:最高效的设备端任务模型。适用于移动设备,已经可以在诸如Pixel 8 Pro等设备上本地和离线运行,将人工智能的力量带到手机用户手中。

Gemini 1.5 Pro的优势

Gemini 1.5 Pro的核心功能包括:

  • 基于先进架构:Gemini 1.5 Pro采用了最新的Transformer和专家混合(MoE)架构,通过将网络分割成多个小型的“专家”网络来提高处理效率和精确度。这种架构使得模型能够根据输入类型自动选择最相关的专家路径,从而实现更高的运算效率和更准确的数据处理。

  • 扩展的上下文窗口:Gemini 1.5 Pro的上下文窗口容量显著增加,能够处理高达1百万个tokens,极大地扩展了模型处理和理解大规模数据集的能力。这一特性使得Gemini 1.5 Pro在分析、分类和总结复杂信息方面具有显著优势。

  • 高度复杂的信息处理能力:得益于其扩展的上下文窗口,Gemini 1.5 Pro能够无缝处理、分析和总结大量的文本、代码、视频和音频数据,包括但不限于长篇文档、大规模代码库和长时间的多媒体内容。

  • 跨模态理解和推理:Gemini 1.5 Pro在不同模态之间展现了高度复杂的理解和推理能力,能够准确分析视频内容、解析大量代码,并在多种数据类型中识别细节和模式。

Gemini 1.5 Pro初步测评

Gemini 1.5 Pro申请通过后,在Google AI Studio可以切换模型,切换到Gemini 1.5 Pro后,上方的图片Image和视频Video插入选项就自动开启,意味着可以插入图片和视频让Gemini 1.5 Pro进行分析。

逻辑推理测试

先来一道逻辑测试的经典题目,该题目ChatGPT4.0和文心一言4.0均回答正确,通过测试。

提示词:小明从A班调去了B班,结果A和B两个班的平均分都比上升了,请问这是为什么?

Gemini 1.5 Pro的回答:

小明从A班调去B班后,A、B两班的平均分都上升,可能的原因有以下几种:

  1. 小明的成绩高于两班的平均分:
    • 当小明离开A班时,A班失去了一个高分成员,导致平均分下降。而B班加入了小明这个高分成员,平均分就上升了。

  2. 小明在B班的学习环境更适合他:
    • 小明可能在B班的学习氛围、教学方式等方面更适应,学习效率提高,成绩进步,进而拉高了B班的平均分。同时,A班缺少了小明,平均分也可能略微下降。

  3. 其他因素:
    • 除了小明的影响,其他因素也可能导致两班平均分变化,例如:
      • 两班的教学质量同时提高。

      • 两班学生整体学习态度更加积极。

      • 考试难度变化等。

需要注意的是,以上只是几种可能性,具体原因需要结合实际情况进行分析。

Gemini Ultra的回答:

小明从A班调去B班后,A和B两个班的平均分都上升了,可能有以下几个原因:

1. 小明的成绩在A班偏低,在B班偏高。

  • 这种情况可能是由于A班的整体水平较高,导致小明的成绩在A班排名靠后,而B班的整体水平相对较低,小明的成绩在B班排名靠前。

  • 也有可能是由于小明在A班没有得到足够的重视和帮助,导致成绩不理想,而到了B班后,得到了老师和同学的更多关注和帮助,成绩有所提高。

2. 小明的调动改变了两个班的学生构成,导致了平均分的变化。

  • 由于小明的调动,A班少了一个成绩较低的学生,B班多了一个成绩较高的学生,这会导致两个班的平均分都发生变化。

  • 此外,小明的调动也可能对其他学生的学习产生影响,例如,小明的离开可能导致A班的学生更加努力学习,而小明的到来可能激励B班的学生更加积极学习,从而导致两个班的平均分都上升。

3. 其他因素。

  • 例如,两个班的考试难度不同,或者两个班的老师教学水平不同,也可能导致平均分的变化。

具体是哪种原因导致了两个班的平均分上升,需要进一步分析数据才能确定。

以下是一些可以帮助分析的数据:

  • 小明在A班和B班的成绩

  • A班和B班所有学生的成绩

  • A班和B班的考试难度

  • A班和B班老师的教学水平

通过分析这些数据,可以判断小明的调动对两个班平均分的影响程度,以及导致平均分变化的原因。

总结

推理能力:ChatGPT4.0 > 文心一言4.0 ≈ Gemini Ultra > Gemini 1.5 Pro

Gemini Ultra的回答基本正确,但存在一定程度的幻觉,我个人感觉还是因为对中文题目的理解程度不够好导致的审题问题,但确实也指出了正确的答案。Gemini 1.5 Pro的回答错误,产生了幻觉。

超长上下文信息查询测试

接下来测试Gemini 1.5 Pro的核心特点,100万窗口上下文。首先我上传了一本开源的《Algorithms》算法教材,作者是Jeff Erickson教授。可以看到,这本书的总token数为27万多,已经远超了GPT-4的上下文(128K)和Claude的上下文窗口长度(20万)。

总结

提示词:中文总结这本书的内容

Gemini 1.5 Pro的回答:

细节查询

提示词:请根据我上传的PDF,查找出关于Edmonds and Karp’s Algorithms - Fattest Augmenting Paths的介绍,详细解释和分析这个算法及其时间复杂度。用中文回复。

Gemini 1.5 Pro的回答:

提示词:如何用动态规划DP来找出一棵树上的largest independent set,详细写出算法的每一步,以及分析其时间复杂度。用中文回复。

Gemini 1.5 Pro的回答:

总结

初步测试来看,Gemini 1.5 Pro效果惊艳,不愧是号称百万token的上下文窗口,这在全世界范围内来看,也是最大的上下文了。测试对象是一本27万token的PDF电子书,Gemini 1.5 Pro均能正确的回答我提出的总结及查找、解释的问题。


精选推荐

  1. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  2. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  3. 字节开发的Coze进阶使用:用免费的GPT4打造一个专属的新闻播报机器人!附教程及提示词Prompt

  4. 盘点那些免费的AI对话工具(国内篇):国内TOP3 AI聊天机器人产品介绍

  5. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(一)

  6. AI聊天机器人,一个就够了:文心一言、讯飞星火、通义千问AI聊天机器人深度对比(二)

  7. 人工智能时代的领跑者:你必须了解的全球三大AI聊天机器人!

  8. 抖音出的AI工具火了!自动生成抖音文案,一键脚本数字人成片!

  9. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!

  10. 腾讯AI虽迟但到:腾讯文档AI开启公测!附申请地址及详细教程!


都读到这里了,点个赞鼓励一下吧😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/408069.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C# WPF 桌面应用程序使用 SQlite 数据库

我们在开发 WPF 桌面应用程序时,数据库存的使用是必不可少的,除非你的应用没有数据存储的需求,有了数据存储需求,我们就会面临使用什么样的数据库的选择问题,我的选择方案是,单机版的应用我优先选择 Sqlite…

Mac安装Appium

一、环境依赖 一、JDK环境二、Android-SDK环境(android自动化)三、Homebrew环境四、Nodejs 安装cnpm 五、安装appium六、安装appium-doctor来确认安装环境是否完成七、安装相关依赖 二、重头大戏, 配置wda(WebDriverAgent&#x…

小苯的IDE括号问题(CD) -----牛客小白月赛87(双链表)

C题&#xff1a;C-小苯的IDE括号问题&#xff08;easy&#xff09;_牛客小白月赛87 (nowcoder.com) D题&#xff1a; D-小苯的IDE括号问题&#xff08;hard&#xff09;_牛客小白月赛87 (nowcoder.com) C题代码&#xff1a; #include<bits/stdc.h>using namespace std…

番外篇 | YOLOv5+DeepSort实现行人目标跟踪检测

前言:Hello大家好,我是小哥谈。DeepSort是一种用于目标跟踪的深度学习算法。它结合了目标检测和目标跟踪的技术,能够在视频中准确地跟踪多个目标,并为每个目标分配一个唯一的ID。DeepSort的核心思想是将目标检测和目标跟踪两个任务进行联合训练,以提高跟踪的准确性和稳定性…

Sentinel微服务流量治理组件实战上

目录 分布式系统遇到的问题 解决方案 Sentinel 是什么&#xff1f; Sentinel 工作原理 Sentinel 功能和设计理念 流量控制 熔断降级 Sentinel工作主流程 Sentinel快速开始 Sentinel资源保护的方式 基于API实现 SentinelResource注解实现 Spring Cloud Alibaba整合…

一键生成PDF即刻呈现:轻松创建无忧体验

在信息爆炸的时代&#xff0c;我们每天都在与各种文件、资料打交道。无论是工作中的报告、合同&#xff0c;还是学习中的笔记、论文&#xff0c;如何高效、安全地管理这些珍贵的资料&#xff0c;成为了我们迫切的需求。幸运的是&#xff0c;随着科技的发展&#xff0c;我们不再…

Mysql--索引分类

Mysql--索引分类 1. 索引分类2. 聚集索引&二级索引 1. 索引分类 在MySQL数据库&#xff0c;将索引的具体类型主要分为以下几类&#xff1a;主键索引、唯一索引、常规索引、全文索引。 2. 聚集索引&二级索引 而在在InnoDB存储引擎中&#xff0c;根据索引的存储形式&am…

Mysql运维篇(五) 部署MHA--主机环境配置

一路走来&#xff0c;所有遇到的人&#xff0c;帮助过我的、伤害过我的都是朋友&#xff0c;没有一个是敌人。如有侵权&#xff0c;请留言&#xff0c;我及时删除&#xff01; 大佬博文 https://www.cnblogs.com/gomysql/p/3675429.html MySQL 高可用&#xff08;MHA&#x…

【算法与数据结构】417、LeetCode太平洋大西洋水流问题

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引&#xff0c;可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析&#xff1a;题目要求雨水既能流向太平洋也能流向大西洋的网格。雨水流向取决于网格的高度。一个比较直接的方式是对…

LangChain Agent v0.2.0简明教程 (中)

4. Retrieval4.1 Document loaders4.2 Text Splitter4.3 Text embedding models4.4 Vector stores4.5 Retrievers4.6 Indexing4. Retrieval 许多LLM需要使用特定用户的外部数据,这些数据不属于模型训练集的一部分。实现这一目标的主要方法是通过检索增强生成(RAG)。在此过程…

window: C++ 获取自己写的dll的地址

我自己用C写了一个插件,插件是dll形式的,我的插件式在dll的目录下有个config文件夹,里面是我用json写的插件配置文件,当插件运行的时候我需要读取到json配置文件,所有最重要的就是如何获取dll的路径. 大概就是这么个结构, 我自己封装了一个函数.只适用于window编程,因为里面用…

【ArcGIS】利用DEM进行水文分析:流向/流量等

利用DEM进行水文分析 ArcGIS实例参考 水文分析通过建立地表水文模型&#xff0c;研究与地表水流相关的各种自然现象&#xff0c;在城市和区域规划、农业及森林、交通道路等许多领域具有广泛的应用。 ArcGIS实例 某流域30m分辨率DEM如下&#xff1a; &#xff08;1&#xff09…

【大数据】Flink 内存管理(一):设置 Flink 进程内存

Flink 内存管理&#xff08;一&#xff09;&#xff1a;设置 Flink 进程内存 1.配置 Total Memory2.JVM 参数3.根据比例限制的组件&#xff08;Capped Fractionated Components&#xff09; Apache Flink 通过严格控制各种组件的内存使用&#xff0c;在 JVM 上提供高效的工作负…

LabVIEW储氢材料循环寿命测试系统

LabVIEW储氢材料循环寿命测试系统 随着氢能技术的发展&#xff0c;固态储氢技术因其高密度和安全性成为研究热点。储氢材料的循环寿命是衡量其工程应用的关键。然而&#xff0c;传统的循环寿命测试设备存在成本高、测试效率低、数据处理复杂等问题。设计了一种基于LabVIEW软件…

SQL-Labs靶场“46-50”关通关教程

君衍. 一、四十六关 ORDER BY数字型注入1、源码分析2、rand()盲注3、if语句盲注4、时间盲注5、报错注入6、Limit注入 二、四十七关 ORDER BY单引号报错注入1、源码分析2、报错注入3、时间盲注 三、四十八关 ODRER BY数字型盲注1、源码分析2、rand()盲注3、if语句盲注4、时间盲注…

汽车大灯尾灯灯罩裂了可以修复吗?汽车大灯尾灯裂缝修复用什么胶?拆开的灯罩用什么胶合壳密封?

随着科学技术的不断发展&#xff0c;汽车大灯尾灯破损是可以修的。 TADHE车灯无痕修复专用UV胶是一种经过处理的UV树脂胶&#xff0c;主要成份是改性丙烯酸UV树脂。应用在车灯的专业无痕修复领域。 其具备环氧树脂胶优点的同时&#xff0c;还有如下特点&#xff1a; 固化时间…

独立版表情包小程序完整版源码前后端源码,附带系统搭建教程

搭建要求&#xff1a; 1.系统要求Nginx 1.18.0PHP-7.2mysql5.6&#xff0c;开启 ssl&#xff0c;php需要安装 sg11 扩展 2.设置伪静态 location / { index index.php index.html index.htm; if (!-e $request_filename) { rewrite ^/(.*)$ /index.php?s$1; } } location /a…

华为OD机试真题-虚拟游戏理财-2023年OD统一考试(C卷)---Python3--开源

题目&#xff1a; 考察内容&#xff1a; for if max 代码&#xff1a; """ 题目分析&#xff1a;投资额*回报率投资回报 要在可接受范围内选择最优的投资方式获得最大回报最多投资2个理财产品输入&#xff1a; 产品数int; 总投资额int; 总风险int 产品投资…

C#中的dynamic怎么用

在C#中&#xff0c;dynamic 关键字允许您在编译时推迟类型检查&#xff0c;而是将类型检查推迟到运行时。这意味着可以在运行时确定对象的类型&#xff0c;而不是在编译时。这种行为与使用静态类型的编程方式有所不同&#xff0c;因为在编译时会对类型进行检查。 使用 dynamic …

k-means聚类、GMM高斯聚类、canopy聚类、DBSCAN聚类、FCM聚类、ISODATA聚类、k-medoid聚类、层次聚类、谱聚类 对比

k-means聚类、GMM高斯聚类、canopy聚类、DBSCAN聚类、FCM聚类、ISODATA聚类、k-medoid聚类、层次聚类、谱聚类 对比 标 代码获取代码获取代码获取代码获取代码获取代码获取代码获取代码获取代码获取代码获取题 GMM&#xff08;高斯混合模型&#xff09;是一种聚类算法&#xff…