Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!

博主猫头虎的技术世界

🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能!

专栏链接

🔗 精选专栏

  • 《面试题大全》 — 面试准备的宝典!
  • 《IDEA开发秘籍》 — 提升你的IDEA技能!
  • 《100天精通鸿蒙》 — 从Web/安卓到鸿蒙大师!
  • 《100天精通Golang(基础入门篇)》 — 踏入Go语言世界的第一步!
  • 《100天精通Go语言(精品VIP版)》 — 踏入Go语言世界的第二步!
  • 《21天精通IPV4 To IPV6》 — 踏入新IP时代的大门!

领域矩阵

🌐 猫头虎技术领域矩阵
深入探索各技术领域,发现知识的交汇点。了解更多,请访问:

  • 猫头虎技术矩阵
  • 新矩阵备用链接

在这里插入图片描述

文章目录

  • Google I/O 2024 干货全解读:Gemini AI 横空出世,智能未来触手可及!
    • 关于 Gemini
      • 1. Gmail 中的 Gemini
      • 2. Gemini 1.5 Pro & Flash
      • 3. Gemini Live
      • 4. Gemini Nano
      • 5. Android 上的 Gemini
    • 新模型&项目
      • 1. Imagen3
      • 2. Veo 视频生成模型
      • 3. LearnLM 模型
      • 4. Project IDX
    • 应用&工具更新
      • 1. AI 在搜索中的应用
      • 2. 圈选搜索
      • 3. 在通话过程中检测诈骗
      • 4. 询问照片
      • 5. Firebase Genkit
      • 6. Google Play

Hello, 大家好!我是猫头虎,今天凌晨,Google I/O 开发者大会如期而至,持续了整整两个小时。相信很多朋友没有熬夜看发布会,所以我在这里为大家整理了一下重要内容,希望大家喜欢!

关于 Gemini

1. Gmail 中的 Gemini

Gmail 用户有福了,Gemini AI 将帮助大家更智能地搜索、总结和起草邮件。不仅如此,它还能处理复杂任务,例如搜索收件箱、查找收据和填写在线表格,非常适合处理电商退货等事务。

图片

2. Gemini 1.5 Pro & Flash

Gemini 1.5 Pro 新版本可以处理多达 200 万 token,比以前的容量翻倍。而针对要求较低的应用,Google 还推出了 Gemini 1.5 Flash,这是个“精炼”版本,适合高频生成 AI 工作负载,依然可以处理 200 万个 token 上下文窗口。

图片

3. Gemini Live

Google 还预览了 Gemini Live,让用户可以在智能手机上与 Gemini 进行“深入”的语音聊天。你可以在聊天中打断 Gemini,提出澄清问题,它会实时适应你的语音模式。还可以通过智能手机摄像头拍摄的照片或视频来让 Gemini 了解周围环境并做出反应。

图片

4. Gemini Nano

Gemini Nano 是最小的 AI 模型,将直接集成到 Chrome 桌面客户端中,让开发者可以在设备上使用模型来支持自己的 AI 功能。Google 计划利用这一新功能来增强 Gmail 中的“帮助我写作”工具。

图片

5. Android 上的 Gemini

Android 设备上的 Gemini 将成为 Google Assistant 的 AI 替代品。用户可以将 AI 生成的图像直接拖放到 Gmail、Google Messages 和其他应用程序中,还能从 YouTube 视频中查找特定信息。

图片

新模型&项目

1. Imagen3

谷歌推出了 Imagen 3 模型,相比前身 Imagen 2,它能更准确地理解文本提示并生成更创意和细致的图像。为防止深度伪造,Imagen 3 将使用 SynthID 技术应用不可见的加密水印。

图片

2. Veo 视频生成模型

Veo 是一个 AI 模型,可以根据文本提示创建大约一分钟长的 1080p 视频剪辑,能够捕捉不同的视觉和电影风格。谷歌计划探索故事板和生成更长场景的功能,以了解 Veo 的潜力。

图片

3. LearnLM 模型

谷歌推出了 LearnLM,一个针对学习进行“微调”的新生成 AI 模型系列,旨在“对话式”辅导学生一系列科目,已经在 Google 的多个平台上使用,正在通过 Google Classroom 的试点项目进行试用。

图片

4. Project IDX

Project IDX 是谷歌的下一代、以 AI 为中心、基于浏览器的开发环境,现已进入公开测试阶段。它是一种多平台开发体验,可以快速构建应用程序,集成了 Google Maps Platform、Chrome 开发工具和 Lighthouse,并支持 Cloud Run 的部署。

图片

应用&工具更新

1. AI 在搜索中的应用

谷歌为搜索构建了定制的 Gemini 模型,将实时信息、谷歌排名、长上下文和多模态特征结合在一起。这个 AI 驱动的搜索概述功能已经在美国向“数亿用户”推出,目标是在今年年底前向超过 10 亿人提供服务。

图片

2. 圈选搜索

由 AI 驱动的“圈选搜索”功能允许 Android 用户通过圈选、突出显示等手势立即获得答案,现在能解决更复杂的心理学和数学应用题。

图片

3. 在通话过程中检测诈骗

Google 将在未来的 Android 版本中内置一个功能,利用 Gemini Nano 实时检测诈骗对话模式,并提醒用户注意潜在的诈骗。

图片

4. 询问照片

Google Photos 推出了一项新功能“Ask Photos”,允许用户使用自然语言查询来搜索照片集,利用 AI 对照片内容和元数据的理解,让搜索更直观。

图片

5. Firebase Genkit

Firebase 平台新增了一个名为 Firebase Genkit 的功能,旨在让开发人员更轻松地使用 JavaScript/TypeScript 构建 AI 驱动的应用,并即将支持 Go 语言。

图片

6. Google Play

Google Play 增强了应用发现功能、用户获取方式,并推出了 Play Points 更新和开发者工具(如 Google Play SDK Console 和 Play Integrity API),为开发者提供更多支持。

图片


这次 Google I/O 发布的内容真是干货满满啊!Gemini 系列不仅覆盖了邮件、搜索、浏览器等多个场景,还推出了多种新模型和工具,期待未来这些功能能给我们的生活和工作带来更多便利。

我是猫头虎,感谢大家的阅读,我们下期再见!

在这里插入图片描述

👉 更多信息:有任何疑问或者需要进一步探讨的内容,欢迎点击下方文末名片获取更多信息。我是猫头虎博主,期待与您的交流! 🦉💬

🚀 技术栈推荐
GoLang, Git, Docker, Kubernetes, CI/CD, Testing, SQL/NoSQL, gRPC, Cloud, Prometheus, ELK Stack

💡 联系与版权声明

📩 联系方式

  • 微信: Libin9iOak
  • 公众号: 猫头虎技术团队

⚠️ 版权声明
本文为原创文章,版权归作者所有。未经许可,禁止转载。更多内容请访问猫头虎的博客首页。

点击下方名片,加入猫头虎领域社群矩阵。一起探索科技的未来,共同成长。

🔗 猫头虎社群 | 🔗 Go语言VIP专栏| 🔗 GitHub 代码仓库 | 🔗 Go生态洞察专栏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/628569.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

git 拉取指定目录

指令方式 打开 git 自带的Git Bash 工具 以拉取github中 fastjson 的 /src/test/java/oracle/sql/ 目录为例 1.创建文件夹和git 初始化 cd D:/Program\ Files mkdir fastjson cd fastjson git init 2.设置允许克隆子目录 git config core.sparsecheckout true 3.添加远程…

前端开发攻略---用代码带你走近双色球再到远离双色球

1、演示 2、玩法及规则 双色球是一种流行的彩票游戏,它在很多国家都有自己的版本。以下是双色球的详细玩法: 选择号码:玩家需要从1至33的红色球中选择6个号码,并且从1至16的蓝色球中选择1个号码,构成一组7个号码。 购…

使用make_blobs生成数据并使用KNN机器学习算法进行分类和预测以及可视化

生成数据 使用make_blobs生成数据并使用matplotlib进行可视化 完整代码: from sklearn.datasets import make_blobs # KNN 分类器 from sklearn.neighbors import KNeighborsClassifier # 画图工具 import matplotlib.pyplot as plt # 数据集拆分工具 from sklea…

Linux 第三十一章

🐶博主主页:ᰔᩚ. 一怀明月ꦿ ❤️‍🔥专栏系列:线性代数,C初学者入门训练,题解C,C的使用文章,「初学」C,linux 🔥座右铭:“不要等到什么都没有了…

力扣127.单词接龙讲解

距离上一次刷题已经过去了.........嗯............我数一一下............整整十天,今天再来解一道算法题 由于这段时间准备简历,没咋写博客。。今天回来了!!!!!!!&…

【二叉树】(二)二叉树的基础修改构造及属性求解1

(二)二叉树的基础修改构造及属性求解1 翻转二叉树递归实现迭代实现(深度遍历)层序实现(广度遍历) 对称二叉树递归实现迭代实现(非层序遍历) 二叉树的最大深度递归法迭代法&#xff0…

你了解黑龙江等保测评么?

等保测评的全称是信息安全等级保护测评,是信息安全等级保护工作中的一项重要内容。 具体来说,等保测评是指按照国家相关标准和技术规范,对信息系统安全等级保护状况进行检测评估的活动。 其主要目的是发现信息系统存在的安全隐患和不足&…

学会给文件夹加密,保密措施不可或缺!

我们的个人信息、工作文件和其他重要数据都存储在各种设备和文件夹中,如何保证这些数据的安全,防止未经授权的访问和泄露,成为了一个不容忽视的问题。本文将探讨给文件夹加密的必要性,以及如何在手机和电脑上进行文件夹加密。 操作…

使用KNN预测一个新的点,以及将这个点用五角星进行matplotlib可视化展示

概述 基于之前的KNN案例继续做一些操作。 之前的完整代码如下: from sklearn.datasets import make_blobs # KNN 分类器 from sklearn.neighbors import KNeighborsClassifier # 画图工具 import matplotlib.pyplot as plt # 数据集拆分工具 from sklearn.model_…

DiskGenius帮你恢复系统无法识别的U盘数据

场景还原 前两天早上U盘复制文件卡死后,强行断开U盘,再次使用直接无法访问,心拔凉拔凉!! 使用驱动器G:中的光盘之前需要将其格式化 位置不可用-无法访问U盘 常规科普 一、U盘无法识别 1、检查U盘是否插入正确&…

【汇编语言】多文件组织

【汇编语言】多文件组织 文章目录 【汇编语言】多文件组织前言一、8086拓展1.子程序的另外一种写法2.程序的多文件组织 总结 前言 本篇文章将讲到子程序的另一种写法,以及程序的多文件组织。 一、8086拓展 1.子程序的另外一种写法 初始的程序 在这里我们对比一下…

6款电脑精选工具软件推荐!

AI视频生成:小说文案智能分镜智能识别角色和场景批量Ai绘图自动配音添加音乐一键合成视频https://aitools.jurilu.com/ 1.IP地址查看工具——纯真ip数据库 纯真IP数据库是一个易于操作的IP地址查询工具,它允许用户通过输入IP地址来查询其对应的地理位置…

每天五分钟玩转深度学习pytorch:pytorch中的张量类型

本文重点 和numpy一样,pytorch中也有自己的类型,本节课程我们将对它的类型进行介绍,并且学习不同的类型之间的转换,这是pytorch的基础。 基本类型 pytorch的基本变量称为张量Tensor,这张表是pytorch中的类型,Tensor有不同的类型,他和很多编程语言中的类型相似,它有 32…

ROS学习笔记(15)小车巡墙驾驶

0.前提 前一章我讲解了拉氏变换和PID,这一章我来讲解一下小车巡墙驾驶的理论和部分代码。 1.前情回顾 1.拉氏变换 拉普拉斯变换是要将时域问题转换成频域问题来处理。 2.PID控制器 转向角: 误差牺牲: 3.具体参看上一篇文章 2.巡墙驾驶…

AI 一键生成高清短视频,视频 UP 主们卷起来...

现在短视频越来越火,据统计,2023年全球短视频用户数量已达 10 亿,预计到2027年将突破 24 亿。对于产品展示和用户营销来说,短视频已经成为重要阵地,不管你喜不喜欢它,你都得面对它,学会使用它。…

Proxy和Reflect,打造灵活的JS代理机制 (代码示例)

在 JavaScript 中,代理(Proxy)和反射(Reflect)是 ES6 引入的两个新特性。Proxy用于创建一个对象的代理,从而实现对这个对象的操作的拦截、转换或扩展;而Reflect则提供了一系列与 JavaScript 运行…

线上3D博物馆搭建简单吗?有何优势?有哪些应用场景?

随着科技的飞速发展,传统的博物馆参观方式正在经历一场前所未有的变革,在科技的“加持”下,不少博物馆凭借强大的技术、创意和美学实践,频频“出圈”,线上3D博物馆逐渐崛起,这不仅丰富了人们的文化体验&…

Java集合之HashMap

概述 HashMap是基于哈希表的Map接口实现的一种存储key、value的数据结构,提供了所有可选的映射操作,且键值允许null的存在,不保证数据映射的顺序,也不能保证顺序在一段时间内保持不变 底层结构 jdk1.7:数组链表 jdk…

污水处理环保设备厂商怎么选

在选择污水处理环保设备厂商时,需要综合考虑多个因素来确保选取的供应商能够提供高质量的设备和服务。以下是一些主要的考虑因素: 企业资质和认证:首先检查供应商是否拥有相关的资质证书和行业认证,例如ISO 9001质量管理体系认证、…