今天分享的是电子系列深度研究报告:《AI专题:AI巨轮滚滚向前》。
(报告出品方:方正证券)
报告共计:65页
来源:人工智能学派
Gemini 1.5 Pro 性能显著增强,长上下文理解取得突破
Gemini 1.5 Pro 性能显著增强,支持 100 万 token 上下文长度。2024 年 2 月 15 日谷歌发布 Gemini 1.5 Pro,支持 100 万 token 上下文长度,谷歌透露内部研究 版本已直冲 1000 万。Gemini 1.5 Pro 性能显著增强,在长上下文理解方面取得 突破,能仅靠提示词学会训练数据中没有的新语言,其性能与谷歌迄今为止最大 的模型 1.0 Ultra 相当,在对文本、代码、图像、音频和视频的综合评估面板上 进行测试时,在用于开发大语言模型的 87%的基准测试中,Gemini 1.5 Pro 优于 1.0 Pro。
Gemini 1.5 Pro 代码、文本和视频交互能力卓越。Gemini 1.5 Pro 能够摄取整 个大型代码库,如 JAX(746,152 个 token),并回答关于它们非常具体的查询。除 此之外,在给定 Les missamrables 全文的情况下具有回答图像查询的能力,原 生的多模式允许它从手绘草图中定位一个著名的场景,另外,Gemini 1.5 Pro 可 回答电影相关问题,如输入 45 分钟的整部电影,该模型在检索时刻和时间戳精确到一秒的同时可无缝回答问题。
Gemini 1.5 Pro 新技能学习能力强大,有望提升稀有语言的翻译质量。Gemini 1.5 Pro 仅基于其输入中给出的参考材料学习新语言的能力,输入一整本语法书, Gemini 1.5 Pro 就能在翻译全球不到 200 人使用的卡拉曼语上达到人类水平, 在英语到卡拉曼语的翻译中,Gemini Pro 1.5 的 ChrF 达到了 58.3,略高于 MTOB 论文报告的 57.0 ChrF 人类基准。而 GPT-4 Turbo 和 Claude 2.1 一次只能看完 半本书,必须要微调或者使用外部工具。
AI 生产力革命如火如荼,产业链上下游协同发展
AI 生产力革命如火如荼,产业链上下游协同发展。我们看到,AI 大模型的发展 正在不断加速 AGI 通用人工智能的到来,纵观整个 AI 产业链,硬件和软件的配 合才能更好地实现多种终端应用的价值化落地,其中上游的基础层包括 AI 模型 生产工具(AI 算法框架+AI 开发平台+AI 开放平台+预训练大模型)、AI 算力基础 (AI 芯片+服务器+智算中心+云服务)、AI 数据资源(AI 基础数据服务+数据治 理),中游的技术层包括计算机视觉、智能语音、自然语言处理、知识图谱和机器 学习,下游的应用层则是百花齐放,以 AI+泛安防/泛互联网/媒体/金融/医疗/工 业/零售/政务为代表,还包括对话式 AI、机器人、自动驾驶、无人机等。可以预见的是,未来的 AI 时代又是生产力的爆发式革命。
三星 S24 系列引入 Galaxy AI,开启移动 AI 新时代
S24 系列引入 Galaxy AI,搭载骁龙 8 Gen3。 2024 年 1 月 18 日,三星电子正式 推出新一代高端旗舰 Galaxy S24 系列,产品包括 Galaxy S24 Ultra、Galaxy S24+和 Galaxy S24。该系列搭载第三代骁龙 8(for Galaxy)——高通首个专为 生成式 AI 而打造的移动平台,赋能 Galaxy AI,相比上一代 CPU 和 GPU 性能分别 提升 20%和 30%,NPU 性能显著提升。此外,三星在国内携手百度智能云,Galaxy AI 深度集成了百度文心大模型,而海外版建立在谷歌 AI 模型之上,均在智能文 本、通话翻译等方面提升用户体验。
AI 增强通话功能,为用户提供个人翻译。在沟通层面,S24 系列带来 Galaxy AI 全新通话实时翻译功能,通话时点击“通话辅助”,无需第三方应用即可实现双向 语音和文字翻译。实时翻译的过程基于完全离线的 AI 技术,效率高、稳定性强, 还保障了通话的隐私与安全。AI 驱动支持 13 种语言(17 个地区)的互译,除了 中英文,还包括法语、德语、日语、韩语等,也在短信与其他应用上通过写作助手、转录助手进行翻译、转录等生成文本的工作。
“即圈即搜”颠覆传统在线搜索模式。在搜索层面,即圈即搜功能使得用户能够 圈选屏幕上的内容,包括视频、图像及文字,在无需离开当前页面的情况下,立即获取更多相关信息。该功能不仅适用于网络浏览器和相册等应用,还可以在相 机应用的实时取景画面中使用。
超视觉影像、智能修图建议提升出片率。在影像拍摄上,搭载全新 AI 影像工具 套件——超视觉影像,超视觉夜拍功能升级,Galaxy S24 Ultra 的像素尺寸达到 1.4μm,相比前代机型提升了 60%,能够在昏暗环境下捕捉到更多光线;在影像 处理上,借助 Galaxy AI,可对照片进行清除、重新构图和重录等多种编辑。例 如,利用第三代骁龙 8(for Galaxy)认知 ISP 的强大算力,能自由移动被选中 的人物或物体的位置,通过生成式 AI 在原位智能生成自然、协调的背景。
大模型厂商创新不断,AI 加持多种应用场景
小米迈入“人车家全生态”,MWC 亮相在即。2023 年 10 月,小米推出了新系统小 米澎湃 OS,使 AI 大模型深入“人-车-家”整个生态系统。小米 14 系列的两款新 旗舰搭载该系统,是国内第一款能够在端侧运行 AI 大模型的智能手机,搭载了 小米自研的 60 亿参数级大模型,能够在手机上离线进行“文生图”、“AI 扩图” 与“AI 去除路人”。此外,小米“影像旗舰”14 Ultra 以及首款电动车——小 米 SU7 将亮相 MWC 2024,展示其“人车家全生态”操作系统。
OPPO 进入 AI 手机时代,推出 ColorOS AI 新春版。OPPO 在 2024 年 2 月 9 日的发 布会上,宣布正式进入 AI 手机时代,开启“千万用户 AI 尝鲜计划”。推出 ColorOS AI 新春版,可应用在 OPPO 的 16 款机型上,包括 OPPO Find X7 系列、Find X6 系列、Reno10 及 11 系列、一加 12 等。ColorOS AI 新春版带来 AI 消除、AI 通话 摘要、新小布助手、小布照相馆、小布 AI 贺卡等重大更新。其中,AI 通话摘要 可智能识别通话内容,生成重点信息摘要。
AI 增强通话功能,为用户提供个人翻译。在沟通层面,S24 系列带来 Galaxy AI 全新通话实时翻译功能,通话时点击“通话辅助”,无需第三方应用即可实现双向 语音和文字翻译。实时翻译的过程基于完全离线的 AI 技术,效率高、稳定性强, 还保障了通话的隐私与安全。AI 驱动支持 13 种语言(17 个地区)的互译,除了 中英文,还包括法语、德语、日语、韩语等,也在短信与其他应用上通过写作助 手、转录助手进行翻译、转录等生成文本的工作。
报告共计:65页
来源:人工智能学派