AI一周大事记 | 主动式AI应用崛起,国内大模型厂商继续发力,微软AI全家桶狂飙...

文章目录

    • 1. 大模型持续更新
      • 1.1 百川智能发布最新一代基座大模型 Baichuan 4
      • 1.2 微软新开源Phi-3系列三个模型
      • 1.3 面壁智能发布MMiniCPM-Llama3-V 2.5,成为全球最强端侧多模态模型!
    • 2. AI应用探索
      • 2.1 GitHub Copilot扩展定制Copilot体验
      • 2.2 微软 Team Copilot,个人智能助理变成团队助理
      • 2.3 微软 Azure AI Studio 现已支持提供GPT-4o API
      • 2.4 微软首发 Copilot+PC
      • 2.5 腾讯云 AI 代码助手,全面对外开放

1. 大模型持续更新

1.1 百川智能发布最新一代基座大模型 Baichuan 4

5 月 22 日,历时4个月打磨,百川智能发布最新一代基座大模型 Baichuan 4,并推出成立之后的首款AI助手“百小应”。

在这里插入图片描述

相较于前代Baichuan 3,迭代后的Baichuan 4在各项能力上均有极大提升,其中通用能力提升超过10%,数学和代码能力分别提升14%和9%,在国内权威大模型评测机构SuperCLUE的评测中,模型能力国内第一。

此外,官方表示,Baichuan 4还具备行业领先的多模态能力,即文本和图像等多种元素对齐、交互的能力,并在各大评测基准上表现优异,领先Gemini Pro、Claude3-sonnet等多模态模型。

在这里插入图片描述

在Baichuan4的基础上,百川智能将搜索技术与大模型深度融合,推出懂搜索、会提问的AI助手“百小应”。百小应不仅可以随时回答用户提出的各种问题,速读文件、整理资料、辅助创作等,还具备多轮搜索、定向搜索等搜索能力,能更精准地理解用户需求,为用户提供专业、丰富的知识和资源,还会在用户问题的基础上通过一系列提问来帮助用户明确自身需求,给出更精准的答案。
在这里插入图片描述

百川智能还宣布开放Baichuan4、Baichuan3-Turbo、Baichuan3-Turbo-128k、AssistantAPI四款API,所有开发者、企业用户均可登录百川智能开发者中心选择并接入相应API,便捷高效地体验百川智能新一代模型的强大能力。

1.2 微软新开源Phi-3系列三个模型

5 月 22 日凌晨,微软 Build 2024 开发者大会在美国西雅图召开,发布了有关 AI 技术,更有关 AI 带来的新工具。

小模型 Phi-3 家族上新!

先前,微软已发布Phi-3 mini版本,支持4k、128k上下文,能够在手机上运行,同时保持与大型模型如Mixtral 8x7B和GPT-3.5相媲美的性能。

这次发布会上,微软新开源Phi-3系列的三个模型:多模态Phi-3 Vision 4.2B、两个语言模型 Phi-3 Small 7B 和 Phi-3 Medium 14B。

  • Phi-3 Vision 4.2B 是Phi-3家族中的第一个多模态模型,结合了文本和图像视觉功能,以及对现实世界图像进行推理和从图像中提取文本并进行推理的能力。同时还针对图表和图解的理解进行了优化,可用于生成数据洞见和回答问题具有图像理解能力。Phi-3 Vision 4.2B 在benchmark数据集上性能超过 Claude-3 Haiku 和 Gemini 1.0 Pro V。
  • Phi-3 Small 7B 支持跨操作系统及云边端运行,在性能上与 Mixtral 8x22B 和Llama 3 70B 相当,目前优于Command R+ 104B和GPT 3.5。
  • Phi-3 Medium 14B 支持跨操作系统及云边端运行,性能上超越了 Mistral 7B 和 Llama 3 8B。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

1.3 面壁智能发布MMiniCPM-Llama3-V 2.5,成为全球最强端侧多模态模型!

5 月 20 日,面壁智能推出了最强端侧多模态开源模型 MiniCPM-Llama3-V 2.5。仅用8B参数,击败了OpenAI的 GPT-4V 和谷歌的 Gemini Pro,而且,其 OCR 长难图识别刷新SOTA,图像编码速度暴涨150倍,成为全球最强端侧多模态模型!
在这里插入图片描述

总结一下,MiniCPM-Llama3-V 2.5 的主要特点和优势:

  • 多模态能力飞升:参数规模仅 8B,综合性能却超越谷歌的多模态巨无霸 Gemini Pro 与 OpenAI 的 GPT-4V;
  • OCR 能力 SOTA:能够精准识别长图、难图与长文本,9 倍像素更清晰,同时具备识别与推理能力;
  • 手机端突破:首次整合 NPU 和 CPU 加速框架, 对手机端多模态大模型进行系系统级加速,速度提升 150 倍;
  • 多语种能力:支持 30 多种语言,除了中英双语,还包括法语、德语、西班牙语等等主流语言,基本覆盖了一带一路的所有国家。

在这里插入图片描述

图注:OpenCompass 榜单变化显示,小参数、高性能模型逐渐成为 AI 技术趋势

在这里插入图片描述

图注:模型雷达图,MiniCPM-Llama3-V 2.5 综合能力水平全面优秀

2. AI应用探索

2.1 GitHub Copilot扩展定制Copilot体验

作为微软生成式AI的首批重大运用,GitHub Copilot目前拥有180万付费用户。

5 月 21 日,在微软 Build 2024 开发者大会上,围绕 AI 软件开发能力,GitHub 推出首套由微软和第三方合作伙伴开发的 GitHub Copilot 扩展,允许任何人通过自然语言和更广泛的功能来提高代码开发速度。

GitHub Copilot 扩展用于打造智能的第三方生态系统。它的新增功能允许开发者、企业通过其偏好的诸如Azure、Docker、Sentry 等服务,直接在 GitHub Copilot Chat 中定制其GitHub Copilot 体验。

在这里插入图片描述

2.2 微软 Team Copilot,个人智能助理变成团队助理

5 月 21 日,微软宣布推出 Team Copilot,将 Copilot 从个人助手扩展到团队助手。Team Copilot 在团队协作中能够扮演任何角色,并扩展出 Agent 能力,成为不同领域的专家。
在这里插入图片描述

Agents 是可以实现业务流程自动化的全新自定义Copilot。每个业务流程都有待提高效率和释放新价值,并且每个流程都各不相同。

Agents 的功能包括如下:

  • 实现长期运行的业务流程自动化
  • 推理操作和用户输入
  • 利用内存引入上下文
  • 根据用户反馈进行学习
  • 记录异常请求并寻求帮助

在这里插入图片描述

2.3 微软 Azure AI Studio 现已支持提供GPT-4o API

5 月 21 日,微软宣布 GPT-4o 在 Azure AI 上普遍可用,还引入了Cohere、Databricks、Meta、Mistral等公司以及开源社区Hugging Face的多个大模型,进一步丰富了 Azure AI 平台的模型库。

当然,由微软开发的 Phi-3 列AI小型语言模型(SLM)中的一种新型多模态模型 Phi-3 Vision 也已在 Azure 中推出。

在这里插入图片描述

2.4 微软首发 Copilot+PC

5 月 21 日,微软首发 Copilot+PC。这是一款专为 AI 设计的新型 Windows PC,将旗下 AI 助手 Copilot 全面引入了 Windows 系统,并且内置了 OpenAI 的 GPT-4o 模型。Copilot+PC 的新功能 Recall 能够回忆并查找曾在显示屏上出现过的内容,使用 Cocreator 能够实时翻译约 40 种语言,实时生成或优化 AI 图像。Copilot+ PC 还配备了 AI Agent,具备充分的实时交互能力。

在这里插入图片描述

2.5 腾讯云 AI 代码助手,全面对外开放

5 月 22 日,腾讯云对外宣布旗下 AI 代码助手全面对外开放,开发者、开发团队、企业客户都可通过腾讯云官网进行在线体验。

腾讯云 AI 代码助手,是一款辅助编码工具,基于混元代码大模型,提供技术对话、代码补全、代码诊断和优化等能力。为你生成优质代码,帮你解决技术难题,提升编码效率。

在这里插入图片描述
在这里插入图片描述

欢迎各位关注我的个人微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/677929.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

扫码报名活动时,如何避免重复报名?

在用二维码进行活动报名或是物品领用时,如果有人重复提交,统计数据就会变得很麻烦。为了避免这种情况,我们可以为表单组件开启【内容不可重复提交】这个设置。 开启后,填表人就不能再填写 和「自己」 或 「其他填表人」 已提交的…

Vxe UI vxe-upload vue上传组件,显示进度条的方法

vxe-upload vue 上传组件 查看官网 https://vxeui.com 显示进度条很简单,需要后台支持进度就可以了,后台实现逻辑具体可以百度,这里只介绍前端逻辑。 vue 上传附件 相关参数说明,具体可以看文档: multiple 是否允许…

【第二节】C/C++数据结构之线性表

目录 一、线性表基本说明 1.1 基本概念 1.2 抽象数据类型 1.3 存储结构 1.4 插入与删除的区别 1.5 顺序存储和链式存储的优缺点 二、链表 2.1 基本概念 2.2 抽象数据类型 2.3 单链表的定义 2.4 单链表的基本操作 2.5 单链表模板形式的类定义与实现 三、单向循环链…

分享一份糟糕透顶的简历,看看跟你写的一样不

最近看了一个人的简历,怎么说呢,前几年这么写没问题,投出去就有回复,但从现在开始,这么写肯定不行了。下面我给大家分享一下内容: 目录 🤦‍♀️这是简历文档截图 🤷‍♀️这是基本…

虚拟海外仓系统哪个比较好?功能和性价比都要考虑到才行

虚拟海外仓作为海外仓的一种形式,因为其特有的一些优势和灵活性,还是受到很多人欢迎的。今天主要和大家聊一下,虚拟海外仓在选择海外仓管理系统的时候,都要注意什么,怎么才能选到合适的虚拟海外仓系统。 1、想选对wms…

谁将决战上海滩,决定权在你手里

关注我们 - 数字罗塞塔计划 - 5月6日雨轩兰台的《【大比武01】AIGC赋能档案文创设计的尝试》,打响了“华夏伟业”杯第二届大比武活动的第一枪,截止到5月31日,入选的10篇优质内容已全部揭晓,好评如潮。感谢雨轩兰台、微柏软件、昀…

【VSCode实战】转换大小写快捷键

今天在VSCode Insiders上编码,突然想将某常量转换为大写。按照virtual studio的习惯,我Ctrl Shift U没有效果,Ctrl U也没效果。网上搜了搜,原来VSCode Insiders没有这个默认功能。 而VSCode Insiders这么强大怎么可能没有大小…

Ubuntu24.04 LTS安装中文输入法

前言 最近,windows玩没了,一怒之下决定换一个操作系统,当然就是最新的Ubuntu24.04 LTS.,其中魔法和咒语(汉语)是inux遇到的第一大难关,我权限不够教不了魔法,但我可以教你咒语(๑•…

04基于Dockerfile创建自定义镜像并运行

自定义镜像 镜像的分层结构 常见的镜像在DockerHub就能找到, 如果我们自己要部署一个Java项目就要手动把它打包为一个镜像 部署一个Java应用的大概流程:准备一个Linux运行环境(CentOS或者Ubuntu均可)--> 安装并配置JDK --> 上传Jar包 --> 运…

智能驱动|ChatGPT视角下的告警事件闭环响应

背景 在人工智能技术浪潮发展驱动的背景下,数字化、智能化、多元化的网络安全格局逐渐形成。在这个时代如何有效利用好智能工具,促进工作有效开展,显得极为重要。很多安全企业也在大力发展GPT机器人从而实现数据智能化应用,发挥其…

深度学习笔记:1.anaconda安装

Download Anaconda Distribution | Anaconda 双击安装 设置环境变量 anaconda常用命令大全(保姆级别建议收藏)-CSDN博客https://blog.csdn.net/m0_64892604/article/details/128806043?ops_request_misc%257B%2522request%255Fid%2522%253A%252217174671831680018…

推荐ChatGPT4.0——Code Copilot辅助编程、Diagrams: Show Me绘制UML图、上传PDF并阅读分析

5月14日凌晨1点、太平洋时间的上午 10 点,OpenAI的GPT-4o的横空出世,再次巩固了其作为行业颠覆者的地位。GPT-4o的发布不仅仅是一个产品的揭晓,它更像是向世界宣告AI技术已迈入了一个全新的纪元,连OpenAI的领航者萨姆奥特曼也不禁…

图书管理系统(https://github.com/plusmultiply0/bookmanagesystem)

特意去github找了一个用flask框架的项目,一起来学习它吧 这个系统包括很多功能:用户权限管理模块(管理员和普通用户),注册登录模块(滑块验证码功能),图书有关信息模块(借…

Django使用正则表达式

本书1-7章样章及配套资源下载链接: https://pan.baidu.com/s/1OGmhHxEMf2ZdozkUnDkAkA?pwdnanc 源码、PPT课件、教学视频等,可以从前言给出的下载信息下载,大家可以评估一下。 在Django框架的新版本(v2.0 )中,URLc…

低比特大模型排行版暨AutoRoundV0.2发布

由于大量的量化模型没有精度数据,为了让用户更好地找到适配自己的模型或量化算法,最近推出了低比特大模型排行版,评估的指标主要涵盖10个zero shot的任务,如果有什么建议或者意见可以去社区提~目前支持13B以下模型的评估,后面可能…

2024专精特新趋势论坛,汉王友基分享数字化创新实践之路

5月31日,由深圳市中小企业服务局作为指导单位,36氪主办的“WISE新风向2024专精特新趋势论坛”在粤港澳大湾区顺利举办。 汉王友基作为国家级专精特新“小巨人”企业代表,受邀参加此次大会,企业CTO邓立明先生进行了《数字赋能&…

网易云音乐格式在线转换

应用分享:众所周知网易云下载的格式为 .NCM,只能在网易云音乐里播放。 今天提供在线转换为MP3格式 NCM TO MP3,无需安装,转换后就能在任意播放器使用。 使用地址: https://ncm.worthsee.com/ 网络研究观 数据泄露…

【力扣】矩阵中的最长递增路径

一、题目描述 二、解题思路 1、先求出以矩阵中的每个单元格为起点的最长递增路径 题目中说,对于每个单元格,你可以往上,下,左,右四个方向移动。那么以一个单元格为起点的最长递增路径就是:从该单元格往上…

PDF 文件的解析

1、文本 PDF 的解析 1.1、文本的提取 进行文本提取的 Python 库包括:pdfminer.six、PyMuPDF、PyPDF2 和 pdfplumber,效果最好的是 PyMuPDF,PyMuPDF 在进行文本提取时能够最大限度地保留 PDF 的阅读顺序,这对于双栏 PDF 文件的抽…

arduino 与 nodeMcu 之间的通信

一、前言 当在 arduino 板子处理好了传感器的数据应该发送给远程服务器这时候就需要用 nodeMcu 了,但是怎么把 arduino 的数据发送到 nodeMcu 呢,这就是本文要实现的。 两个板子之间通信很简单,直接使用 arduino IDE 提供的 Serial.println…