2023年6月第4周大模型荟萃

2023年6月第4周大模型荟萃

  • 2023.6.30
  • 版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。

1、腾讯云首次公布大模型进展

6月19日,腾讯云召开行业大模型及智能应用技术峰会,首次公布腾讯云行业大模型研发进展,联合22家客户正式启动行业大模型共建合作,并携手17家生态伙伴共同发起了“腾讯云行业大模型生态计划”,致力于共同推进大模型在产业领域的创新和落地。据透露,基于腾讯HCC高性能计算集群和大模型能力,腾讯云已经为传媒、文旅、政务、金融等10余个行业提供了超过50个大模型行业解决方案。会上,腾讯公布腾讯云 MaaS 服务解决方案。

腾讯云认为,相比通用大模型,企业更需要针对自身具体行业的大模型,并结合企业自身的数据进行训练和精调,以打造出更实用的智能服务。企业对提供的专业服务要求高,且容错性低,因此使用的大模型必须具备可控、可追溯和可修正的特点,并经过反复充分的测试。

腾讯云MaaS

2、OpenAI 或将推出 AI 模型商店,平台可以实现双向对接

OpenAI 正计划推出一个类似苹果“App Store”的 AI 模型应用商店,平台可以实现双向对接,开发者可以上架他们基于 OpenAI 技术搭建的产品,企业也可以按需使用市面上的 LLM,例如识别金融欺诈,或根据内部文件回答特定市场的问题。很多 ChatGPT 的企业客户通常会根据自己的特定用途定制 AI 模型,定制模型一多,OpenAI 便有了搭建模型商店的想法。OpenAI 还表示,目前基于 ChatGPT 相关的插件使用率不高,搭建一个类似“应用商店”的平台可以有效提高插件的使用率。

3、MosaicML 发布 MPT-30B 大语言模型,训练成本仅 70 万美元

AI 创业公司 MosaicML 近日发布了 MPT-30B 大语言模型,该模型具有 300 亿参数,训练成本为 70 万美元(约 502.44 万元人民币),远低于 GPT-3 等同类产品所需的数千万美元训练成本。由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。

4、美国律师因引用 ChatGPT 虚构案例被罚

当地时间 6 月 22 日,美国纽约联邦法官作出了一项判决,Levidow, Levidow & Oberman 律师事务所引用了 ChatGPT 撰写的一份由虚假案例引证的法庭简报,行为恶劣,对其处以罚款 5000 美元。就目前来看,类似 ChatGPT 之类的生成式 AI 也许可以在一些基础的法律服务方面给用户提供帮助,比如受众需求比较大的劳动案件、房地产案件、买卖纠纷、继承纠纷等,可以提供一些简单的解答。但对于比较复杂的纠纷,可能还是需要律师来服务。

5、Dropbox 推出 AI 搜索工具

云存储服务商 Dropbox 的日本子公司 Dropbox Japan 近日发布了基于 AI 的通用搜索工具 Dropbox Dash 测试版,该工具聚合了多个热门办公平台和应用,能有效提高用户的信息搜索效率。根据官方介绍,Dropbox Dash 与 Google Workspace、微软 Outlook 和 Salesforce 等平台集成,使用户可以在同一个搜索栏中快速找到工作所需信息,无需在应用程序之间来回跳转就能共享内容、加入会议或查找演示文稿。由于 Dropbox Dash 采用了机器学习技术,因此随着用户使用次数增加,其搜索结果也会依据用户偏好持续改进。此外,Dropbox Dash 也提供了堆栈功能,允许用户快速存储、整理和检索网页地址,并像文件夹列表一样对这些地址进行可视化的分级归纳。

6、清华唐杰团队发布开源 WebGLM

清华唐杰团队发布并开源 WebGLM,一个参数 100 亿的联网问答聊天机器人,相关论文入选 KDD2023。你可以问它任何问题,然后它将列举出网上(例如维基百科、相关官网)相关的文章链接,整理出答案。据介绍,在性能对比测试中,WebGLM 的水平已经高于 OpenAI 135 亿参数的 WebGPT,根据评估结果,尽管 WebGLM 的搜索结果略逊于 WebGPT-175B,但远好于Perplexity.ai 和 WebGPT-13B。

WebGLM 的目标是通过 Web 搜索和检索功能,增强预训练大语言模型,同时可以进行高效的实际部署。为此,作者基于三种策略进行开发:大模型增强检索器、自举生成器、基于人类偏好的打分器。大型语言模型增强检索器会将前五个最相关的页面作为参考源,让自举生成器生成多个答案,最终打分器选出最可能符合人类偏好的那一个作为最终输出。

7、东北大学发布以知识图谱构建为核心的大模型 TechGPT

2023 年 6 月 26 日,东北大学知识图谱研究组正式发布大语言模型 TechGPT。与当前其他各类大模型相比,TechGPT 主要强化了以“知识图谱构建”为核心的关系三元组抽取等各类信息抽取任务、以“逻辑推理”为核心的机器阅读理解等各类智能问答任务、以“文本理解”为核心的关键词生成等各类序列生成任务。在这三大自然语言处理核心能力之内,TechGPT 还具备了对计算机科学、材料、机械、冶金、金融和航空航天等十余种垂直专业领域自然语言文本的处理能力。

TechGPT 以 BELLE 作为强大的中文预训练 LLM 基座,并在 TechKG 大规模的中文学术语料支持下训练完成。得益于 BELLE 的前期工作,不仅完成了 70 亿参数(7B)版本的训练,也完成了 130 亿参数(13B)版本的训练。7B 的模型可以在显存和性能受限的设备上运行,而 13B 的模型可以提供更具逻辑和更高精度的回答。目前 7B 版本的 TechGPT 已经在 Hugging Face 和 GitHub 上开源。

8、大模型v1.2版评测榜单

综合能力得分为分类能力、信息抽取能力、阅读理解能力三者得分的平均值。见:https://zhuanlan.zhihu.com/p/634608422

LLM综合能力排行榜

无论是百度还是讯飞的老大,在他们的嘴中,早就脚踩ChatGPT,拳打OpenAI了,但是第三方测评却不这么看。

9、第 2 个“GPT 产业联盟"宣布成立

据证券时报,为实现战略协同、资源协同和能力协同,由中国互联网协会、中国信息通信研究院云大所、360集团联合主办的“GPT产业联盟”成立大会将在 6 月 28 日举办,以期携手推动 AI 技术的创新与发展。

早在今年 4 月 18 日,在北京举行的“2023 全球元宇宙大会”上,由中国移动通信联合会、中国电信、中国移动、中国联通、中国广电等单位共同发起成立了“GPT产业联盟”。

这种现象,跟目前国内大模型乱战环境分不开。大家都在搞大模型,谁也不服谁,大家的水平都差不多,都自称脚踩ChatGPT。

10、清华大学发布 ChatGLM2-6B 第二代大模型

6月25日,清华大学KEG和数据挖掘小组(THUDM)发布了第二代 ChatGLM2-6B 大模型。与第一代大模型想必,主要有四点升级:

  • 性能大幅提升。第二代的ChatGLM2-6B的基座模型使用了GLM模型的混合目标函数,在1.4万亿中英文tokens数据集上训练,并做了模型对齐,使得性能提升很高。
  • 更长的上下文。在第一代ChatGLM-6B上,模型的最高上下文长度是2K。而第二代的ChatGLM2-6B的基座模型使用了FlashAttention技术,升级到32K。
  • 更高效的推理,更快更便宜。ChatGLM2-6B使用了Multi-Query Attention技术,可以在更低地显存资源下以更快的速度进行推理,官方宣称,推理速度相比第一代提升42%。
  • 更加开放的协议。在第一代ChatGLM-6B模型中,有一个比较遗憾的是它的模型开源协议限制较大,完全禁止商用。而第二代的ChatGLM2-6B则宣布对学术研究完全开放,而且允许申请商用授权,不过需要书面申请,并且没有说明是否收费。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/35153.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

QT下载太慢,在线安装太慢的解决方案

实现效果 步骤1 下载在线安装的客户端,可以从qt.io(qt-unified-windows-x64-4.6.0-online.exe)下载,速度稍慢,但是大小也才38MB左右。 觉得下载太慢的小伙伴可以使用我提供的代下载版本,你们可以校验文件…

峰会来袭 | CAD模型转换工具选择的难点和关键点解答

作为世界顶尖的3D软件开发SDK和CAD模型转换工具——HOOPS Exchange已问世十多年,深受开发者好评,并在工业测量、机械加工、造船设计等领域都有广泛的应用。 本次峰会将围绕CAD软件造型技术的多样性、CAD模型数据解析的难点、3D模型转换的经典问题等&…

IDEA+springboot+jpa+Layui+Mysql销售考评系统源码

IDEAspringbootjpaLayuiMysql销售考评系统源码 一、系统介绍1.环境配置 二、系统展示1. 管理员登录2.评分结果3.评分管理4.添加评分5.用户管理6.添加用户7.角色管理8.添加角色8.销售管理9.添加销售 三、部分代码UserDao.javaUserController.javaUser.java 四、其他获取源码 一、…

黑芝麻智能科技、上海紫先面试(部分)(未完全解析)

黑芝麻智能科技 Hystrix可以限流吗?客户端限流,是限制对下游(被调用方)的访问,不是对本服务限流。从HystrixCommand的.withExecutionIsolationStrategy(ExecutionIsolationStrategy.SEMAPHORE)也可以看出来&#xff0c…

STM32外设系列—ESP8266(WIFI)

文章目录 一、ESP8266简介二、固件库烧录三、常用AT指令四、访问API4.1 获取IP地址4.2 GET天气信息4.3 访问结果展示 五、实战项目5.1 串口配置5.2 检测WIFI模块连接状态5.3 发送配置指令5.4 解析天气信息 六、成果展示 一、ESP8266简介 ESP8266是嵌入式和物联网开发中常用的模…

MySQL子查询

😇作者介绍:一个有梦想、有理想、有目标的,且渴望能够学有所成的追梦人。 🎆学习格言:不读书的人,思想就会停止。——狄德罗 ⛪️个人主页:进入博主主页 🗼专栏系列:进入MySQL专栏知…

Jenkins邮件配置报错com.sun.mail.smtp.SMTPSenderFailedException: 501

Jenkins邮件配置,配置完成各种信息之后,“通过发送测试邮件测试配置”点击Test configuration,报错 1、报错信息 com.sun.mail.smtp.SMTPSenderFailedException: 501 mail from address must be same as authorization userat com.sun.mail…

Xcode 15 beta 3 (15A5195k) 发布下载 - Apple 平台 IDE

Xcode 15 beta 3 (15A5195k) 发布下载 - Apple 平台 IDE (visonOS 1 beta 已发布) 7 月 5 日(北京时间今日凌晨)已发布。 IDE for iOS/iPadOS/macOS/watchOS/tvOS/visonOS 请访问原文链接:https://sysin.org/blog/apple-xcode-15/&#xf…

Flutter生命周期小结

Flutter 中的生命周期,包含以下几个阶段: createState ,在 StatefulWidget 中创建 State 的方法,当 StatefulWidget 调用时会触发 createState 。initState ,在 State 初始化时调用,因此可以在此期间执行 …

Python 基于招聘数据可视化系统

1 简介 Python 基于招聘数据可视化系统,视频效果如下: 基于Python的招聘信息可视化系统,附源码 随着国内的经济不断的快速发展,现在学生的就业压力也在逐年增加,网络上的招聘信息非常的丰富,但是对于学生而…

Flutter基础控件

Text:文字 Text("Flutter") Text是最常用也是最基础的,目前学习阶段只用来加载文字数据,更多属性和样式设置请查看源码自己探索。 Button:按钮 ElevatedButton:普通按钮 ElevatedButton(onPressed: () {if (kDebugMode) {print("Elevat…

安装和配置nginx(含https)

文章目录 安装Nginx配置单独的配置:https配置 nginx为什么可以处理高并发 安装Nginx sudo yum update sudo yum install epel-release sudo yum install nginx sudo systemctl start nginx安装好后可以打开自己的域名 看一下默认的页面 配置 具体参考Link 位置 …

软件工程——第7章实现知识点整理

本专栏是博主个人笔记,主要目的是利用碎片化的时间来记忆软工知识点,特此声明! 文章目录 1.实现由哪两个部分组成? 2.编码是什么?所选用的程序设计语言对程序的哪些特性有着深远影响? 3.软件测试在软件生…

Python编程实现针对回撤的交易策略

在金融交易市场上,回撤是一个常见的现象。因此,对于投资者来说,研究和设计针对回撤的交易策略是非常必要的。本文将介绍如何使用Python编程实现针对回撤的交易策略,以帮助投资者更好地进行交易。 一、回撤分析 在设计针对回撤的…

Cisco Catalyst 9000 Series Switches, IOS-XE Release Dublin-17.11.1 ED

Cisco Catalyst 9000 Series Switches, IOS-XE Release Dublin-17.11.1 ED Cisco Catalyst 9000 交换产品系列 请访问原文链接:https://sysin.org/blog/cisco-catalyst-9000/,查看最新版。原创作品,转载请保留出处。 作者主页:…

Basler相机一丢包就断开问题解决

问题描述: 两个相机, 一个相机aca2500-14gm连接电脑主板100M网卡没问题,帧率3帧,但是不会断。 一个相机aca2500-14gm连接USB转网口(千兆),pylon Viewer采图丢包严重并且几秒后相机断开。 解决…

Centos 7 下安装Redis

官网地址(英文):Redis 官网地址(中文):CRUG网站 or redis中文文档 Redis源码地址:GitHub - redis/redis: Redis is an in-memory database that persists on disk. The data model is key-v…

数据结构-排序

数据结构排序 1 知识框架2 插入排序2.1 直接插入排序2.2 折半插入排序2.3 希尔排序 3 交换排序3.1 冒泡排序3.2 快排 4 选择排序4.1 简单选择排序4.2 堆排序 5 归并和基数排序5.1 归并排序5.2 基数排序 1 知识框架 算法的稳定性:;两个相同的元素在排序算…

swiftUI和swift的区别

概述 SwiftUI是苹果公司推出的一种用于构建iOS、macOS、watchOS和tvOS应用程序界面的框架。它是基于Swift编程语言开发的,旨在简化UI开发过程并提供实时预览功能,使开发人员可以更快地构建出漂亮的应用程序界面。 Swift是苹果公司推出的一种面向对象的…

c++ word简单的写文本与画表格只支持docx

简单使用的代码如下所示&#xff1a; #include "stdafx.h" #include <windows.h> #include "minidocx.hpp" using namespace docx; using namespace std; std::string GB2312ToUTF8(const std::string& gb2312) { int len MultiByteToWid…