AI大模型日报#0415:贾佳亚团队新作王炸、马斯克首款多模态大模型、ChatGPT to B

导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。

标题: 融合ChatGPT+DALLE3,贾佳亚团队新作开源:识图推理生图一站解决
 


摘要: 贾佳亚团队推出了多模态模型Mini-Gemini,融合了ChatGPT和DALL-E 3的能力,可高精度理解图像、解析推理,并能结合图像推理和生成。该模型提供了不同规模的版本,最强版本在多个指标上与商业模型相当。Mini-Gemini已开源并受到广泛关注,网友认为其与商业模型相差不大。此外,团队还发布了Mini-Gemini线上Demo,引起网友热议。
网址: https://www.qbitai.com/2024/04/135548.html
 
标题: 北大字节开辟图像生成新范式!超越Sora核心组件DiT,不再预测下一个token
 


摘要: 北大和字节跳动合作提出了一种新的图像生成范式VAR,它不再预测下一个token,而是预测下一级分辨率。该方法在效果上超越了Sora的核心组件DiT,图像生成质量更高,推理速度提高了20+倍。VAR是首个在图像生成领域击败DiT的自回归模型,具有大语言模型同款的Scaling Laws和零样本任务泛化能力。该方法已开源并在GitHub上受到广泛关注。
网址: https://www.qbitai.com/2024/04/135638.html
 
标题: 专题综述 | 大语言模型中的知识生命周期
 


摘要: 本文聚焦于知识在大规模语言模型(LLMs)中的生命周期,将其划分为五个关键阶段,并系统性地回顾了各阶段的代表性研究。文章指出,尽管相关研究众多,但对于知识在语言模型中的完整生命周期仍缺乏整体性观点,这可能阻碍对各研究方向间联系和现有研究局限性的认识。文章总结了每个阶段的核心挑战和主要局限性,并讨论了未来潜在的发展方向。相关成果已发表于《机器智能研究(英文)》2024年第2期中。
网址: 专题综述 | 大语言模型中的知识生命周期 - 智源社区
 
标题: 马斯克的首款多模态大模型来了,GPT-4V又被超越了一次
 


摘要: 自2023年11月首次亮相以来,马斯克的xAI在大模型领域迅速发展,向OpenAI等发起挑战。xAI的Grok-1.5V多模态模型不仅能理解文本,还能处理多种格式内容,且在多学科推理等领域与顶尖模型相媲美。xAI计划未来在图像、音频和视频等模态上继续提升模型能力。在RealWorldQA基准测试中,Grok展现出了在理解物理世界方面的优越表现。若Grok-1.5以类似Grok-1的开源许可证发布,将具有重大意义。
网址: 马斯克的首款多模态大模型来了,GPT-4V又被超越了一次 | 机器之心
 
标题: GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式
 


摘要: 新一代视觉生成范式VAR(Visual Auto Regressive,视觉自回归)由北京大学和字节跳动的研究者提出,使GPT风格的自回归模型在图像生成上首次超越扩散模型,具备大语言模型相似的缩放定律和泛化能力。该工作登上GitHub和Paperwithcode热度榜单,引起广泛关注。体验网站、论文、代码、模型已公开。
网址: GPT超越扩散、视觉生成Scaling Law时刻!北大&字节提出VAR范式 | 机器之心
 
标题: OpenAI推销ChatGPT to B业务,微软客户也是目标
 


摘要: OpenAI首席执行官山姆・奥特曼本月在旧金山、纽约和伦敦会见了数百名500强公司高管,推销了企业使用的人工智能服务,并与微软产品进行了比对。这些活动表明OpenAI正在通过ChatGPT寻求从全球企业增加新收入来源。奥特曼和OpenAI首席运营官进行了产品演示,包括ChatGPT Enterprise和API服务。此前未曝光的会议吸引了每个城市100多名高管参加。
网址: OpenAI推销ChatGPT to B业务,微软客户也是目标 | 机器之心
 
标题: 谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024
 


摘要: 研究人员探索了大语言模型上的模型重编程,提出了高效重编程大语言模型进行通用时序预测的全新视角,实现了高精度时序预测,无需修改语言模型。这让大语言模型在处理跨模态时间序列数据时表现出色,有望彻底改变时序/时空数据挖掘方式,促进决策高效制定,并朝着更普遍的时序/时空分析智能形式迈进。大模型可重新调整用途,处理通用和专用领域应用中的时间序列和时空数据。
网址: 谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024 | 机器之心
 
标题: GPT-4整治学术不端!人大/浙大团队实测7000篇论文,撤稿预测与人类95%一致
摘要: 要点提炼: 中国学者利用GPT-4预测论文撤稿情况,发现其预测结果与人类审稿人相似度高达95%。这一发现表明大模型在维护科研诚信方面具有潜力。传统方法如同行评审和读者反馈无法及时发现所有问题论文,而GPT-4能够快速识别并促进问题论文的撤稿。该研究为学术界提供了一个新的解决方案,有助于维护科研诚信和公众信任。
网址: GPT-4整治学术不端!人大/浙大团队实测7000篇论文,撤稿预测与人类95%一致|gpt-4|学术不端|学术论文|撤稿|浙大|科研论文_手机网易网
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/546713.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

day58 回文子串 最长回文子序列

题目1:647 回文子串 题目链接:647 回文子串 题意 统计字符串s中回文子串的数目 回文子串是正着读和倒过来读一样的字符串 子串是连续字符组成的一个序列 动态规划 动规五部曲 1)dp数组及下标i的含义 dp[i][j] 表示 [s[i]&#xf…

转移插槽简介

4.3.4.转移插槽 我们要将num存储到7004节点,因此需要先看看num的插槽是多少: 如上图所示,num的插槽为2765. 我们可以将0~3000的插槽从7001转移到7004,命令格式如下: 具体命令如下: 建立连接:…

【读书笔记】自动驾驶与机器人中的SLAM技术——高翔

文章会对本书第五章节及以后章节进行总结概括。每日更新一部分。一起读书吧。 第五章——基础点云处理 重点:点云的相邻关系是许多算法的基础 5.1 激光雷达传感器与点云的数学模型 5.1.1激光雷达传感器的数学模型 雷达有两种:机械旋转式激光雷达&…

RocketMQ集群配置

我们集群部署采取采用2m-2s(同步双写)方式,每个Master配置一个Slave,有多对Master-Slave,HA采用同步双写方式,即只有主备都写成功,才向应用返回成功. 1、服务器环境 序号IP角色架构模式1192.16…

一文详解MES、ERP、SCM、WMS、APS、SCADA、PLM、QMS、CRM、EAM及其关系

经常遇到很多系统,比如:MES、ERP、SCM、WMS、APS、SCADA、PLM、QMS、CRM、EAM,这些都是什么系统?有什么功能和作用?它们之间的关系是怎样的? 今天就一文详细分享给大家。 10大系统之间的关系 ERP 和其他…

深度学习之PyTorch实现卷积神经网络(CNN)

在深度学习领域,卷积神经网络(Convolutional Neural Networks,CNN)是一种非常强大的模型,专门用于处理图像数据。CNN通过卷积操作和池化操作来提取图像中的特征,具有较好的特征学习能力,特别适用…

机器学习算法快速入门

文章目录 0.简介1.常用术语1) 模型2) 数据集3) 样本&特征4) 向量5) 矩阵6)假设函数&损失函数7)拟合&过拟合&欠拟合 2.线性回归3.梯度下降求极值4.Logistic回归算法(分类问题)5.KNN最邻近分类算法6.朴素贝叶斯分类算法7.决策树…

Python调用微信OCR识别文字和坐标

原理 在看雪看到一篇文章:逆向调用QQ截图NT与WeChatOCR-软件逆向。里面说了怎么调用微信和QQ本地的OCR模型,还有很详细的分析过程。 我稍微看了下文章,多的也看不懂。大概流程是使用mmmojo.dll这个dll来与WeChatOCR.exe做通信的&#xff0c…

1688拍立淘接口:图像识别技术引领电商搜索新革命,打造智能购物新体验!

1688拍立淘接口:技术解析与应用实践 一、引言 在电子商务蓬勃发展的今天,图像识别技术正逐渐成为各大电商平台提升用户体验、优化搜索效率的关键技术之一。作为阿里巴巴旗下的B2B采购批发平台,1688也紧跟技术潮流,推出了拍立淘接…

Dos命令的基础

雷迪斯and the乡亲们 欢迎你们来到 奇幻的编程世界 一、DOS命令基础 提示符 根目录:进入大到分区后,最外层的目录就是跟目录 工作目录:当前的所在位置/所在文件夹 二、cd命令 切换工作目录: cd 格式: cd 目标 …

巧避海森堡不确定性原理!量子比特读出技术重磅突破

内容来源:量子前哨(ID:Qforepost) 文丨浪味仙 排版丨沛贤 深度好文:1200字丨7分钟阅读 摘要:阿尔托大学研究人员用微测辐射热计替代传统参数放大器,以更少的附加噪声实现非侵入式量子比特测量…

排序链表 - LeetCode 热题 33

大家好!我是曾续缘😹 今天是《LeetCode 热题 100》系列 发车第 33 天 链表第 12 题 ❤️点赞 👍 收藏 ⭐再看,养成习惯 排序链表 给你链表的头结点 head ,请将其按 升序 排列并返回 排序后的链表 。 示例 1&#xff1a…

带你追踪 ICASSP 2024会议现场 韩国夜景令人陶醉

会议之眼 快讯 昨天,2024年的ICASSP(International Conference on Acoustics, Speech, and Signal Processing)即国际声学、语音和信号处理会议已经在韩国首尔拉开帷幕!吸引了众多热情的与会者!本届ICASSP会议举办日期…

实验笔记之——RGBD GS-ICP SLAM配置与测试

《RGBD GS-ICP SLAM》是最新开源的一个3DGS-SLAM工作,通过利用GICP来实现当前帧gaussian与已mapping的gaussian进行匹配进行位姿的估算,并通过关键帧的选择策略来进一步提升performance~ Use G-ICP to align the current frame with the 3D GS map whic…

Redis消息队列-基于PubSub的消息队列

7.3 Redis消息队列-基于PubSub的消息队列 PubSub(发布订阅)是Redis2.0版本引入的消息传递模型。顾名思义,消费者可以订阅一个或多个channel,生产者向对应channel发送消息后,所有订阅者都能收到相关消息。 SUBSCRIBE …

OpenHarmony实战开发-图片选择和下载保存案例。

介绍 本示例介绍图片相关场景的使用:包含访问手机相册图片、选择预览图片并显示选择的图片到当前页面,下载并保存网络图片到手机相册或到指定用户目录两个场景。 效果图预览 使用说明 从主页通用场景集里选择图片选择和下载保存进入首页。分两个场景点…

Linux的重要命令(二)+了解Linux目录结构

目录 一.Linux的目录结构 二.查看文件内容命令 1.cat 命令 2.more 命令 3.less 命令 4.head 命令 5.tail 命令 6.拓展 head 和 tail 的其他用法 ​编辑 三.统计文件内容的命令-wc ​编辑 四.检索和过滤文件内容的命令-grep ​编辑 ​编辑 五.压缩命令 gzip 和 bz…

Canvas 画布基本用法详解

Canvas 画布 HTML中的 <canvas> 标签用于动态绘制图形&#xff0c;所有在<canvas>中的画图必须用JavaScript完成。 <canvas>标签是透明的&#xff0c;它是图形的容器&#xff0c;必须使用脚本才能实际绘制图形。 绘制一个简单的矩形 <!-- canvas标签&a…

Python基于卷积神经网络的车牌识别系统

博主介绍&#xff1a;✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;…

【数据结构与算法】递推

来源&#xff1a;《信息学奥赛一本通》 所谓递推&#xff0c;是指从已知的初始条件出发&#xff0c;依据某种递推关系&#xff0c;逐次推出所要求的各中间结果及最后结果。其中初始条件或是问题本身已经给定&#xff0c;或是通过对问题的分析与化简后确定。 从已知条件出发逐…