AI大模型日报#0429:人大多模态Awaker1.0、清华「AI+材料」落地、微软小模型Orca-Math、GenAI黄金法则

导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了今日要点以及每条资讯的摘要。

AI大模型日报今日要点: 中山大学与重庆大学合作开发的基于Transformer的单细胞注释方法SANGO在跨样本、平台和组织的scATAC-seq数据集上表现出色,准确率高达96.4%,为基因调控和表观遗传异质性研究提供了新工具。同时,微软推出的仅70亿参数量的小型语言模型Orca-Math在数学应用题求解测试中达到86.81%的准确率,展现了小型模型在复杂任务中的潜力。此外,清华大学王笑楠团队在AI+材料领域取得一系列突破,包括利用AI技术加速材料开发、催化剂设计以及新能源、低碳技术研究。另一方面,OpenAI的视频生成工具Sora被指生成的视频并非完全由AI完成,引发了关于AI技术与人类创造力价值的讨论。同时,业界首个实现自主更新的多模态大模型Awaker 1.0发布,向通用人工智能迈出了重要一步。最后,阿尔伯塔大学提出的新一代Text2Motion框架MoMask正革新3D数字人动画的骨骼动作生成,而Microsoft Research的LongRoPE模型则首次将预训练大型语言模型的上下文窗口扩展到了2048k个token。

标题: 平均准确率达96.4%,中山大学&重庆大学开发基于Transformer的单细胞注释方法
 


摘要: 科技新闻速递: 中山大学与重庆大学研究人员针对单细胞ATAC-seq(scATAC-seq)数据的高维度和稀疏性挑战,提出了SANGO方法,通过整合开放染色质峰周围的基因组序列,实现了更准确的单细胞注释。SANGO在跨样本、平台和组织的55个配对scATAC-seq数据集上表现出色,准确率优于现有方法。此外,SANGO还能通过图Transformer学习到的注意力边缘权重识别未知的肿瘤细胞。该研究为解析基因调控和表观遗传异质性提供了新工具,并展示了SANGO在多种实验场景中的卓越性能。未来,SANGO有望成为揭示肿瘤微环境细胞异质性和探索治疗靶点的重要方法。详情见《Nature Computational Science》杂志。
网址: 平均准确率达96.4%,中山大学&重庆大学开发基于Transformer的单细胞注释方法 | 机器之心
 
标题: Sora大片真相:人工特效参与,被指误导大众
 


摘要: 科技新闻摘要: 近日,OpenAI的视频生成工具Sora因一段名为《气球人》的短片而受到关注,但有艺术家团队揭秘称该视频并非完全由AI生成。团队表示,Sora在生成视频素材时存在一致性问题,需要人类后期进行大量处理,包括调色、裁剪、超分等。此外,Sora对摄影术语理解有限,无法直接生成符合预期效果的镜头。团队估计只有约300分之一的Sora生成素材最终被用在了影片中。尽管如此,团队仍认为Sora是对现有工作流的有益补充。然而,有网友对此表示不满,认为OpenAI的营销方式掩盖了人类在后期的真实贡献。此事件引发了关于AI技术与人类创造力价值的讨论。
网址: Sora大片真相:人工特效参与,被指误导大众 | 量子位
 
标题: 「专业智能体指导」让小模型学会数学推理!微调Mistral-7B实现86.81%准确率
 


摘要: 科技记者报道,微软研究人员推出了小型语言模型Orca-Math,仅70亿参数量,在GSM 8k数学应用题求解测试中达到86.81%的准确率,超越了更大模型。Orca-Math通过创新方法训练,包括使用智能体创建高质量合成数据集和迭代学习技术。研究确保实验公正性,进行了严格的沾染检查。该模型在数据效率和性能上取得显著成果,为小型语言模型在复杂任务中的应用开辟了新途径。
网址: 「专业智能体指导」让小模型学会数学推理!微调Mistral-7B实现86.81%准确率|迭代|数据集|模型_新浪新闻
 
标题: 深度|增速远超 SaaS,AI 应用层拐点来临?硅谷老牌 VC 总结了 10 个 GenAI 初创商业案例与 7 条黄金法则
摘要: 科技新趋势:GenAI 应用崭露头角 2024 年,“有新Newin”推出专栏 Newin24,聚焦新兴 AI 企业。与 OpenAI 等 LLM 厂商不同,Glean、EvenUp 和 Typeface 等 GenAI 初创公司引领新潮流。这些公司利用 GenAI 技术闯入传统巨头市场,将服务转化为软件,重塑核心工作流程。其增长速度超过以往 SaaS 行业记录,展现了惊人的外部潜力。图表揭示了 10 家 GenAI 早期赢家的迅猛增长,标志着 AI 领域的新篇章。
网址: 深度|增速远超 SaaS,AI 应用层拐点来临?硅谷老牌 VC 总结了 10 个 GenAI 初创商业案例与 7 条黄金法则|genai|saas|商业案例|度量|硅谷_手机网易网
 
标题: 从材料设计合成,到催化剂创新、碳中和,清华王笑楠团队探索「AI+材料」前沿与落地
 


摘要: 科技记者提炼: 清华大学王笑楠团队致力于AI在新材料研究中的应用,通过AI技术加速材料开发、催化剂设计以及新能源、低碳技术等交叉学科研究。团队在AI+能源化工环境新材料领域取得一系列重要突破,包括利用提示工程优化大语言模型在科学领域的应用,开发智能原子机器人探针技术在原子精度上高效制造量子材料,以及结合主动学习与第一性原理计算进行催化剂筛选设计。此外,团队还关注AI+碳中和领域,利用生物质废弃物衍生的生物炭进行二氧化碳捕获,通过定制化主动学习策略加速高性能生物炭的开发并提高其吸附二氧化碳的能力。这些研究成果为科学探索开辟了新途径,为实际应用提供了有力支撑,尤其在促进可持续发展和应对全球性问题方面显示出巨大潜力。
网址: 从材料设计合成,到催化剂创新、碳中和,清华王笑楠团队探索「AI+材料」前沿与落地 | 机器之心
 
标题: 人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora
 


摘要: 智子引擎在中关村论坛发布了全新的多模态大模型Awaker 1.0,这是业界首个实现自主更新的多模态大模型,向通用人工智能迈出了重要一步。Awaker 1.0采用MOE架构,具有视觉理解和生成能力,打破了大模型落地难的困境。其自主更新机制包含数据主动生成、模型反思评估、模型连续更新三大关键技术,使其能够适应不断变化的应用环境并持续学习新知识。同时,智子引擎还自主研发了视频生成底座VDT,用作现实世界的模拟器,为Awaker提供训练数据。Awaker 1.0在多个任务上超越了国内外最先进的模型,验证了其有效性。这一成果有望加速多模态大模型行业的发展,最终实现通用人工智能。
网址: 人大系多模态模型迈向AGI:首次实现自主更新,写真视频生成力压Sora | 机器之心
 
标题: CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架
 


摘要: 科技记者报道,机器之心AIxiv专栏持续推动学术交流,已报道2000多篇全球顶级实验室的学术技术内容。现在,阿尔伯塔大学研究团队提出的新一代Text2Motion框架MoMask,正革新3D数字人动画的骨骼动作生成。该框架利用生成式掩码技术和多层离散化动作表示,生成更高质量的3D人体动作,精细控制动作内容。研究成果已被CVPR 2024收录,代码和模型在GitHub上开源并获得高度关注。MoMask通过三个神经网络模块实现动作序列的离散化、生成式掩码建模和残差层标记预测,生成过程仅需固定步数。实验结果显示,MoMask在动作生成质量和文本控制方面优于现有方法,FID达到0.045。此外,MoMask还可应用于动作时序补齐,根据文本对动作序列进行编辑或修改,展示了其在游戏开发、影视制作和虚拟现实等领域的潜力。
网址: CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架 | 机器之心
 
标题: LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍
 


摘要: 科技记者报道,Microsoft Research的研究人员提出了名为LongRoPE的新模型,该模型首次将预训练大型语言模型(LLM)的上下文窗口扩展到了2048k个token。这一创新解决了微调成本高、长文本稀缺及新token位置引入的问题。LongRoPE包含三个关键创新点:通过高效搜索优化位置插值,引入渐进扩展策略,以及在短上下文窗口中重新调整以恢复性能。实验证明,该方法在LLaMA2和Mistral模型上的各种任务中均表现出有效性,同时保留了原始架构并可重复使用现有优化。此外,研究发现位置插值中存在不均匀性,LongRoPE通过充分利用这些特性实现了更好的性能。
网址: LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍|扩展|上下文|插值_新浪新闻
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/582940.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

平安城市 校园 景区 停车场网络语音对讲立柱SV-11TS

平安城市 校园 景区 停车场网络语音对讲立柱SV-11TS 长方形立柱式设计,外观简约,线条优美,工艺考究,坚固耐用可一键实现在紧急情况下求助报警、事件咨询,与SIP网络对讲主机进行全双工对讲。内置警示灯,呼叫…

接口自动化框架篇:使用python连接数据库 - PySQL介绍!

PySQL介绍:使用Python连接数据库的接口自动化框架 在接口自动化测试中,经常需要使用数据库来操作测试数据,验证接口返回的数据是否正确。Python是一种功能强大的编程语言,可以轻松地连接数据库,并进行各种数据库操作。…

保证接口幂等性(token机制)

现在继续讲一讲保证接口的幂等性——使用token机制,并编写代码实现! 1. 概念 Token机制是实现接口幂等性的一种常见策略,尤其是在处理如订单创建、支付确认等敏感操作时,确保即使用户因网络延迟、误操作等原因重复提交请求&#…

【TDengine】mac m1解决no taos in java.library.path

前言 使用macos搭建springbootmybatisplus,通过mqtt将数据更新到tdenigne 3.2.3,数据源使用远程服务器的tdengine。 问题 启动时报错: Caused by: java.lang.UnsatisfiedLinkError: no taos in java.library.path 以下是官方文档 打开本…

动手学深度学习——矩阵

1. 基本概念 1.1 标量 标量由只有一个元素的张量表示。 所以标量计算与程度开发中的普通变量计算没有差异。 import torchx torch.tensor(3.0) y torch.tensor(2.0)x y, x * y, x / y, x**y(tensor(5.), tensor(6.), tensor(1.5000), tensor(9.))1.2 向量 向量泛化自标量…

Hbase学习笔记

Hbase是什么 HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统。它利用Hadoop HDFS作为其文件存储系统,并提供实时的读写的数据库系统。HBase的设计思想来源于Google的BigTable论文,是Apache的Hadoop项目的子项目。它适合于存储大表数据,并可以达到实时级别。HB…

部署YUM仓库及NFS共享服务

YUN仓库服务 YUM概述 基于RPM包构建的软件更新机制 可以自动解决依赖关系 所有软件包由YUM集中的软件仓库提供 yum软件仓库的常用类型 本地源仓库:baserulfile:// 在线源仓库:baserulhttp:// 或 https:// ftp源仓库:baserulftp:// RPM…

【Java那些事】关于前端收到后端返回的时间格式“2024-04-28T14:48:41“非想要的格式

问题: 后端操作后返回时间格式是"2024-04-28T14:48:41" 而我们想要的是:"2024-04-28 14:48:41", 两个解决方法: 方法一:使用 JsonFormat注解 Data AllArgsConstructor NoArgsConstructor public class Use…

代码随想录算法训练营第五十一天| LeetCode309.最佳买卖股票时机含冷冻期、714.买卖股票的最佳时机含手续费

一、LeetCode309.最佳买卖股票时机含冷冻期 题目链接/文章讲解/视频讲解:https://programmercarl.com/0309.%E6%9C%80%E4%BD%B3%E4%B9%B0%E5%8D%96%E8%82%A1%E7%A5%A8%E6%97%B6%E6%9C%BA%E5%90%AB%E5%86%B7%E5%86%BB%E6%9C%9F.html 状态:已解决 1.思路 …

实验一: 设备密码配置与远程管理

1.实验环境 用路由器和交换机搭建实验环境 2.需求描述 实现管理员主机对交换机和路由器的远程管理 设备上配置的密码都要被加密 3.推荐步骤 对路由器配置的步骤如下: 实现路由器和PC的连通性配置VTY密码和特权模式密码在PC上Telnet 到路由器。 对交换机配置的…

03-JAVA设计模式-观察者模式

观察者模式 什么是观察者模式 Java中的观察者模式是一种常见的设计模式,它允许对象(观察者)订阅另一个对象(被观察者)的状态变化,并在状态变化时自动得到通知。 核心: 观察者模式主要用于1&a…

HTML学习笔记(二)

1.HTML图像 图像标签&#xff08;<img>)和源属性&#xff08;src&#xff09; HTML中&#xff0c;图像由<img>标签来定义&#xff0c;<img>是空标签&#xff0c;只包含属性&#xff0c;没有闭合标签。在页面上显示图像需要使用源属性&#xff08;src),src是指…

Docker基本操作 Linux里边操作

docker镜像操作命令: docker images:查看所有镜像; docker rmi:删除镜像 后边可以跟镜像的名字或者id指定要删除的镜像&#xff1b; docker pull:拉取镜像&#xff1b; docker push:推送镜像到服务&#xff1b; docker save :打包镜像 后边有用法; docker load:加载镜像&…

前端JS必用工具【js-tool-big-box】,字符串反转,驼峰转换以及版本号对比

这一小节&#xff0c;我们针对前端工具包&#xff08;npm&#xff09;js-tool-big-box的使用做一些讲解&#xff0c;主要是针对字符串反转&#xff0c;aa-bb-cc转驼峰&#xff0c;以及版本号对比的内容 目录 1 安装和引入 2 字符串反转 3 带有横岗的转驼峰 3.1 转小驼峰 3…

docker-compose编排集成工具,

一、引言 我们知道使用一个 Dockerfile 模板文件可以定义一个单独的应用容器&#xff0c;如果需要定义多个容器就需要服务编排。服务编排有很多种技术方案&#xff0c;今天给大家介绍 Docker 官方产品 Docker-Compose Dockerfile 可以定义一个单独的应用容器&#xff1…

linux,从零安装mysql 8.0.30 ,并且更新至mysql 8.0.36

前言&#xff1a; 系统使用的CentOS 7&#xff0c;系统默认最小安装。 一、基础配置 配置虚拟机IP&#xff0c;需要更改的内容&#xff0c;如下红框中 修改之后 至此&#xff0c;基础配置完成。注意&#xff1a;此处虚拟机网络适配器使用的是&#xff1a;桥接模式 二、软件…

【问题实操】银河麒麟高级服务器操作系统实例,CPU软锁报错触发宕机

1.服务器环境以及配置 处理器&#xff1a; Kunpeng 920 内存&#xff1a; 256G DDR4 整机类型/架构&#xff1a; TaiShan 200 (Model 2280) 内核版本 4.19.90-23.8.v2101.ky10.aarch64 2.问题现象描述 两台搭载麒麟v10 sp1的机器均在系统CPU软锁报错时&#xff0c;触…

Springboot+mybatis升级版(Postman测试)

一、项目结构 1.导入依赖 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apach…

高级数据结构与算法期中测试题

一、判断题 1、In dynamic programming algorithms, some results of subproblems have to be stored even they do not compose the optimal solution of a larger problem. T F 解析:T。在动态规划算法中,必须存储子问题的某些结果,因为他们可能需要用来…

区块链技术:NFG元宇宙电商模式

大家好&#xff0c;我是微三云周丽 随着互联网技术的迅猛发展&#xff0c;电子商务行业逐渐崛起为现代经济的重要支柱。而在这一浪潮中&#xff0c;元宇宙电商以其独特的商业模式和巨大的发展潜力&#xff0c;成为行业的新宠。其中&#xff0c;NFG作为元宇宙电商模式的代表&am…