AI大模型日报#0429：人大多模态Awaker1.0、清华「AI+材料」落地、微软小模型Orca-Math、GenAI黄金法则

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了今日要点以及每条资讯的摘要。

AI大模型日报今日要点：中山大学与重庆大学合作开发的基于Transformer的单细胞注释方法SANGO在跨样本、平台和组织的scATAC-seq数据集上表现出色，准确率高达96.4%，为基因调控和表观遗传异质性研究提供了新工具。同时，微软推出的仅70亿参数量的小型语言模型Orca-Math在数学应用题求解测试中达到86.81%的准确率，展现了小型模型在复杂任务中的潜力。此外，清华大学王笑楠团队在AI+材料领域取得一系列突破，包括利用AI技术加速材料开发、催化剂设计以及新能源、低碳技术研究。另一方面，OpenAI的视频生成工具Sora被指生成的视频并非完全由AI完成，引发了关于AI技术与人类创造力价值的讨论。同时，业界首个实现自主更新的多模态大模型Awaker 1.0发布，向通用人工智能迈出了重要一步。最后，阿尔伯塔大学提出的新一代Text2Motion框架MoMask正革新3D数字人动画的骨骼动作生成，而Microsoft Research的LongRoPE模型则首次将预训练大型语言模型的上下文窗口扩展到了2048k个token。

标题: 平均准确率达96.4%，中山大学&重庆大学开发基于Transformer的单细胞注释方法

摘要: 科技新闻速递：中山大学与重庆大学研究人员针对单细胞ATAC-seq（scATAC-seq）数据的高维度和稀疏性挑战，提出了SANGO方法，通过整合开放染色质峰周围的基因组序列，实现了更准确的单细胞注释。SANGO在跨样本、平台和组织的55个配对scATAC-seq数据集上表现出色，准确率优于现有方法。此外，SANGO还能通过图Transformer学习到的注意力边缘权重识别未知的肿瘤细胞。该研究为解析基因调控和表观遗传异质性提供了新工具，并展示了SANGO在多种实验场景中的卓越性能。未来，SANGO有望成为揭示肿瘤微环境细胞异质性和探索治疗靶点的重要方法。详情见《Nature Computational Science》杂志。
网址: 平均准确率达96.4%，中山大学&重庆大学开发基于Transformer的单细胞注释方法 | 机器之心

标题: Sora大片真相：人工特效参与，被指误导大众

摘要: 科技新闻摘要：近日，OpenAI的视频生成工具Sora因一段名为《气球人》的短片而受到关注，但有艺术家团队揭秘称该视频并非完全由AI生成。团队表示，Sora在生成视频素材时存在一致性问题，需要人类后期进行大量处理，包括调色、裁剪、超分等。此外，Sora对摄影术语理解有限，无法直接生成符合预期效果的镜头。团队估计只有约300分之一的Sora生成素材最终被用在了影片中。尽管如此，团队仍认为Sora是对现有工作流的有益补充。然而，有网友对此表示不满，认为OpenAI的营销方式掩盖了人类在后期的真实贡献。此事件引发了关于AI技术与人类创造力价值的讨论。
网址: Sora大片真相：人工特效参与，被指误导大众 | 量子位

标题: 「专业智能体指导」让小模型学会数学推理！微调Mistral-7B实现86.81%准确率

摘要: 科技记者报道，微软研究人员推出了小型语言模型Orca-Math，仅70亿参数量，在GSM 8k数学应用题求解测试中达到86.81%的准确率，超越了更大模型。Orca-Math通过创新方法训练，包括使用智能体创建高质量合成数据集和迭代学习技术。研究确保实验公正性，进行了严格的沾染检查。该模型在数据效率和性能上取得显著成果，为小型语言模型在复杂任务中的应用开辟了新途径。
网址: 「专业智能体指导」让小模型学会数学推理！微调Mistral-7B实现86.81%准确率|迭代|数据集|模型_新浪新闻

标题: 深度｜增速远超 SaaS，AI 应用层拐点来临？硅谷老牌 VC 总结了 10 个 GenAI 初创商业案例与 7 条黄金法则
摘要: 科技新趋势：GenAI 应用崭露头角 2024 年，“有新Newin”推出专栏 Newin24，聚焦新兴 AI 企业。与 OpenAI 等 LLM 厂商不同，Glean、EvenUp 和 Typeface 等 GenAI 初创公司引领新潮流。这些公司利用 GenAI 技术闯入传统巨头市场，将服务转化为软件，重塑核心工作流程。其增长速度超过以往 SaaS 行业记录，展现了惊人的外部潜力。图表揭示了 10 家 GenAI 早期赢家的迅猛增长，标志着 AI 领域的新篇章。
网址: 深度｜增速远超 SaaS，AI 应用层拐点来临？硅谷老牌 VC 总结了 10 个 GenAI 初创商业案例与 7 条黄金法则|genai|saas|商业案例|度量|硅谷_手机网易网

标题: 从材料设计合成，到催化剂创新、碳中和，清华王笑楠团队探索「AI+材料」前沿与落地

摘要: 科技记者提炼：清华大学王笑楠团队致力于AI在新材料研究中的应用，通过AI技术加速材料开发、催化剂设计以及新能源、低碳技术等交叉学科研究。团队在AI+能源化工环境新材料领域取得一系列重要突破，包括利用提示工程优化大语言模型在科学领域的应用，开发智能原子机器人探针技术在原子精度上高效制造量子材料，以及结合主动学习与第一性原理计算进行催化剂筛选设计。此外，团队还关注AI+碳中和领域，利用生物质废弃物衍生的生物炭进行二氧化碳捕获，通过定制化主动学习策略加速高性能生物炭的开发并提高其吸附二氧化碳的能力。这些研究成果为科学探索开辟了新途径，为实际应用提供了有力支撑，尤其在促进可持续发展和应对全球性问题方面显示出巨大潜力。
网址: 从材料设计合成，到催化剂创新、碳中和，清华王笑楠团队探索「AI+材料」前沿与落地 | 机器之心

标题: 人大系多模态模型迈向AGI：首次实现自主更新，写真视频生成力压Sora

摘要: 智子引擎在中关村论坛发布了全新的多模态大模型Awaker 1.0，这是业界首个实现自主更新的多模态大模型，向通用人工智能迈出了重要一步。Awaker 1.0采用MOE架构，具有视觉理解和生成能力，打破了大模型落地难的困境。其自主更新机制包含数据主动生成、模型反思评估、模型连续更新三大关键技术，使其能够适应不断变化的应用环境并持续学习新知识。同时，智子引擎还自主研发了视频生成底座VDT，用作现实世界的模拟器，为Awaker提供训练数据。Awaker 1.0在多个任务上超越了国内外最先进的模型，验证了其有效性。这一成果有望加速多模态大模型行业的发展，最终实现通用人工智能。
网址: 人大系多模态模型迈向AGI：首次实现自主更新，写真视频生成力压Sora | 机器之心

标题: CVPR 2024 | 文本一键转3D数字人骨骼动画，阿尔伯塔大学提出MoMask框架

摘要: 科技记者报道，机器之心AIxiv专栏持续推动学术交流，已报道2000多篇全球顶级实验室的学术技术内容。现在，阿尔伯塔大学研究团队提出的新一代Text2Motion框架MoMask，正革新3D数字人动画的骨骼动作生成。该框架利用生成式掩码技术和多层离散化动作表示，生成更高质量的3D人体动作，精细控制动作内容。研究成果已被CVPR 2024收录，代码和模型在GitHub上开源并获得高度关注。MoMask通过三个神经网络模块实现动作序列的离散化、生成式掩码建模和残差层标记预测，生成过程仅需固定步数。实验结果显示，MoMask在动作生成质量和文本控制方面优于现有方法，FID达到0.045。此外，MoMask还可应用于动作时序补齐，根据文本对动作序列进行编辑或修改，展示了其在游戏开发、影视制作和虚拟现实等领域的潜力。
网址: CVPR 2024 | 文本一键转3D数字人骨骼动画，阿尔伯塔大学提出MoMask框架 | 机器之心

标题: LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

摘要: 科技记者报道，Microsoft Research的研究人员提出了名为LongRoPE的新模型，该模型首次将预训练大型语言模型（LLM）的上下文窗口扩展到了2048k个token。这一创新解决了微调成本高、长文本稀缺及新token位置引入的问题。LongRoPE包含三个关键创新点：通过高效搜索优化位置插值，引入渐进扩展策略，以及在短上下文窗口中重新调整以恢复性能。实验证明，该方法在LLaMA2和Mistral模型上的各种任务中均表现出有效性，同时保留了原始架构并可重复使用现有优化。此外，研究发现位置插值中存在不均匀性，LongRoPE通过充分利用这些特性实现了更好的性能。
网址: LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍|扩展|上下文|插值_新浪新闻