导读: 欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。
标题: 大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA
摘要: 大语言模型通过新提出的通用框架,成功实现高精度时序预测,超越传统时序模型,无需额外训练。该框架通过时序输入重编程和提示做前缀两大关键技术,激活大语言模型处理时序数据的能力。这有益于多个领域的决策制定,有望彻底改变时序/时空数据挖掘方式。其中,文本原型用于重编程输入时序数据,使其与大语言模型的自然语言表征对齐。
网址: 大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA | 量子位
标题: 国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦
摘要: 国内首个音乐ChatGPT「天工SkyMusic」内测开启,其改编的周杰伦和凤凰传奇歌曲令人惊艳。团队成功押中Sora架构并公开技术图。同时,Suno V3也带来震撼,不断诞生「神曲」。音乐AI的崛起让业内讨论其可能对音乐产业的影响。初体验「天工SkyMusic」的人声以假乱真,令人梦回80年代,展现其在音乐生成领域的潜力。
网址: 国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦|音乐|情感|人声_新浪新闻
标题: 为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑
摘要: Andrej Karpathy发布了用1000行C语言/CUDA实现的GPT-2训练项目llm.c,无需依赖庞大的PyTorch或cPython。该项目简化了大模型训练,代码干净、可编译运行,与PyTorch实现相当。项目在GitHub上迅速走红,引发网友热议,有称赞也有质疑。Karpathy对质疑做出回应,详细解释了项目目的和解决的问题。
网址: 为什么要纯C语言手搓GPT-2,Karpathy回应网友质疑 | 机器之心
标题: 「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
摘要: 强化学习在电子游戏环境中表现优越,但在现实复杂应用中受限,如数据获取、样本利用率等问题。大语言模型通过海量数据训练展现了多任务学习、通用知识和推理能力,已被广泛应用到各领域。香港中文大学(深圳)团队调研发现,大语言模型可辅助强化学习提升在多任务学习、样本利用率等方面的表现,特别是在自然语言处理、自动驾驶等复杂应用场景中。相关综述已上传至arXiv网站。
网址: 「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线|深圳市_新浪新闻
标题: “梗王”大模型,靠讲笑话登上CVPR | 中山大学
摘要: 中山大学HCP实验室和合作单位打破大模型常规思维,探索多模态大模型的创造力,让大模型讲笑话并成功入选CVPR顶会。与主流大模型相比,该研究的大模型更具创造力和想象力,能够产生有趣、出人意料的梗和笑话。这项研究展示了探索大模型创造力的新方向,为人工智能领域注入更多乐趣和创意。
网址: "梗王"大模型,靠讲笑话登上CVPR | 中山大学 | 量子位
标题: 「代码大模型」成 AI 新风口,aiXcoder 想让所有企业抢先用上
摘要: 摘要: 北京大学软件工程研究所的aiXcoder团队开源了全新自研的7B代码大模型,旨在为企业软件工程带来新可能。与此同时,AI软件开发工具GitHub Copilot已成为AI在开发者应用上的里程碑产品。然而,要让AI真正帮助开发者解决问题,需从软件工程角度出发,解决真实场景中的问题。aiXcoder团队聚焦企业真实开发场景,致力于解决企业私有化部署场景下的软件开发问题。
网址: 「代码大模型」成 AI 新风口,aiXcoder 想让所有企业抢先用上 | 极客公园
标题: 面壁智能完成新一轮数亿元融资,继续面向AGI的高效大模型征程
摘要: 面壁智能近日完成新一轮数亿元融资,由多家知名投资机构领投和跟投,将加大人才引进和底层算力与数据基础的投入,持续推动高效大模型的发展和应用落地。该公司是高效大模型领域的领先团队之一,拥有优秀的研发团队和技术实力,已通过精准建模和实验打造出全球领先的高效训练模式,致力于以更低的成本和更快的速度提供最优的智能解决方案,并引领AI智能体的发展。
网址: 面壁智能完成新一轮数亿元融资,继续面向AGI的高效大模型征程 | 机器之心
标题: 长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale AI数据库正式开源
摘要: 大模型和AI数据库结合成为降本增效、实现大数据真正智能的关键。LLM风潮下,模型处理上下文长度的能力成为重要评估指标。尽管有观点认为长上下文模型可能使RAG方法不再必要,但许多研究者和架构师认为数据结构复杂、数据量大且多变,LLM难以单独处理。大模型与AI数据库结合可注入专业、精准、实时信息,降低幻觉,提高系统实用性。
网址: 长文本杀不死RAG:SQL+向量驱动大模型和大数据新范式,MyScale AI数据库正式开源 | 机器之心