在人工智能技术的浪潮中,大模型以其强大的数据处理和学习能力,成为推动科技进步的重要力量。然而,这种跨领域应用的过程并非一帆风顺,既面临挑战也蕴含机遇。本文从复旦大学的研究工作出发,详细分析大模型的机遇与挑战。
背景
GPT4技术报告指出,GPT4仍处于通用人工智能(AGI)的初级阶段。而GPT4.5或GPT5已展现出AGI的某些特征。GPT4的出现给研究和工业界带来了巨大冲击,其显著特点是拥有强大的底座知识能力,超越了传统知识图谱。
大模型的推理成本
大模型的推理成本限制了其应用。构建和使用大模型都需要大量资源,且在实际应用中大模型的推理速度相对较慢。随着大模型上下文长度的增加,处理整个文档库将需要巨大的计算资源,导致推理成本进一步上升。
大模型在复杂决策场景的缺陷
尽管大模型在聊天机器人等开放式闲聊场景中表现出色,但在工业、商业等严肃场景中,如替代程序员编写代码,大模型目前仍显不足。从开放式闲聊到复杂决策,大模型还有很长的路要走。
大模型的领域适配
当前,领域大模型如医疗大模型、金融大模型等备受关注。持续预训练