原文来自DataLearnerAI官方网站:
2023年度巨献,一图总结2023年最重要的AI相关的产品和技术~共48个产品或技术上榜 | 数据学习者官方网站(Datalearner)https://www.datalearner.com/blog/1051703825548892
2022年11月底,ChatGPT横空出世,全球都被这样一个“好像”有智能的产品吸引力。随后,工业界、科研机构开始疯狂投入大模型。在2023年,这个被称为大模型元年的年份,有很多令人瞩目的AI产品与模型发布。
2023年,DataLearner收集了大量的大模型,并发布了很多大模型相关的技术博客,在即将结束的2023年,我们以这个『2023年最令人瞩目的AI产品』结束本年的技术分享。
访问2023AI总结网页版:2023年最引人瞩目的AI大模型产品和技术 | 数据学习(DataLearner)
网页版中不仅呈现了总结,还可以点进每一个产品名称或者技术查看详情哦~
- 2月:MetaAI强势开局,LLaMA开辟开源大模型生态。
- 3月:GPT-4发布!业界奋起直追,各类模型开始登场!
- 4月:SD XL 1.0推动开源文本生成图像走向繁荣。
- 5月:无聊的夏日开局,谷歌发布『不太行』PaLM2,试图追赶OpenAI。
- 6月:Runway Gen2掀起视频生成浪潮,普通人也可以创造电影视频!
- 7月:夏日末尾的小惊喜,MetaAI开源第二代Llama2,GPT-4最强大对手Claude2来袭!
- 8月:陷入冰点的8月,MetaAI继续发力!开源编程大模型Code Llama发布。
- 9月:秋季躁动!OpenAI大动作推进GPT迈向多模态,HeyGen真人视频生成掀开热潮。
- 10月:开学季,苹果入局,低调发布开源大模型Ferret。
- 11月:年度宫斗大戏中,GPTs发布,马斯克带Grok入局。
- 12月:大模型元年末尾精彩异常,MoE大模型令人兴奋,Midjourney V6狂飙!
- 结束语
2月:MetaAI强势开局,LLaMA开辟开源大模型生态。
LLaMA作为MetaAI开源的大语言模型,开启了大模型开源生态的繁荣发展之路,此后的诸多所谓的『开源大模型』均来自LLaMA。而同月上海复旦大学发布的MOSS也是国内最早的开源大模型之一,引起了非常大的关注。 2月份另一个重要的AI相关的技术是ControlNet,斯坦福大学提出的ControlNet可以精确地控制扩散模型的生成,可以大幅提高扩散模型的质量。
3月:GPT-4发布!业界奋起直追,各类模型开始登场!
3月份,GPT-4发布,直接将大模型的能力推上新的台阶。Google Bard与百度文心一言推出,尽管效果不太满意,但也也算先行者了。 而斯坦福开源的Alpaca方法则微调大模型的成本降到600美元,低成本的微调方法让开源生态再次大步向前。 同月,AI Agent也有2个产品开源,即AutoGPT和BabyAGI。后期的OpenAI产品多少与这些开源项目有一些联系。 除了语言模型外,Midjouney V5的发布也引起了广泛的关注,5月份爆火网络的中国90年代夫妻的图片就是来自该产品。
4月:SD XL 1.0推动开源文本生成图像走向繁荣。
4月份的大模型领域略显萧条,但是Stable Diffusion XL的开源,将开源版本的DALL·E水平推向新的台阶,除了SD 1.5外,它可能是最被关注的。 本月UC伯克利联合几个科研机构开源的Vicuna模型,将开源模型的水平再提升一个水平。而一起推出的还有大模型匿名竞技场,即让一个问题给出2个没有名字的模型回复,谁好谁好,用户决定。 另外,MLC的推出,让手机端运行大模型称为可能。同月,Pika Beta版本推出,MetaAI开源了分割一切的大模型SAM。
5月:无聊的夏日开局,谷歌发布『不太行』PaLM2,试图追赶OpenAI。
5月份大模型技术继续安静,只有Google很勤奋,推出了PaLM2,但是效果『不够』。而同月份发布的QLoRA则支持在48G显存的显卡上微调650亿参数的LLaMA模型,大大降低了微调的成本。
6月:Runway Gen2掀起视频生成浪潮,普通人也可以创造电影视频!
6月份大模型技术发展依然有些乏力,但Runway Gen2的发布让大模型的玩法更精进。而WizardLM的发布开启了开源大模型的刷榜之路。微软发布的Phi-1模型,致力于小规模参数模型的逆袭之路。
7月:夏日末尾的小惊喜,MetaAI开源第二代Llama2,GPT-4最强大对手Claude2来袭!
7月,Claude2发布,PDF阅读理解第一名。Llama2发布,开源模型再上新台阶。而MetaGPT与AnimateDiff的发布,让AI Agent与视频生成的开原生态更加繁荣。
8月:陷入冰点的8月,MetaAI继续发力!开源编程大模型Code Llama发布。
陷入冰点的8月,MetaAI继续发力!开源编程大模型Code Llama发布。
9月:秋季躁动!OpenAI大动作推进GPT迈向多模态,HeyGen真人视频生成掀开热潮。
9月份,OpenAI发力, GPT多模态版本发布,实时联网功能发布。HeyGen的真人视频生成demo席卷全球,惊叹大模型可以『假』到这个程度。 而Mistral 7B的发布,让欧洲之光的MistralAI进入大众视野。此外,StabilityAI继续在多模态大模型发力,开源Stable Audio。
10月:开学季,苹果入局,低调发布开源大模型Ferret。
很多人吐槽苹果的动作太慢,但是十月末,苹果就已经低调发力,开源多模态大模型Ferret,可以接受任意形态数据。 LCM的开源,让图像合成的步骤减少很多,大幅提升了图像生成速度。国产ChatGLM3的开源,让60亿参数版本的模型在GSM8K评测上非常亮眼。
11月:年度宫斗大戏中,GPTs发布,马斯克带Grok入局。
11月OpenAI的风波不影响AI产品的热闹。GPTs发布让人人开发自己的大模型成为可能。马斯克Grok入局,李开复的01万物开源Yi-34B,苹果也不甘示弱,继续开源更适合苹果硬件的大模型框架MLX。
12月:大模型元年末尾精彩异常,MoE大模型令人兴奋,Midjourney V6狂飙!
2023年收官,谷歌发布Gemini,多模态能力很强。欧洲之光开源混合专家大模型,性能堪比Gemini。而Midjouney V6的发布,让图像生成的质量再上新台阶。AI浪潮再上台阶!
结束语
2023即将结束,大模型的发展给整个技术行业带来了新的期待。需要注意的是所有入选均来自DataLearner主观评价,欢迎大家文明交流~
访问DataLearner大模型列表,了解更多2023年发布的AI模型:AI大模型列表 | 参数大小、开源情况、商用授权类型和发布机构筛选 | 数据学习 (DataLearner)
另外,还给大家贡献一张图总结: