ChatGPT一周年,一图总结2023生成式AI里程碑大事件时间线

带你探索AI的无限可能!AI一日,人间一年,这句话绝非空谈!

AI技术在不断地发展,让我们一起期待它未来更多的可能性吧!

2022 年 11 月 30 日,OpenAI 宣布正式推出 ChatGPT。365 天过去,斗转星移,我们一起见证了生成式 AI 的寒武纪大爆发。

Generated by DALL·E3

这一年来,国内外的生成式 AI 、大模型和产品以令人眼花缭乱的速度更新迭代,新的创业浪潮风起云涌,大家登记 waitlist 的速度都快赶不上产品推陈出新的频率。国内更是开始了百模大战,不少国产大模型陆续宣布性能赶超 GPT3.5。大浪淘沙后,也有不少企业宣告解散,知名大模型项目「套壳」开源项目屡见不鲜。

回顾 ChatGPT 发布的这一年,都有哪些大事件,你会用哪些关键词总结?

00 整理了2023 年生成式 AI 领域的重大事件时间线,分为头条、产品(文本/图片/视频/代码/开源/其他)、模型、算力、政策五大部分,都集中在一张地图中,方便查阅。

生成式AI应用简史

注:因个人能力、精力有限,难免挂一漏万,本次绘制的地图只提供一个概览,是一个历史切片,各种疏漏敬请谅解。若需要高清版的历程图请私信博主!

01 生成式文本

Generated by Stable Diffusion

ChatGPT 自 2022 年 11 月 30 日上线以来,一直引领着生成式 AI 的发展。

2023 年 1 月底 2 月初,ChatGPT 成为互联网史上最快获得 1 亿用户的产品。

2 月,ChatGPT plus 版本上线。

3 月 15 日,GPT4 炸裂发布,正式宣告生成式 AI 大爆发的开始,无数人开始研究如何能注册和使用上这个用数十亿美元打造出来的大杀器。

4 月,ChatGPT 开放了插件,原本简单的基于历史数据的对话,一下有了全新的能力和可能性,开发者多少对如此简单的接入感到兴奋和害怕。

OpenAI 还在 5 月和 8 月分别推出了 ChatGPT 的 iOS 和 Android 应用,并在 11 月向所有用户开放移动应用的语音对话能力。

7 月,OpenAI 开放了 GPT4 API 、强大的代码解释器,并允许用户自定义指令

8 月,ChatGPT 企业版上线,3.5 turbo 模型支持微调

9 月,ChatGPT 集成新的语音和图像能力,联网浏览功能也恢复了,多模态能力进一步增强

10 月,继续是多模态能力,沉寂已久的 DALL·E 更新到第三代,GPT4V 接口也发布了

11 月,OpenAI 高层戏剧化政变,Sam Altman 几进几出,全球观众不眠不休追剧

除了 ChatGPT, 对话式 AI 产品也诞生了几个实力强大的竞争者。

关系微妙的好基友 Bing Chat 紧随 ChatGPT,在 2 月就占得先机,原本几乎没有什么市场份额的 Bing 搜索引擎重获新生。在「普惠」这件事情上,没有人比微软做得更快更好,不但云服务全线铺开,而且 Copilot 在 11 月已经深度集成到 Windows 生态中。

另一方面,挑战者 Anthropic 的 Claude 在 3 月紧随 GPT4 上线,并率先在 5 月份支持长达 100k 的上下文。7 月 Claude2 发布,到 11 月,Claude2.1 已经支持 200k 的上下文,并开放了数据调用能力。

Google 在生成式 AI 的浪潮中,多少给人一种「起了个大早,赶了个晚集」的感觉。最早提出 transformer 架构,在大模型技术储备上让人望其项背,但因为搜索引擎牵一发动全身,Google 在 3 月仓促推出 Bard,一时差评如潮。

随着 PaLM 和新版搜索引擎的改进,以及 Duet AI 、新一代 Gemini 模型的推出,Google 在几个月内完成了生成式 AI 生态的完整布局,不得不让人感叹家底雄厚。

在其他应用领域,产品和创新就更加不胜枚举了。现在回头看 Poe 套壳应用的巨大成功,不知道 OpenAI 董事会的 Quora(孵化了Poe) 创始人 Adam D’Angelo 到底扮演了什么角色,这让故事蒙上了阴谋论的迷雾。Notion AI 也是最早集成 AI 能力的产品之一,在场景化的应用中树立了标杆。

最后(也是最重要的)一件事,是 4 月 LLaMA 的史诗级泄露,大模型进化树全新开源分支一骑绝尘。GPT 和 LLaMA 这一对 iOS 和 Android,联手开启了生成式 AI 的寒武纪大爆发的开关。

02 生成式图像

Generated by Stable Diffusion

文生图领域同样迎来了突飞猛进的一年。生成式图像的生态可以划分为三大阵营:

开源工具

以 Stable Diffusion 为代表,这一类好比安卓系统,生态丰富而且活跃,既有完全开源的Stable Diffusion,也包括很多基于 SD 做了二次封装的文生图工具比如 Dreamstudio、leonardo.ai、dreamlike.art、playground ai 等等。

Stable Diffusion 2.0 并不成功,4 月 SDXL beta 版本发布,让大家重新对文生图能力充满了期待,7 月 SDXL 正式上线,目前还处在降低算力要求的推广融合阶段。随着 civitai(C站)和 WebUI 、ComfyUI 的普及,还有 Meta 在基础模型和算法方面的持续贡献,开源工具会继续推动生成式图像生态的繁荣和创新。

闭源工具

以 Midjourney 为代表,可以类比苹果手机,生态封闭但用户体验较好,还包括 DALL·E3、Bing Image Creator、文心一格等。

Midjourney 在 2023 年成为“小团队-大产品”的代言人。3 月 V5 版本上线, 5 月 5.1 版本,6 月 5.2 版本,每一个版本都让人惊叹 Midjourney 的画质如此出色,甚至怀疑跟 Stable Diffusion 还是不是同源技术。

设计工具2.0

以 Adobe Firefly 为代表,是在原有的设计工具中集成 AI 辅助的功能,还包括 Canva AI、Microsoft Designer、Framer AI 等等。

Firefly 可以说是成也专业,败也专业。直接集成在 Adobe Creative 尤其是 Photoshop 中,能完败绝大多数的文生图应用,但是也会相对局限在专业设计师和创意人群中。

11 月,图像 AI 生成领域迎来了实时绘制的浪潮,KREA 和 Clipdrop 相继上线实时绘制功能,相信这对设计工具 2.0 会是一次重大突破,专业画手被冲击的部分又有了新的价值展现!

03 生成式视频

2023 年是 Generative video 的元年。在大家还在摸索文生图的时候,文本生成视频的快速进化让人眼花缭乱。

进入下半年,由 Runway ML 引领的生成式视频领域车速猛增,先是 Gen-2 上线,生成式视频开启卷王模式,Pika,LumaAI,Morph Studio,Moonvalley,PlaiDay,Mootion 等一众文生视频应用百花齐放。

Generated by Stable Video Diffusion

11 月,竞争进入白热化阶段,Gen-2 受 Pika 等刺激完成了大更新,视频质量有了跃迁。Pika 1.0 在可控性方面又有了极大提升。

文生视频也迎来更大的开源玩家:Meta 发布 Emu,Stability AI 发布 Stable video diffusion,学术界同时在争相发布降低生成成本的研究。明年,生成式视频一定会迎来大爆发,图像创意工作者的创作流程将会被改变。

04 生成式代码

生成式代码是高端玩家的竞技场。主要也有三股力量:

代码平台:以 Github Copilot 为代表,还包括模型社区 Hugging Face 发布的 StarCoder。因为坐拥海量的源代码和模型,解放生产力是优先的场景。

大模型和开源生态:很多综合大模型都会有专门的代码生成模块,这也许会成为评估模型能力的重要指标。Meta 2023 年一头扎进开源搞建设,大有成为 AI 安卓之势(不是)。

商业养蛊:Salefore 和幻方发布了自己的代码生成模型,CodeGen2 在 5 月发布,DeepSeek 11 月上线。有钱人往往也有远见,先用资源垒出壁垒,让别人在日后难以竞争,是为商业养蛊~

对了,请不要忽略 5 月份新的 AI/ML 编程语言 Mojo 的发布,期待明年会有更精彩的生态演绎。

05 开源应用

2023 年什么最火?ChatGPT。

2023 年哪里最热闹?GitHub 😄 (抱抱脸和 X.com 稍微不服气)

2 月,文生图领域拯救 Stable Diffusion 的 ControlNet 在 上线,作者还开发了 Fooocus(取代难用的 A1111 WebUI,不是)

3 月,2022 年已经发布的的 Langchain 一下踩中了风口,成为生成式 AI 第一开源股(不是)。半年后逐渐取代 SD WebUI 的 ComfyUI 悄悄 init 了

4 月,AutoGPT 大红大紫,带动了 Agent 概念极速发展

6 月,DragGan 引发了可控文生图的热潮

7 月,AnimateDiff 开始推动文生视频的发展

11 月,LCM 带来低显存福音,1 秒出图不是梦,3060 生成视频不是梦

Generated by Stable Diffusion

Github 的热闹,还是得每天刷新热门项目的 star 数才能感受到,请大家移步本地图的 Github 地址,star 一下支持原创。

英文版地图:https://github.com/kidult00/genai-2023-map

中文版地图:https://github.com/kidult00/genai-2023-map/blob/main/zh_version.md

06 模型

大模型这一块,相信各种商业分析、创业社区、大中小厂官网,已经日常轰炸大家许久。这里就不念 PPT 了,大家可以在月历中查阅。

Generated by Stable Diffusion

07 算力

算力领域的故事比较单薄,英伟达强者恒强,宣扬 AI 的「iPhone 时刻」到来并表示 all in 生成式 AI。11 月,英伟达发布 H200 芯片,地球最强没跑了,尤其在训练场景,试图进一步拉大产品性能及产业链上下游的优势。

位于第二梯队的 Google 研发出为机器学习定制的专用芯片 TPU,5 月已经发布第五代。追赶者 AMD 也在 6 月推出了 MI300X AI 芯片,反响一般。深感算力不够用的大厂纷纷开始准备自研芯片,包括微软、 Meta、亚马逊、华为等。

Generated by Stable Diffusion

08 政策

关于监管,关于数据安全,关于版权,关于隐私,关于 AGI,可以说 gov 都是慢半拍。7 月份公布的《生成式人工智能服务管理暂行办法》备受关注。欧盟受在大模型竞争中全面落后,不过发布了全球第一部人工智能法案。

2023 年绝对是历史性的一年,人类走出 COVID-19 的阴霾,迎来了生产力的革新。

对从业者来说,这是一惊一乍的一年。对创业者来说,这是不眠不休的一年。对创作者来说,这是眼界大开的一年。对普通人来说,这是历史车轮加速向前的一年。

想一想又有点不对,AI 一天,人间已一年。

 Generated by Stable Diffusion

        近年来,AI技术突飞猛进,在各个领域都展现出了惊人的实力。AI一日,人间一年,这句话用来形容AI技术的飞速发展,再恰当不过。在医疗领域,AI技术能够帮助医生更精确地诊断病情,提高疾病的治愈率。在交通领域,AI技术能够让自动驾驶汽车成为现实,减少交通事故的发生。在金融领域,AI技术能够实现智能风控,提高金融安全性。在教育领域,AI技术能够实现个性化教育,让每个学生都能够得到更好的教育资源。在科技领域,AI技术更是能够帮助我们解决许多难题,推动人类社会的进步。虽然AI技术在某些方面还存在着不足之处,但是随着技术的不断进步,相信未来会越来越好。

最后,祝愿大家在 2024 年少一点疲于奔命,多一些笃定,多一分创作。AI技术在不断地发展,让我们一起期待它未来更多的可能性吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/245614.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

羊大师解读提高免疫力,能从羊奶开始吗?

羊大师解读提高免疫力,能从羊奶开始吗? 在当今充满挑战的世界中,拥有强大的免疫力是保持健康的关键。免疫系统是我们身体的守护者,能够抵御病菌和疾病,使我们远离健康问题。而如何提高免疫力一直是人们关注的焦点。近…

‘BLEUUID‘ does not name a type错误怎么解决?

摘要:arduino环境下对esp32蓝牙编程时会遇到BLEUUID does not name a type错误,本文介绍解决方法。 硬件设备是安信可ESP32-S模组。 错误发生在代码最开始的地方,include了一个蓝牙设备头文件,然后定义了UUID,注意看&a…

Java序列化、反序列化-为什么要使用序列化?Serializable接口的作用?

什么是序列化和反序列化? 把对象转换成字节序列把字节序列恢复成对象 结合OSI七层协议模型,序列化和反序列化是在那一层做的? 在OSI七层模型中,序列化工作的层级是表示层。这一层的主要功能包括把应用层的对象转换成一段连续的二进…

Vue3-18-侦听器watch()、watchEffect() 的基本使用

什么是侦听器 个人理解:当有一个响应式状态(普通变量 or 一个响应式对象)发生改变时,我们希望监听到这个改变,并且能够进行一些逻辑处理。那么侦听器就是来帮助我们实现这个功能的。侦听器 其实就是两个函数&#xff…

JAVA 版多商家入驻 直播带货 商城系统 B2B2C 之 鸿鹄云商B2B2C产品概述

随着互联网的快速发展,越来越多的企业开始注重数字化转型,以提升自身的竞争力和运营效率。在这个背景下,鸿鹄云商SAAS云产品应运而生,为企业提供了一种简单、高效、安全的数字化解决方案。 鸿鹄云商SAAS云产品是一种基于云计算的软…

Seata配置

参考教程 seata 分布式事务的环境搭建与使用 Seata 1.4.0 nacos配置和使用,超详细 Seata 1.4.2 的安装 Nacos的配置和使用 官网下载地址 本文以v1.4.1为例 1.数据库及表的创建 创建seata数据库,创建以下表(右键连接-》新建数据库seata-》…

一文读懂FastAPI:Python 开发者的福音

FastAPI是一个基于Python的现代化Web框架,它提供了快速、简单和高性能的方式来构建API。 它结合了Python的静态类型检查和自动化文档生成的功能,使得开发API变得更加容易和高效。 下面将介绍如何使用FastAPI快速开发接口,并且利用自动生成的…

leetcode做题笔记2132. 用邮票贴满网格图

给你一个 m x n 的二进制矩阵 grid ,每个格子要么为 0 (空)要么为 1 (被占据)。 给你邮票的尺寸为 stampHeight x stampWidth 。我们想将邮票贴进二进制矩阵中,且满足以下 限制 和 要求 : 覆盖…

OpenKylin安装idea

Web和客户端都支持Linux了,一方面为了Linux上调试程序方便,另一方面为了把开发环境彻底支持Linux,在Linux上安装idea运行代码,之前剔除Maven那些的优点就来了,在OpenKylin上我只要安装idea和jdk就能正常运行代码了。最…

【c】数组元素移动

本题的难点之处就是不让你创建新的数组&#xff0c;而且移动的距离也没有给限制&#xff0c;比如有7个数&#xff0c;本题没有限制必须移动距离小于7&#xff0c;也可能移动的距离大于7&#xff0c;甚至更多&#xff0c;下面附上我的代码 #include<stdio.h>int main() {…

2.两数相加

借文引流&#xff1a;五点钟科技_大道至简系列,机器学习算法系列,学习经验分享-CSDN博客 欢迎大家阅览我的其它专栏。 题目&#xff1a; 给你两个 非空 的链表&#xff0c;表示两个非负的整数。它们每位数字都是按照 逆序 的方式存储的&#xff0c;并且每个节点只能存储 一位 数…

21. python __init__.py 文件的行为

重复打印行为分析 说明结论主模块主模块所在位置不会被python认为是包 说明 我在调试代码的时候&#xff0c;发现上面的print打印了两次&#xff0c;如果将图片中的 from aaa.F import Cat 改成 from F import Cat 则print只会打印一次。这是为什么呢&#xff1f; 结论 from …

每日一题:实现方法fn,遇到退格字符就删除前面的字符,遇到俩个退格就删除俩个字符

每日一题 请按以下要求实现方法fn,遇到退格字符就删除前面的字符&#xff0c;遇到俩个退格就删除俩个字符&#xff1a; // 比较含有退格的字符串&#xff0c;"<-"代表退格键&#xff0c;"<"和"-"均为正常字符 // 输入&#xff1a;"…

OSWBB 部署实现

1、OSWatcher (oswbb) 是一个可供用户下载的工具&#xff0c;可以用来抓取操作系统的性能指标。 是一组shell程序&#xff0c;程序中调用: top, vmstat, iostat, mpstat, netstat,and traceroute等os的监控工具 。OSWatcher 的使用是基于 standard licensing terms 并且不需要…

『OPEN3D』1.8.3 多份点云配准

多份点云配准是将多份点云数据在全局空间中对齐的过程。通常,输入是一组数据(例如点云或RGBD图像){Pi}。输出是一组刚性变换{Ti},使得经过变换的点云在全局空间中对齐。 NNNNNathan 本专栏地址: https://blog.csdn.net/qq_41366026/category_12186023.html 此处是…

最新CRMEB商城源码开源版v5.2.2版本+前端uniapp

CRMEB开源商城系统是一款全开源可商用的系统&#xff0c;前后端分离开发&#xff0c;全部100%开源&#xff0c;在小程序、公众号、H5、APP、PC端都能用&#xff0c;使用方便&#xff0c;二开方便&#xff01;安装使用也很简单&#xff01;使用文档、接口文档、数据字典、二开文…

5G边缘网关如何助力打造隧道巡检机器人

我国已建成全世界里程最长的公路网、铁路网&#xff0c;是国民经济发展与国家现代化的重要支撑。我国幅员辽阔&#xff0c;地理环境复杂&#xff0c;公路/铁路的延伸也伴随着许多隧道的建设&#xff0c;由于隧道所穿越山体的地质条件复杂&#xff0c;对于隧道的监测、管理与养护…

C++共享和保护——(3)静态成员

归纳编程学习的感悟&#xff0c; 记录奋斗路上的点滴&#xff0c; 希望能帮到一样刻苦的你&#xff01; 如有不足欢迎指正&#xff01; 共同学习交流&#xff01; &#x1f30e;欢迎各位→点赞 &#x1f44d; 收藏⭐ 留言​&#x1f4dd; 信念&#xff0c;你拿它没办法&#x…

zabbix简单介绍2

学习目标: 能够实现一个web页面的监测能够实现自动发现远程linux主机能够通过动作在发现主机后自动添加主机并链接模板能够创建一个模版并添加相应的元素(监控项,图形,触发器等)能够将主机或模板的配置实现导出和导入能够实现至少一种报警方式(邮件,微信等)能够通过zabbix_pro…

【数据结构入门精讲 | 第一篇】打开数据结构之门

数据结构与算法是计算机科学中的核心概念&#xff0c;也与现实生活如算法岗息息相关。鉴于全网数据结构文章良莠不齐且集成度不高&#xff0c;故开设本专栏&#xff0c;为初学者提供指引。 目录 基本概念数据结构为何面世算法基本数据类型抽象数据类型使用抽象数据类型的好处 数…