绝密 Devin 架构
更具体地说,构建您自己的 AI 代理。
Devin 使用 GPT-4
,而人们已经开始用 Claude-3-Opus 构建替代方案
Devin 的 UI 体验更好。
例如,它甚至看不到浏览器,但它确实存在于用户面前
此外,你可以随时与它“交谈”,就像与人交谈一样,它会在后台不断执行和调试你的想法。(这是必要的,因为构建应用程序需要 15-20 分钟)
由于 Devin 使用的是 GPT-4,这很快就会变得昂贵,是的,它甚至可能比人类更昂贵。
当然,这背后付出了很多努力。
但是,Agent 仍处于起步阶段,还有很大的改进空间。
任何与魔法无异的技术都隐藏着一些东西。开放才是出路。
构建一个与环境工具集成的复杂代理:shell、代码编辑器和网络搜索可能并不像看起来那么困难。
我们已经在开源中见证了类似 Devin 系统的元素,在接下来的几个月里它们会变得更好。没有护城河。
即使是像 Claude Opus 这样的原始 LLM 也在编码能力测试 HumanEval 中取得了 84.9% 的成绩,而 GPT-4 也取