Devin、OpenDevin

文章目录

    • 关于 Devin
      • Cognition 公司
      • Devin 的能力
    • 关于 OpenDevin
      • ⭐️ Research Strategy
      • 🛠 Technology Stack
    • 使用 OpenDevin
      • 安装
      • 选择一个 Model
      • 在命令行运行


关于 Devin

Cognition 发布了世界上第一个完全自主的人工智能软件工程师 Devin,在 SWE-bench 编码基准测试中树立了新的先进标准。只需一个提示,Devin 就能像人类软件工程师一样编写代码或创建网站。

  • github : https://github.com/OpenDevin/OpenDevin
  • Request Access to Devin
    https://forms.gle/PJPKaKYRZv9jfXP6A
  • OpenDevin :
    https://github.com/OpenDevin/OpenDevin

  • Cognition : Introducing Devin, the first AI software engineer
    https://www.cognition-labs.com/introducing-devin
  • Devin: Introducing the World’s First Ever AI Software Engineer
    https://opencv.org/blog/devin-ai-software-engineer/
  • Devin第一手使用体验:完成度很高,开始编码就停不下来,但要替代程序员还很远
    https://mp.weixin.qq.com/s/WA0-Bbzv24gdy1kq4f7UpA
  • “AI程序员”Devin大杀四方后,人类程序员开始了他们的反击…
    https://mp.weixin.qq.com/s/8G6jg8dUzTMFyb-_Er17XQ

在这里插入图片描述

Cognition 公司

Cognition 公司成立于 2023 年 11 月,是美国一家专注于推理的应用人工智能实验室。通过利用推理,他们打算开启人工智能的众多学科。
Cognition 目前由曾在谷歌 DeepMind、Cursor、Scale AI 和 Nuro 等科技巨头工作过的专业人士和领导组成。
他们已经获得了由彼得-蒂尔的创始人基金(Founders Fund)牵头的 2100 万美元。支持 Cognition 的还有 DoorDash 首席执行官托尼-徐(Tony Xu)和加密货币平台 Coinbase 创始人弗雷德-埃尔萨姆(Fred Ehrsam)等巨头。


Devin 的能力

凭借 Cognition 在长期推理和规划方面的进步,Devin 可以规划和执行需要做出数千个决策的复杂工程任务。Devin 可以在每一步都调用相关上下文,随着时间的推移不断学习,并修正错误。

Devin 配备了常用的开发者工具,包括沙盒计算环境中的 shell、代码编辑器和浏览器–人类完成工作所需的一切工具。

最后,Devin 有与用户积极协作的能力。Devin 会实时报告自己的工作进度,接受反馈,并根据需要与你一起完成设计选择。


在这里插入图片描述


关于 OpenDevin

OpenDevin 希望通过开源社区的力量复制、增强并创新 Devin。

  • github : https://github.com/OpenDevin/OpenDevin

  • 山行AI : Open Devin—一个少编码、多创造的开源AI软件工程师
    https://mp.weixin.qq.com/s/35aTGn1CkbzkWQYSEKY1yQ

⭐️ Research Strategy

利用 LLM 实现生产级应用的全面复制是一项复杂的工作。我们的策略包括

  1. 核心技术研究: 专注于基础研究,了解并改进代码生成和处理的技术方面。
  2. 专家能力: 通过数据整理、培训方法等提高核心组件的效率。
  3. 任务规划: 开发错误检测、代码库管理和优化功能。
  4. 评估: 建立全面的评估指标,以便更好地了解和改进我们的模型。

🛠 Technology Stack

  • 沙箱环境: 使用 Docker 和 Kubernetes 等技术确保代码的安全执行。
  • 前端界面: 开发用户友好的界面,用于监控进度和与 Devin 交互,可能会利用 React 等框架或创建 VSCode 插件,以获得更加集成的体验。

下一步

MVP demo 对我们来说迫在眉睫。以下是要做的最重要的事情:

  • 用户界面:聊天界面、演示命令的 shell、浏览器等。
  • 架构:具有稳定后台的代理框架,可读写和运行简单命令
  • 代理:能够生成 bash 脚本、运行测试等。
  • 评估:与 Devin 的评估一致的最小评估管道。

完成 MVP 的构建后,我们将转向不同主题的研究,包括基础模型、专家能力、评估、代理研究等。


使用 OpenDevin

安装

OpenDevin 仍在开发中。不过,你可以运行 alpha 版本,查看端到端的运行情况。


Requirements

  • Docker
  • Python >= 3.10
  • NodeJS >= 14.8

首先,确定 Docker 在运行

docker ps # this should exit successfully

拉取镜像 here

docker pull ghcr.io/opendevin/sandbox:v0.1

然后启动后台:

export OPENAI_API_KEY="..."
export WORKSPACE_DIR="/path/to/your/project"
python -m pip install -r requirements.txt
uvicorn opendevin.server.listen:app --port 3000

然后在另一个终端输入:

cd frontend
npm install
npm run start -- --port 3001

你可以在 localhost:3001 看到 OpenDevin 运行


选择一个 Model

我们使用 LiteLLM, 然后你可以使用任意基础模型 运行 OpenDevin,比如 OpenAI, Claude, 和 Gemini。

LiteLLM 有以下 Providers : https://docs.litellm.ai/docs/providers

你可以设置 LLM_MODELLLM_API_KEY 来修改模型。


比如运行 Claude:

export LLM_API_KEY="your-api-key"
export LLM_MODEL="claude-3-opus-20240229"

你可以设置基础的 local/custom models:

export LLM_BASE_URL="https://localhost:3000"

你可以自定义 在向量数据库中 使用什么 embeddings

export LLM_EMBEDDING_MODEL="llama2" # can be "llama2", "openai", "azureopenai", or "local"

在命令行运行

PYTHONPATH=`pwd` python opendevin/main.py -d ./workspace/ -i 100 -t "Write a bash script that prints 'hello world'"

伊织 2024-03-28(四)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/507141.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Bert基础(九)--Bert变体之ALBERT

在接下来的几篇,我们将了解BERT的不同变体,包括ALBERT、RoBERTa、ELECTRA和SpanBERT。我们将首先了解ALBERT。ALBERT的英文全称为A Lite version of BERT,意思是BERT模型的精简版。ALBERT模型对BERT的架构做了一些改变,以尽量缩短…

【C++】vector系列力扣刷题日志(136.只出现一次的数字,118.杨辉三角,26.删除有序数组中的重复项,260.只出现一次的数字 |||)

目录 136.只出现一次的数字 118.杨辉三角 26.删除有序数组中的重复项 260.只出现一次的数字 ||| vector的详细介绍及用法这里就不过多赘述了,可以参考上一篇博客:vector的介绍及使用说明 136.只出现一次的数字 题目: 给你一个 非空 整数…

深入理解鸿蒙生命周期:从应用到组件

在开发鸿蒙(HarmonyOS)应用时,理解生命周期的概念至关重要。生命周期不仅关乎应用的性能优化,还涉及到资源管理和用户体验等多个方面。本文将详细解析鸿蒙操作系统中应用、页面和组件的生命周期,帮助开发者更好地掌握这…

炸裂,PG的FDW又进化了!

📣📣📣 哈喽!大家好,我是【IT邦德】,江湖人称jeames007,10余年DBA及大数据工作经验 一位上进心十足的【大数据领域博主】!😜😜😜 中国DBA联盟(ACD…

Python 用pygame简简单单实现一个打砖块

# -*- coding: utf-8 -*- # # # Copyright (C) 2024 , Inc. All Rights Reserved # # # Time : 2024/3/30 14:34 # Author : 赫凯 # Email : hekaiiii163.com # File : ballgame.py # Software: PyCharm import math import randomimport pygame import sys#…

C++:加减乘除运算符(14)

就是常用的一些算数符 正1010负-10-10加102030减10 - 20-10 乘 10 * 20200除10 / 200.5 加 简单的加法运算 #include<iostream> using namespace std;int main() {// 加减乘除int a1 10;int b1 20;cout << a1 b1 << endl;system("pause");ret…

鸿蒙OS开发实战:【ArkTS 实现MQTT协议(2)】

软件说明 协议传输通道仅为TCPSocket基于HarmonyOS SDK API 9开发开发语言&#xff1a;ArkTS&#xff0c;TypeScript 应用操作说明 测试首页 “连接” : 用于连接远端服务器。具备“连接 & 断开” 两个功能“设置” : 用于添加更多主题“订阅” & “解除” : 仅用于…

LLM:函数调用(Function Calling)

1 函数调用 虽然大模型能解决很多问题&#xff0c;但大模型并不能知晓一切。比如&#xff0c;大模型不知道最新消息(GPT-3.5 的知识截至 2021年9月&#xff0c;GPT-4 是 2023 年12月)。另外&#xff0c;大模型没有“真逻辑”。它表现出的逻辑、推理&#xff0c;是训练文本的统计…

第九节:时间队列(终结篇)

一、概述 在常规的时间管理中是时间到了触发某个任务&#xff0c;这样一个时间点对应一个任务。在特殊的场景下&#xff0c;任务不断放送到时间队列&#xff0c;时间一到&#xff0c;全部任务执行并释放。如图&#xff1a; 二、时间队列组件 SMB提供了TimeFragment组件来构建…

Domino中的Web博客还能这么用

大家好&#xff0c;才是真的好。 最近时间比较空余&#xff08;闲得慌&#xff09;&#xff0c;计划做一个网站出来。虽然网站很不流行&#xff0c;但对80后程序员来说&#xff0c;毕竟容易实现和感觉亲切。 在Domino平台上做一个网站实在是太容易了&#xff0c;但除了手动开…

【Linux】IP协议

目录 IP报头格式 网段划分 特殊的IP地址 IP地址的数量限制 私有IP地址和公网IP地址 路由 IP报文分片 1.粗粒度谈谈分片 a. 确保将所有的分片全部聚到一起&#xff08;相同的标识&#xff09; b. 片偏移排序&#xff08;完成组转&#xff09; 2.分片细节 数据链路层 M…

http模块 服务器端如何响应(获取)静态资源?

一、静态资源与动态资源介绍&#xff1a; &#xff08;1&#xff09;静态资源 内容长时间不改变的资源。eg&#xff1a;图片、视频、css js html文件、字体文件... &#xff08;2&#xff09;动态资源 内容经常更新的资源。eg&#xff1a;百度首页、淘宝搜索列表... 二、服…

引领向量数据库技术新变革,Milvus 2.4 正式上线

备受关注的 Milvus 2.4 正式上线! 作为向量数据库赛道的领军者,Zilliz 一直致力于推动向量技术的进步与创新。本次发布中,Milvus 新增支持基于 NVIDIA 的 GPU 索引—— CUDA 加速图形索引(CAGRA),突破了现有向量搜索的能力。 GPU 索引是向量数据库技术中的重要里程碑,…

【码银送书第十六期】大模型在金融行业的应用场景和落地路径

作者&#xff1a;林建明 来源&#xff1a;IT阅读排行榜 本文摘编自《AIGC重塑金融&#xff1a;AI大模型驱动的金融变革与实践》&#xff0c;机械工业出版社出版 文章转自&#xff1a;大模型在金融行业的应用场景和落地路径 这是最好的时代&#xff0c;也是最坏的时代。尽管…

Linux系统使用Docker部署个人IT工具箱IT-Tools结合内网穿透实现公网访问

作为程序员&#xff0c;在日常工作中&#xff0c;需要借助一些工具来提高我们工作效率&#xff0c;IT-Tools是为开发人员度身打造的一套便捷在线工具。它提供全面功能&#xff0c;使开发者能以更高效方式完成任务。经由IT-Tools&#xff0c;开发人员能轻松应对各类技术挑战&…

【随笔】Git -- 高级命令(上篇)(六)

&#x1f48c; 所属专栏&#xff1a;【Git】 &#x1f600; 作  者&#xff1a;我是夜阑的狗&#x1f436; &#x1f680; 个人简介&#xff1a;一个正在努力学技术的CV工程师&#xff0c;专注基础和实战分享 &#xff0c;欢迎咨询&#xff01; &#x1f496; 欢迎大…

CVPR 2024 | 风格迁移和人像生成汇总!扩散模型diffusion用于经典AIGC方向

风格迁移 1、DEADiff: An Efficient Stylization Diffusion Model with Disentangled Representations 基于文本到图像扩散模型在迁移参考风格方面具有巨大潜力。然而&#xff0c;当前基于编码器的方法在迁移风格时显著损害了文本到图像模型的文本可控性。本文提出DEADiff来解决…

解决win10 cmd下运行python弹出windows应用商店

Windows 10 的五月更新为 Microsoft Store 应用商店带来了 Python 3.7 原因是这个环境变量“C:\Users\hongc\AppData\Local\Microsoft\WindowsApps”的优先级比我们创建的python环境变量优先级高 所以我们只需要删除这个环境变量即可 但是为了不影响正常功能 推荐将Python的…

【机器学习】数据探索---python主要的探索函数

在上一篇博客【机器学习】数据探索(Data Exploration)—数据质量和数据特征分析中&#xff0c;我们深入探讨了数据预处理的重要性&#xff0c;并介绍了诸如插值、数据归一化和主成分分析等关键技术。这些方法有助于我们清理数据中的噪声、消除异常值&#xff0c;以及降低数据的…

每日一题(相交链表 )

欢迎大家来我们主页进行指导 LaNzikinh-CSDN博客 160. 相交链表 - 力扣&#xff08;LeetCode&#xff09; 给你两个单链表的头节点 headA 和 headB &#xff0c;请你找出并返回两个单链表相交的起始节点。如果两个链表不存在相交节点&#xff0c;返回 null 。 图示两个链表在节…