奥赛满分金牌得主出品,硅谷诞生超级AI码农

file

又是让程序员们兴奋而焦绿🍌的一刻,昨天业界又发布了一款 AI 编程产品 Devin。号称是业界第一个 AI 软件工程师。

file

作者 Scott Wu 曾是国际信息奥赛 (IOI) 连续三届的金牌得主,其中还有一届是满分。

file

Devin 背后的公司名字叫 Cognition。中文翻译就是认知,很契合。发布了不到 24 小时,推上就有了 4 万多粉丝。官号关注的 10 个人,看上去应该都是公司的员工,MIT,Stanford,Harvard,Google Brain。时代最优秀的大脑们,终于不再去思考如何让人们点击广告了。

file

Devin 官网也放出了和其他 LLM 大模型在 SWE-bench 下的表现对比。SWE-bench 收录的是 GitHub 上真实的问题。之前在没有辅助的情况下,表现最好的 Claude 2 也只有 1.96% 的完成度。即使在有辅助的情况下,表现最好的 Claude 2 也只有 4.8 %。

file

而 Devin 在没有辅助的情况下,一下子就把完成度提高到了 13.86%。从 1.96% 到 13.86%,从相对提升来说惊人,但从绝对值来说,仍然略显寒酸。虽然 Devin 是随机取样了 25% 的数据进行测试,但作为一款专门针对编程场景的 AI,想必是针对 GitHub 数据进行了训练,那是否会有过拟合 overfitting 的问题,使得在基于 GitHub 数据的测试集上表现优秀?网友们也纷纷表达观点:

file

质疑派。又来一个画饼的!就在昨天,我想尝试从一个简单的网页里提取选择器,我试了 GPT-4-turbo,我试了 Claude,我试了 Groq,我试了本地的 LLama2,结果没一个能用的!我自己干 10 秒钟就搞定了!我已经被你们这些编程 AI 伤够了!(是不是还是氪金不够?说不定用 GPT-4 或者 Claude 2 就行了呢,甚至 Claude 3?)

file

实践保守派。又是一个被 VC 过早催熟的例子。我在这个领域干过一段时间,目前还处在实验室研究阶段,远未达到可以在日常环境使用的地步。

file

当然乐观派也很多,包括笔者在内,都已经习惯了每天和 GPT 对话写程序了。在写一些像 GitHub Action 这样的配置类文件时,GPT-4 的表现让我刮目相看。笔者也已经加入了 Devin 的 waitlist,想迫不及待地测试一下他的能力,先看看 Devin 能否优化我手上一批上百行的祖传 SQL 脚本吧。

file

不同于之前像 Copilot 这样的产品形态,Devin 确实更像是一个真正的软件工程师。Demo 里展示的 Devin 产品界面就是一个 IDE (Integrated Development Environment 集成开发环境),不过这是专门为 AI 打造的。Devin 在这个 IDE 里完成各种编程任务,就像人类软件工程师在 VSCode 这样的 IDE 里干活一样。
之前我们讨论 LUI (Language UI) 或者 CUI (Chat UI),是从人的角度去思考怎么更好地和 AI 交互。那如果从 AI 的角度去看呢?未来的 AI 软件工程师,是不是就应该有像 Devin 这样专门为 AI 们打造的工作环境?

file

Devin 提出的 AI 软件工程师概念确实足够吸引眼球。不过看着这 AI 日新月异的发展,这一天恐怕是迟早要来了。其实这在不算长的计算机历史上,也已经发生过了一回。

file

最早 Computer 计算机这个词,一开始指的就是做计算的人,是后来才被机器取代的。或许将来 Engineer 工程师这个词也会被机器取代吧,那人类最后的阵地就只剩下👇

file

但至少人人都是产品经理的夙愿,就一,定,要,实现现现~~~。


💡 更多资讯,请关注 Bytebase 公号:Bytebase

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/455602.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Matlab有限元结果后处理 | 不规则云图绘制(二维/三维)|【Matlab源码+视频教程】

专栏导读 作者简介:工学博士,高级工程师,专注于工业软件算法研究本文已收录于专栏:《有限元编程从入门到精通》本专栏旨在提供 1.以案例的形式讲解各类有限元问题的程序实现,并提供所有案例完整源码;2.单元…

SSA-LSTM多输入回归预测 | 樽海鞘优化算法-长短期神经网络 | Matlab

目录 一、程序及算法内容介绍: 基本内容: 亮点与优势: 二、实际运行效果: 三、算法介绍: 四、完整程序下载: 一、程序及算法内容介绍: 基本内容: 本代码基于Matlab平台编译&am…

换掉ES!Redis官方搜索引擎来了,性能炸裂!

RediSearch 一、介绍二、实现特性1. 对比 Elasticsearch2. 索引构建测试3. 查询性能测试 三、安装1. 源码安装2. docker安装3. 判断是否安装成功 四、命令行操作1. 创建1.1 创建索引1.2 创建文档 2. 查询2.1 基本查询2.1.1 全量查询2.1.2 匹配查询 2.2 模糊匹配2.2.1 后置匹配2…

java数据结构与算法刷题-----LeetCode491. 非递减子序列

java数据结构与算法刷题目录(剑指Offer、LeetCode、ACM)-----主目录-----持续更新(进不去说明我没写完):https://blog.csdn.net/grd_java/article/details/123063846 文章目录 解题思路:时间复杂度O( n 2 ∗ n n^2*n n2∗n),空间复…

从零开始利用MATLAB进行FPGA设计(一):建立脉冲检测模型的Simulink模型2

目录 1.模块的总体结构 1.1从工作空间导入输入信号 1.2FIR滤波器 2.Subsystem 3.MATLAB Function 文章灵感来源于MATLAB官方免费教程:HDL Coder Self-Guided Tutorial 考虑到MATLAB官网的英文看着慢,再加上视频讲解老印浓浓的咖喱味,我…

【数据结构与算法】排序

目 录 一.排序的概念及引用1.1 排序的概念1.2 常见的排序算法 二.常见排序算法的实现2.1 插入排序直接插入排序希尔排序( 缩小增量排序 ) 2.2 选择排序直接选择排序堆排序 2.3 交换排序冒泡排序快速排序快速排序优化:非递归实现快速排序 2.4归并排序2.4.3 海量数据的…

专题二 - 滑动窗口 - leetcode 30. 串联所有单词的子串 | 困难难度

leetcode 30. 串联所有单词的子串 leetcode 30. 串联所有单词的子串 | 困难难度1. 题目详情1. 原题链接2. 基础框架 2. 解题思路1. 题目分析2. 算法原理3. 时间复杂度 3. 代码实现滑动窗口,并使用遍历判断两个哈希表是否相等滑动窗口,引入有效字符计数co…

libusb_Qt使用

Libusb libusb_github 建议直接下载库,编译好麻烦 QT调用 .pro文件添加: win32: LIBS -L$$PWD/LIB/libusb/x64/ -llibusb-1.0.cpp调用即可 #include "LIB/libusb/libusb.h" void class_name::fun(){/* 1. */libusb_init(NULL);/**/str…

软考高级:信息系统开发方法2(形式化方法、统计过程方法等)概念和例题

作者:明明如月学长, CSDN 博客专家,大厂高级 Java 工程师,《性能优化方法论》作者、《解锁大厂思维:剖析《阿里巴巴Java开发手册》》、《再学经典:《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

【深度学习目标检测】二十三、基于深度学习的行人检测计数系统-含数据集、GUI和源码(python,yolov8)

行人检测计数系统是一种重要的智能交通监控系统,它能够通过图像处理技术对行人进行实时检测、跟踪和计数,为城市交通规划、人流控制和安全管理提供重要数据支持。本系统基于先进的YOLOv8目标检测算法和PyQt5图形界面框架开发,具有高效、准确、…

42.坑王驾到第八期:uniCloud报错

uniCloud 报错 今天调用云函数来调试小程序的时候突然暴了一个奇葩错误,require(…).main is not a function。翻官方文档后发现,原来是这样:**如果你写的是云对象,入口文件应为 index.obj.js,如果你写的是云函数入口…

在centOS服务器安装docker,并使用docker配置nacos

遇到安装慢的情况可以优先选择阿里镜像 安装docker 更新yum版本 yum update安装所需软件包 yum install -y yum-utils device-mapper-persistent-data lvm2添加Docker仓库 yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.rep…

CentOS 7安装MySQL及初始化操作教程

一、引言 MySQL是一款广泛使用的开源关系型数据库管理系统,适用于各种规模的应用场景。在CentOS 7系统中安装MySQL并进行初始化操作,可以为我们的应用程序提供稳定、可靠的数据存储服务。本文将详细介绍CentOS 7安装MySQL及初始化操作的步骤。 目录 一、…

Midjourney绘图欣赏系列【人物篇】(一)

Midjourney介绍 Midjourney 是生成式人工智能的一个很好的例子,它根据文本提示创建图像。它与 Dall-E 和 Stable Diffusion 一起成为最流行的 AI 艺术创作工具之一。与竞争对手不同,Midjourney 是自筹资金且闭源的,因此确切了解其幕后内容尚不…

2024 年排名前 5 名的 Mac 数据恢复软件分享

如果您已经在 Mac 上丢失了数据并且正在寻找恢复数据的方法,那么您来对地方了。互联网上有超过 50 个适用于 Mac 的数据恢复程序。哪个是最好的 Mac 数据恢复软件?不用担心。本文列出了 5 款 Mac 数据恢复软件,可帮助您在 Mac OS 下恢复丢失的…

C++程序设计-第六/七/八章 运算符重载/包含与继承/虚函数和多态性【期末复习|考研复习】

前言 总结整理不易,希望大家点赞收藏。 给大家整理了一下C程序设计中的重点概念,以供大家期末复习和考研复习的时候使用。 C程序设计系列文章传送门: 第一章 面向对象基础 第四/五章 函数和类和对象 第六/七/八章 运算符重载/包含与继承/虚函…

OpenResty使用Lua大全(三)OpenResty使用Json模块解析json

文章目录 系列文章索引一、使用Json模块1、引入cjson模块2、table转json字符串3、json字符串转table4、异常处理(1)异常复现(2)使用pcall命令(3)cjson.safe 模块 5、空table返回object还是array 系列文章索…

STM32串口通信—串口的接收和发送详解

目录 前言: STM32串口通信基础知识: 1,STM32里的串口通信 2,串口的发送和接收 串口发送: 串口接收: 串口在STM32中的配置: 1. RCC开启USART、串口TX/RX所对应的GPIO口 2. 初始化GPIO口 …

精品基于Uniapp+ssm英语学习交流平台小程序打卡计划备忘录

《[含文档PPT源码等]精品微信小程序基于Uniappssm英语学习交流平台小程序》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、项目发布教程、包运行成功! 软件开发环境及开发工具: 开发语言:Java 后台框架:ssm 安卓框…

Linux_网络项目_WEB服务器 处理服务器写入失败后sigpipe信号导致服务器崩溃退出问题,引入线程池缓解大量请求,服务器组件化重构,在线计算机业务测试

文章目录 1. 处理服务器写入管道出错2. 引入线程池缓解大量请求导致服务器崩溃设计线程任务类单例线程池组件设计 3.代码位置4. 在线计算机业务运行截图 1. 处理服务器写入管道出错 经过测试,服务器在读取报文时如果出错可以选择直接关闭这个TCP里链接来节省资源。…