阿里开源编程大模型 CodeQwen1.5:64K92编程语言,Code和SQL编程,评测接近GPT-4-Turbo

前言

阿里巴巴最近发布的CodeQwen1.5模型标志着其在编程语言模型领域的一次重大突破。这款开源模型不仅支持高达92种编程语言和64K的上下文长度,而且在多项性能评测中显示出接近或超过当前行业领导者GPT-4-Turbo的能力。

  • Huggingface模型下载:https://huggingface.co/Qwen/CodeQwen1.5-7B

  • AI快站模型免费加速下载:https://aifasthub.com/models/Qwen

模型概述

CodeQwen1.5是基于Qwen语言模型的进阶版本,拥有70亿参数,并使用GQA架构。模型在约3万亿token的代码相关数据上进行了预训练,这使得它在代码生成、长序列建模、代码修改和SQL编程等多个方面表现卓越。

编程语言支持

模型支持的92种编程语言覆盖了从Python、Java、C++到较少见的语言如Elixir和Go,使其成为多语言编程环境中的强大工具。这种广泛的语言支持对于开发多平台应用程序尤为重要,能够满足不同开发者的需求。

长序列建模能力

CodeQwen1.5的一个重要特点是其长序列建模能力,能处理高达64K的上下文输入。这对于理解大型代码库和执行复杂的代码重构任务至关重要。模型在处理长序列时展现了极低的困惑度,表明其对代码结构和语义的深入理解。

SQL编程专长

除了通用编程能力,CodeQwen1.5还展现了出色的SQL编程专长,能够通过自然语言查询实现复杂的数据库操作。这一功能特别适合非技术用户,帮助他们轻松地进行数据检索和管理。在两个流行的文本到SQL基准测试Spider和Bird上评估了CodeQwen1.5-Chat的性能。实验结果显示,CodeQwen1.5在接近GPT-4的位置排名第二(结果来自DIN-SQL,一种 SOTA 的提示方法)。

性能评测

在标准的编程能力评测如HumanEval和MBPP中,CodeQwen1.5的表现堪比顶级商业模型。例如,在HumanEval的0-shot测试中,CodeQwen1.5的得分高达51.8%,而在MBPP的3-shot测试中,得分达到61.8%。这些成绩显示了其在理解和执行复杂编程任务方面的能力。

CodeQwen1.5不仅在 Python 方面表现出色,还是一个多编程语言的编程模型。在 MultiPL-E 平台上,包括 Python、C++、Java、PHP、TypeScript、C#、Bash 和 JavaScript 在内的 8 种主流语言上进行了全面评估,这些结果证明了CodeQwen1.5强大的编程能力。

结论

CodeQwen1.5的发布不仅证明了阿里巴巴在开源社区中的影响力,也标志着开源编程模型在性能和通用性上达到了一个新的高度。它不仅为开发者社区提供了一个强大的工具,还为编程语言模型的未来发展设定了新的标准。随着更多的开源项目和开发者参与到CodeQwen1.5的持续改进中,我们可以期待这一模型在未来解决更多复杂的软件开发挑战。

模型下载

Huggingface模型下载

https://huggingface.co/Qwen/CodeQwen1.5-7B

AI快站模型免费加速下载

https://aifasthub.com/models/Qwen

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/618108.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

网络层(计算机网络谢希仁第八版)——学习笔记四

关于网络层的争论 争论的内容:网络层应该想运输层提供正阳的服务,是“面向连接的”还是“无连接”。 其实质就是:可靠交付应该交给谁负责?面向连接表示网络层负责可靠交付,无连接则是把这个任务交给运输层。 让网络层负…

【图像识别】Swin Transformer

一、引言 论文: Swin Transformer: Hierarchical Vision Transformer using Shifted Windows 作者: Microsoft Research Asia 代码: Swin Transformer 特点: 提出滑动窗口自注意力 (Shifted Window based Self-Attention) 解决Vi…

【中航证券军工】北摩高科2023年报2024Q1点评:聚焦航空及军工主赛道,民机业务有望成为第二曲线

事件 公司4月24日公告,2024Q1实现营收(2.40亿元,同比-23.71%),归母净利润(0.73亿元,同比-45.63%),毛利率(62.63%,同比-7.22pcts),净利率(37.34%&…

【SpringBoot记录】从基本使用案例入手了解SpringBoot-数据访问(1)

前言 在程序开发尤其是网页应用开发中,数据访问是必不可少的。通过前面的基本案例我们完成了一个简单的SpringBoot Web应用并对自动配置原理有了一定了解,本节在上述案例基础上,继续编写数据访问案例,将通过SpringBoot中数据访问…

手机同步与数据安全:让手机和电脑完美结合!

在当今这个高度信息化的社会,手机和电脑不仅为我们提供了丰富的信息资源,让我们能够随时随地获取所需的信息,还为我们的生活带来了极大的便利。无论是工作、学习还是娱乐,手机和电脑都发挥着至关重要的作用。 然而,随…

华为OD机试 - 执行任务赚积分 - 动态规划(Java 2024 C卷 100分)

华为OD机试 2024C卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题(A卷+B卷+C卷)》。 刷的越多,抽中的概率越大,每一题都有详细的答题思路、详细的代码注释、样例测试,发现新题目,随时更新,全天CSDN在线答疑。 一、题目描述 现有 N 个任…

Oracle11g账户频繁被锁定的3种解决办法

方法1:创建触发器 方法1:数据库中创建触发器(只记录失败),但是需要开发同意或者开发自己创建。找到密码输入错误的服务器,进行数据源配置的更改。 该方法适用于要求找到密码错误用户所在服务器的场景下。 CREATE OR REPLACE TR…

在另外一个页面,让另外一个页面弹框显示操作(调佣公共的弹框)

大概意思是,登录弹框在另外一个页面中,而当前页面不存在,在当前页面中判断如果token不存在,就弹框出登录的弹框 最后一行 window.location.href … 如果当前用户已登录,则执行后续操作(注意此处,可不要)

Jboss 反序列化 CVE-2017-12149

一、漏洞简介 JBoss是一个管理EJB的容器和服务器,支持EJB 1.1、EJB 2.0和EJB3的规范。在/invoker/readonly路径下,攻击者可以构造序列化代码传入服务器进行反序列化,由于没有对反序列化操作进行任何检测,导致攻击者可以执行任意代码。 而jbo…

AI 重塑产品设计

作者:明明如月学长, CSDN 博客专家,大厂高级 Java 工程师,《性能优化方法论》作者、《解锁大厂思维:剖析《阿里巴巴Java开发手册》》、《再学经典:《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

【二叉树】Leetcode N 叉树的层序遍历

题目讲解 429. N 叉树的层序遍历 算法讲解 在做层序遍历的时候由于它的每一个结点是有val vector child组成,所以在做层序遍历的时候需要考虑它每一层结点的个数,那我们就可以使用一个queue保存每一层的结点;那么我们在做第一层的时候&am…

【GD32F470紫藤派使用手册】第八讲 ADC-规则组多通道采样实验

8.1 实验内容 通过本实验主要学习以下内容: ADC的简介 GD32F470 ADC工作原理 DMA原理 规则组多通道循环采样 8.2 实验原理 8.2.1 ADC原理 我们知道,自然界中有非常多的模拟信号,比如光照强度,还有其他的例如温度、声音等等…

【C++】stack和queue 适配器

🔥个人主页:北辰水墨 🔥专栏:C学习仓 本节内容我们来讲解栈和队列的模拟实现,文末会赋上模拟实现的代码 一、stack的使用和模拟实现 stack适配器的介绍: 1. stack是一种容器适配器,专门用在具…

【操作系统期末速成】​内存管理|内存的装入模块在装入内存的方式|分配管理方式|页面置换算法|页面置换

🎥 个人主页:深鱼~🔥收录专栏:操作系统🌄欢迎 👍点赞✍评论⭐收藏 推荐 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到…

Qt之QMqtt 发送图片数据

简述 MQTT(消息队列遥测传输)是ISO标准下基于发布/订阅范式的消息协议;它工作在TCP/IP协议族上,是为硬件性能低下的远程设备以及网络状况糟糕的情况下而设计的发布/订阅型消息协议,为此,它需要一个消息中间件; MQTT是一个基于客户端-服务器的消息发布/订阅传输协议;MQT…

chmod -R 777 / 抢救,看这篇就够了

chmod -R 777抢救全过程记录 背景 在两台Ubuntu 20.04的服务器上错误执行了chmod -R 777 /命令,结果非常酸爽,sudo权限失效,而且ssh也没有用了。在经过了10多个小时的踩坑以后最后在不重装系统的情况下解决了问题,以下记录只记录…

LOTO示波器动作编程功能(命令批处理)

动作编程功能是为了方便客户根据自己的应用场景,做到一个按键就连续做多个示波器操作,从而降低了对操作人员的技术要求,做到傻瓜式操作。之前LOTO有个类似的功能,是把示波器的基础设置根据不同的测试场景存成不同的设置文件&#…

【FFmpeg】Filter 过滤器 ① ( FFmpeg 过滤器简介 | 过滤器概念 | 过滤器用法 | 过滤器工作流程 | 过滤器文档 | 过滤器分类 )

文章目录 一、FFmpeg 过滤器 Filter 简介1、FFmpeg 过滤器概念2、FFmpeg 过滤器用法3、FFmpeg 过滤器工作流程4、FFmpeg 过滤器文档 二、FFmpeg 过滤器 分类1、过滤器分类 - 根据处理数据类型分类2、过滤器分类 - 根据编码器位置分类3、过滤器分类 - 根据功能分类 FFmpeg 相关文…

在vue3中,如何优雅的使用echarts之实现大屏项目

前置知识 效果图 使用技术 Vue3 Echarts Gasp Gasp:是一个 JavaScript动画库,它支持快速开发高性能的 Web 动画。在本项目中,主要是用于做轨迹运动 所需安装的插件 npm i echarts npm i countup.js 数字滚动特效 npm i gsap javascript动画库 np…

竞赛课第十周(巴什游戏,尼姆博弈)

目录 目的: 实验内容: 第一题 思路: 【参考代码】 【运行结果】 第二题 输入: 输出: 【参考代码】 【运行结果】 目的: 熟悉并掌握公平组合游戏 (1)巴什游戏、尼姆游戏 (2)图游戏…