通义千问 2，大模型应用开发时的新选择

通义千问 2，大模型应用开发时的新选择

article2025/3/28 15:16:45/文章来源:https://blog.csdn.net/cheng_fu/article/details/140196851

我在进行 AI 相关的开发中，最常用的模型是通义千问。本地开发的时候，使用 Ollama 来运行 qwen 模型。集成测试和线上环境，使用阿里云模型服务灵积上的通义千问模型。使用阿里云的好处是：模型服务的获取方便，稳定性好，可以及时获取到服务支持。

现在通义千问出了新的版本，qwen2。qwen2 有 4 种参数尺寸：0.5b、1.5b、7b 和 72b。qwen2 的 0.5b 和 1.5b 的上下文窗口尺寸是 32k，而 7b 和 72b 的窗口尺寸则是 128k。

在评测中，qwen2 72b 参数模型的性能，优于 Llama 3 的 70b 参数版本。

在模型体积方面，qwen2 的 0.5b、1.5b、7b 和 72b 的模型大小分别是 352M、935M、4.4G 和 41G。

与之对应的，qwen 1.5 的参数选择更多一些，有0.5b、1.8b、4b、7b、32b、72b、和110b。

在日常的开发中，我打算用 qwen2 的 1.5b 替换掉 qwen 的 0.5b，虽然耗费的资源多了一些，但是模型的参数变多了，结果会更准确一些。

qwen2 的另外一个优势是，上下文窗口变大了。在开发检索增强生成应用时，较大的上下文窗口尺寸是一个很大的优势，意味着可以把更多的上下文信息添加到大模型的输入中。

在 Spring AI 的应用开发中，使用通义千问2很简单。以使用 Ollama 进行本地开发为例，首先使用 ollama pull qwen2:1.5b 来拉取 qwen2 模型到本地。再修改 Spring AI 应用的配置文件，把配置项 spring.ai.ollama.chat.options.model 的值改成 qwen2:1.5b 即可。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/781406.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

无人机5公里WiFi低延迟图传模组，抗干扰、长距离、低延迟，飞睿智能无线通信新标杆

无人机5公里WiFi低延迟图传模组，抗干扰、长距离、低延迟，飞睿智能无线通信新标杆

在科技日新月异的今天，我们见证了无数通信技术的飞跃。从开始的电报、电话，到如今的4G、5G网络，再到WiFi的广泛应用，每一次技术的革新都极大地改变了人们的生活方式。飞睿智能5公里WiFi低延迟图传模组，它以其独特的优势…

阅读更多...

GD32实战篇-双向数控BUCK-BOOST-BUCK降压理论基础

GD32实战篇-双向数控BUCK-BOOST-BUCK降压理论基础

本文章基于兆易创新GD32 MCU所提供的2.2.4版本库函数开发向上代码兼容GD32F450ZGT6中使用后续项目主要在下面该专栏中发布： https://blog.csdn.net/qq_62316532/category_12608431.html?spm1001.2014.3001.5482 感兴趣的点个关注收藏一下吧! 电机驱动开发可以跳转…

阅读更多...

Java多线程不会？一文解决——

Java多线程不会？一文解决——

方法一新建类如MyThread继承Thread类重写run()方法再通过new MyThread类来新建线程通过start方法启动新线程案例： class MyThread extends Thread {public MyThread(String name) {super(name);}Overridepublic void run() {for(int i0;i<10;i){System.out.…

阅读更多...

kafka-3

kafka-3

Kafka 消费组 consumer-offsets-N 稀疏索引 Kafka集群集群搭建集群启动和验证 Topic的意义 Topic和Partition 分区副本集群操作指令多分区&多副本多分区消费组 Rebalance机制 Rebalance机制处理流程 Rebalance机制-Range Rebalance机制-RoudRobin Rebalance机制-St…

阅读更多...

【Linux】在线求助命令--help，man page , info page

【Linux】在线求助命令--help，man page , info page

我们知道Linux有很多的命令，那LInux要不要背命令？ 答案是背最常用的那些就行了那有的时候我们想查询一些命令的详细用法该怎么办呢？ 这里我给出3种方法 1.--help --help的使用方法很简单啊要查询的命令 --help 我们看个例子这里我只…

阅读更多...

一览 Anoma 上的有趣应用概念

一览 Anoma 上的有趣应用概念

撰文：Tia，Techub News 本文来源香港Web3媒体：Techub News Anoma 的目标是为应用提供通用的意图机器接口，这意味着使用 Anoma，开发人员可以根据意图和分布式意图机编写应用，而不是根据事务和特定状态机进行…

阅读更多...

java原子类

java原子类

在Java中，原子类（Atomic Classes） 是位于java.util.concurrent.atomic包中的一组类，这些类提供了一些原子操作，用于在多线程环境下进行安全的并发编程。原子类利用了底层的硬件支持，确保操作的原子性和线程…

阅读更多...

初阶数据结构二叉树常用函数(二)

初阶数据结构二叉树常用函数(二)

函数一求二叉树第K层的节点个数还是一样我们假设 K就是等于一如果说是一个空数的话就返回0 如果说有值的话就返回一个1就可以假设这个这层既不为空又不是第K层的话那么就说明第K层肯定是子树下面那么就说明是左右子树的第（K-1）层那么只将…

阅读更多...

谷哥剪映助手使用教程-剪映自动化批量视频剪辑软件-批量混剪素材替换

谷哥剪映助手使用教程-剪映自动化批量视频剪辑软件-批量混剪素材替换

谷哥剪映助手是一款提高视频剪辑效率的软件，很多人问具体怎么使用，我会抽点时间把各个功能拆分开来，一个个介绍。一、按组精准替换素材该功能可以按组精确替换图片或视频素材，如果你草稿里只有一个素材需要替换，请…

阅读更多...

【算法笔记自学】第 8 章提高篇（2）——搜索专题

【算法笔记自学】第 8 章提高篇（2）——搜索专题

8.1深度优先搜索（DFS） #include <cstdio>const int MAXN 5; int n, m, maze[MAXN][MAXN]; bool visited[MAXN][MAXN] {false}; int counter 0;const int MAXD 4; int dx[MAXD] {0, 0, 1, -1}; int dy[MAXD] {1, -1, 0, 0};bool isValid(int …

阅读更多...

docker中实现多机redis主从集群

docker中实现多机redis主从集群

redis主从集群是每个使用redis的小伙伴都必需知道的，那如何在docker中快速配置呢？这篇来教你快速上手，跟着复制完全就能用！！ 1. 前置准备 1.1 docker安装以防有小伙伴没预先安装docker，这里提供安装步骤…

阅读更多...

驾校管理系统设计

驾校管理系统设计

驾校管理系统设计旨在提高驾校运营效率、学员管理、教练安排、考试预约、财务结算等方面的能力。以下是一个基本的设计框架，包括关键模块和数据表设计： 1. 系统架构设计前端界面：提供给学员、教练和管理员使用的Web界面或移动应用&#xf…

阅读更多...

CGAL计算凸包（OSG进行可视化）

CGAL计算凸包（OSG进行可视化）

目录一、什么是凸包二、运行步骤 1、安装依赖项 2、编译osg库 3、运行代码 4、运行截图一、什么是凸包凸包是计算几何中的一个基本概念，用来描述一个点集的最小凸包围形。具体来说，给定一个点集，凸包是包含该点集的最小凸多边形或凸多面体。二维凸包：在二维平面…

阅读更多...

# 三 JS的流程控制和函数

# 三 JS的流程控制和函数

三 JS的流程控制和函数 3.1 JS分支结构 if结构这里的if结构几乎和JAVA中的一样,需要注意的是 if()中的非空字符串会被认为是trueif()中的非零数字会被认为是true 代码 if(false){// 非空字符串 if判断为trueconsole.log(true) }else{console.log(false) } if(){// 长度为0…

阅读更多...

昇思MindSpore学习笔记4-03生成式--Diffusion扩散模型

昇思MindSpore学习笔记4-03生成式--Diffusion扩散模型

摘要： 记录昇思MindSpore AI框架使用DDPM模型给图像数据正向逐步添加噪声，反向逐步去除噪声的工作原理和实际使用方法、步骤。一、概念 1. 扩散模型Diffusion Models DDPM(denoising diffusion probabilistic model) （无）条件…

阅读更多...

数据库系统原理练习 | 作业1-第1章绪论（附答案）

数据库系统原理练习 | 作业1-第1章绪论（附答案）

整理自博主本科《数据库系统原理》专业课完成的课后作业，以便各位学习数据库系统概论的小伙伴们参考、学习。 *文中若存在书写不合理的地方，欢迎各位斧正。专业课本： 目录一、选择题二：简答题三：综合题一、选择…

阅读更多...

【数据库】MySQL基本操作语句

【数据库】MySQL基本操作语句

目录一、SQL语句 1.1 SQL分类 1.2 SQL语言规范 1.3 数据库对象与命名 1.3.1 数据库的组件(对象)： 1.3.2 命名规则： 1.4 SQL语句分类二、基本命令 2.1 查看帮助信息 2.2 查看支持的字符集 2.3 查看默认使用的字符集 2.4 修改默认字符集 2.5…

阅读更多...

Camera Raw：编辑 - 校准

Camera Raw：编辑 - 校准

Camera Raw “编辑”模块中的校准 Calibration面板设计初衷是校准相机所采集的 R、G、B 色彩信息，使相机的 RGB 色域范围尽可能与标准 RGB 色域范围重合。不过，现在多用于创意调色。通过调整红、绿、蓝三个原色的色相和饱和度，以及阴影的色调…

阅读更多...

HTTP长连接

HTTP长连接

长连接优点 HTTP为什么要开启长连接呢？主要是为了节省建立的时间，请求可以复用同一条TCP链路，不用重复进行三握+四挥如果没有长连接，每次请求都做三握+四挥如果有长链接，在一个 TCP 连接中可以持续发送多份数据而不会断开连接，即请求可以复用TCP链路长连接缺点 …

阅读更多...

数字信号处理及MATLAB仿真（3）——量化的其他概念

数字信号处理及MATLAB仿真（3）——量化的其他概念

上回书说到AD转换的两个步骤——量化与采样两个步骤。现在更加深入的去了解以下对应的概念。学无止境，要不断地努力才有好的收获。万丈高楼平地起，唯有打好基础，才能踏实前行。不说了，今天咱们继续说说这两个步骤，首先…

阅读更多...

最新文章