大模型开发实战1-QuickStart

0. 关于大模型和模型选择

由于OpenAIChatGPT流行,AI技术在大模型技术的赋能下高速发展,特别是2023年至今,国内的AI技术发展更是前所未有的景象,各大公司争相发布自己的大模型,包括百度文心一言,阿里同义千问,字节豆包等,还包括一些专注AI的新兴公司,如智谱清言月之暗面等。现在市场上免费使用的大模型平台很多,也成为了我们日常工作中不可或缺的部分。对于大模型推理服务方面,也是各个厂商各个模型的价格不一。

为了进行大模型开发或者实验,除非本地部署大模型,就要选择合适的大模型服务平台。提供大模型推理服务的平台有很多,上面提到的公司都有。我们团队在调研和实践开发了一个大模型产品之后,决定把首选模型定为阿里的Qwen。以下是几点原因:

  • Qwen开源模型性能好:Qwen2.5一发布就登上各大开源大模型榜首,最新版的数学计算和编程能力有大幅提升,且提供了从大到小满足不同需求的尺寸。

  • 阿里百炼平台:阿里的大模型推理服务平台升级成百炼之后,操作体验更好,

在这里插入图片描述

且推理费用一降再降,新用户每个模型还有100W的tokens免费额度,部分模型直接免费使用,本实战教程就直接使用免费的qwen2.5-3b-instruct模型。

在这里插入图片描述

值得一提的是,平台本身接口兼容OpenAI

在这里插入图片描述

  • Qwen-Agent框架:阿里官方为Qwen模型开发了用于AI应用开发的智能体框架,还提供了常用场景的模板实现。

  • Qwen开源文档和博客资料内容和版面都很实用,且中英文都支持。

1. QuickStart

先到阿里百炼平台开通服务并创建API-KEY以开始体验

1.1 安装OpenAI依赖
pip install OpenAI
1.2 设置API-KEY

系统环境变量添加DASHSCOPE_API_KEY,值为创建的API-KEY

1.3 读取API-KEY并进行推理
import os
from openai import OpenAI

client = OpenAI(
    # 若没有配置环境变量,请用百炼API Key将下行替换为:api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"), 
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)
completion = client.chat.completions.create(
    model="qwen2.5-3b-instruct", # 模型列表:https://help.aliyun.com/zh/model-studio/getting-started/models
    messages=[
        {'role': 'system', 'content': 'You are a helpful assistant.'},
        {'role': 'user', 'content': '你是谁?'}],
    )
    
print(completion.model_dump_json())

运行以上代码,得到模型推理返回结果:

{
	"id": "chatcmpl-d601336a-d070-95d8-983b-7bd3187a7611",
	"choices": [{
		"finish_reason": "stop",
		"index": 0,
		"logprobs": null,
		"message": {
			"content": "我是Qwen,由阿里云开发的预训练模型,我的目标是帮助用户获得准确、有用的信息。我可以回答问题、创作文字, 比如写故事、写公文、写邮件、写剧本等等,还能表达观点,生成艺术性的文字。如果你有任何问题或需要帮助的地方,请随时告诉我!",
			"refusal": null,
			"role": "assistant",
			"audio": null,
			"function_call": null,
			"tool_calls": null
		}
	}],
	"created": 1729733446,
	"model": "qwen2.5-3b-instruct",
	"object": "chat.completion",
	"service_tier": null,
	"system_fingerprint": null,
	"usage": {
		"completion_tokens": 66,
		"prompt_tokens": 32,
		"total_tokens": 98,
		"completion_tokens_details": null,
		"prompt_tokens_details": null
	}
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/899566.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

正版CST电磁仿真软件:保障创新与合规的基石

在当今快速发展的科技时代,电磁仿真技术对于电子产品的设计、测试和优化至关重要。CST电磁仿真软件以其强大的功能和广泛的应用领域,成为众多企业和研究机构不可或缺的工具。然而,在选择使用CST软件时,确保使用正版软件不仅是对知…

【C++】红黑树的底层原理以及实现

#1024程序员节 | 征文# 个人主页:夜晚中的人海 文章目录 ⭐前言🚆一、红黑树的概念🏠二、红黑树的规则🎄三、红黑树的效率🎡四、红黑树的实现1. 基本框架2. 插入操作• 变色• 单旋 变色• 双旋 变色 3. 查找操作4. …

玄机平台-应急响应-webshell查杀

首先xshell连接 然后进入/var/www/html目录中,将文件变成压缩包 cd /var/www/html tar -czvf web.tar.gz ./* 开启一个http.server服务,将文件下载到本地 python3 -m http.server 放在D盾中检测 基本可以确认木马文件就是这四个 /var/www/html/shell.p…

高效实现聚水潭数据集成MySQL的技术案例

聚水潭奇门数据集成到MySQL的技术案例分享 在现代企业的数据管理中,如何高效、准确地实现不同系统之间的数据对接是一个关键问题。本文将聚焦于一个实际的系统对接集成案例:将聚水潭奇门平台的售后单数据集成到MySQL数据库中,具体方案名称为…

JVM—类的生命周期

目录 类的生命周期 加载阶段 连接阶段 验证阶段 准备阶段 解析阶段 初始化阶段 面试题1 面试题2 类的生命周期 类的生命周期描述了一个类加载、使用、卸载的整个过程,整体可以分为以下五个阶段。 1. 加载 2. 连接,其中又分为验证、准备、解析三…

Python学习的自我理解和想法(21)

学的是b站的课程(千锋教育),跟老师写程序,不是自创的代码! 今天是学Python的第21天,学的内容是文件的操作。开学了,时间不多,写得不多,见谅。 目录 1.文件 (1).参数…

Tcp_Sever(线程池版本的 TCP 服务器)

Tcp_Sever(线程池版本的 TCP 服务器) 前言1. 功能介绍及展示1.1 服务端连接1.2 客户端连接(可多个用户同时在线连接服务端)1.3 功能服务1.3.1 defaultService(默认服务)1.3.2 transform(大小写转…

Rust与Javascript的使用对比

一、常量 RustJavascriptletconst 二、变量 RustJavascriptlet mutlet / var 三、常用打印 RustJavascriptprintln!(“换行”);console.log(‘hello’);print!(“不换行”);console.info(‘信息’);-console.error(‘错误’);-console.warn(‘警告’); 四、定义字符串 R…

开放式耳机哪个品牌音质好?高评分爆款开放式耳机推荐!

一直活跃在蓝牙耳机圈子里的我,对各种类型的耳机多少都有自己的看法,完全可以说是个耳机狂热者。近几年,开放式蓝牙耳机愈发火爆。开放式耳机不是任何品牌都能轻松做好的产品,特别是音质,它涵盖了核心单元技术等诸多方…

负载均衡服务器攻击怎么解决最有效?

负载均衡服务器攻击怎么解决最有效?常见的有效解决方法包括:使用SYNCookie机制、限制ICMP包速率、基于源IP的连接速率限制、检测并丢弃异常IP包、配置访问控制列表(ACL)、设置虚拟服务器/服务器连接数量限制、设置HTTP并发请求限制…

ABAQUS应用11——支座弹簧

文章目录 0、背景1、ABAQUS中几类弹簧的简介2、SPRING1的性质初探 0、背景 1、ABAQUS中几类弹簧的简介 先说参考来源,ABAQUS2016的帮助文档里第4卷,32.1.1节,有三种弹簧(SPRING1 、SPRING2 以及SPRINGA)。 三种弹簧里…

C for Graphic:视差渲染(一)

记录一下最近优化场景的做法:视差渲染 原理:通过视口坐标的变化,观察不同采样画面的功能,画面的载体为低模平面 我早期工作,在小作坊全栈的时候,做过一段时间web开发,做了一个古董藏…

【传知代码】机器学习在情绪预测中的应用(论文复现)

在科技迅猛发展的今天,我们不仅在追求更强大的计算能力和更高的精度,还希望我们的机器能够理解和回应我们复杂的情感世界。设想一下,当你面对挫折时,设备不仅能识别你的情绪,还能以一种富有同情心和洞察力的方式作出反…

开放式耳机哪个牌子好?开放式蓝牙耳机排行榜分享

​耳机已经成为我们日常生活中的必需品,但长时间佩戴传统入耳式耳机可能会导致耳朵不适,甚至影响健康。为了应对这一挑战,开放式耳机应运而生。这类耳机不侵入耳道,有效减轻了耳朵的压力,同时减少了感染风险&#xff0…

fmql之Linux中I2C总线框架

正点原子第44章 I2C zynq I2C pcf8563芯片 我们用的是ds3231. Linux I2C总线框架 I2C总线驱动 这部分内容是半导体厂商编写的。 I2C总线设备 zynq I2C适配器驱动 I2C设备驱动编写 使用设备树 代码编写 设备树修改 设备驱动编写 因为用的是ds3231,所以先找…

使用 PyTorch 构建 LSTM 股票价格预测模型

目录 引言准备工作1. 训练模型(train.py)2. 模型定义(model.py)3. 测试模型和可视化(test.py)使用说明模型调整结论 引言 在金融领域,股票价格预测是一个重要且具有挑战性的任务。随着深度学习…

1024软件推荐-rubick

开源的插件化桌面端效率工具箱。插件是基于 npm 进行安装和卸载,非常轻便。插件数据支持 webdav 多端同步,非常安全。支持内网部署,可二次定制化开发,非常灵活。 前言 rubick 之前的插件管理,依托于云服务器存储&…

滴水逆向三期笔记与作业——02C语言——13 指针(3)(4)

滴水逆向三期笔记与作业——02C语言——13 指针3、4 一、模拟实现CE的数据搜索功能 OneNote迁移 一、模拟实现CE的数据搜索功能 //其中有0xAA,超过有符号char范围,在vscode中会报错,所以使用unsigned char unsigned char data[100] {0x00,0…

一起搭WPF架构之完结总结篇

一起搭WPF架构之完结总结篇 前言设计总结设计介绍页面一页面二页面三 结束 前言 整体基于WPF架构,根据自己的需求简单设计与实现了衣橱的数据统计、增加与读取数据、并展示数据的小软件。我知道自己在设计方面还有很多不足,暂时先做到这里了&#xff0c…

gbase8s权限管理

一 权限分类 分片级权限(分片表) 表引用 类型级权限 例程级权限 语言级权限 序列级权限 等... 其中常用的为 数据库级权限,表级权限,序列级权限以及例程级权限 二 权限控制 当创建一个用户时,该用户没有任何权…