使用 vllm 本地部署 cohere 的 command-r

使用 vllm 本地部署 cohere 的 command-r

  • 0. 引言
  • 1. 安装 vllm
  • 2. 本地部署 cohere 的 command-r
  • 3. 使用 cohere 的 command-r

0. 引言

此文章主要介绍使用 使用 vllm 本地部署 cohere 的 command-r。

1. 安装 vllm

创建虚拟环境,

conda create -n myvllm python=3.11 -y
conda activate myvllm

安装 Ray 和 Vllm,

pip install ray vllm

安装 flash-attention,

git clone https://github.com/Dao-AILab/flash-attention; cd flash-attention
pip install flash-attn --no-build-isolation

2. 本地部署 cohere 的 command-r

eval "$(conda shell.bash hook)"
conda activate myvllm
CUDA_VISIBLE_DEVICES=3,2,1,0
python -m vllm.entrypoints.openai.api_server --trust-remote-code --served-model-name gpt-4 --model CohereForAI/c4ai-command-r-v01 --gpu-memory-utilization 0.98 --tensor-parallel-size 4 --port 8000

3. 使用 cohere 的 command-r

在这里插入图片描述

完结!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/572580.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Oracle Linux 8.8 一键安装 Oracle 11GR2 RAC(231017)

前言 Oracle 一键安装脚本,演示 Oracle Linux 8.8 一键安装 Oracle 11GR2 RAC(231017)过程(全程无需人工干预):(脚本包括 ORALCE PSU/OJVM 等补丁自动安装) ⭐️ 脚本下载地址&…

kafka大数据采集技术实验(未完待续)

Kafka环境搭建 下载地址:https://link.zhihu.com/?targethttps%3A//kafka.apache.org/downloads解压启动zookeeper bin/zookeeper-server-start.sh config/zookeeper.properties需要注意的是 : " c o n f i g / z o o k e e p e r . p r o p e r t i e s &q…

维态思(上海)环保科技有限公司 | 2024全国水科技大会暨技术装备成果展览会

嘉宾简介 胡建龙 维态思(上海)环保科技有限公司 总经理 报告题目:微生态滤床 植物工厂——小城镇生活污水生态净化及零排放案例分享 国家注册设备工程师(给排水)、上海市(合作交流)五四青年…

BUUCTF---misc---[ACTF新生赛2020]outguess

1、下载附件,解压之后得到下面信息 2、查看图片属性,发现有个核心价值观编码;解码为abc 3、flag.txt提示 4、结合题目,这是一个outguess隐写 5、用kali先下载安装隐写库 6、使用命令-k(密钥);-r(将图片里面的隐写信息…

InstantMesh:利用稀疏视图大规模重建模型从单张图像高效生成3D网格

作者:Jiale Xu,Weihao Cheng,Yiming Gao等 编译:东岸因为一点人工一点智能 InstantMesh:利用稀疏视图大规模重建模型从单张图像高效生成3D网格在这项工作中,我们提出了InstantMesh,一个开源的…

免费在英伟达官网使用多个开源AI大模型

英伟达官网能体验到多个聊天AI和图片生成AI,不废话直接上链接 AI开源大模型(https://build.nvidia.com/explore/discover?api-keytrue) 开源的AI大模型有meta的llama3-8b和llama3-70b、snowflake的arctic、microsoft的phi-3-mini、mistral…

【Linux系统编程】第九弹---权限管理操作(下)

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】【Linux系统编程】 目录 1、目录权限 2、粘滞位 总结 1、目录权限 首先提出一个问题,删除一个文件需要什么权限呢?&#xff1f…

虚拟机软件哪个好用 虚拟机软件哪个可以玩暗区突围 虚拟机软件排名 PD19虚拟机 Mac类虚拟机运行Windows程序 CrossOver支持的热门游戏

随着跨系统互联的需求不断增长,越来越多的用户会选择在电脑系统中安装虚拟机软件,进而更加便捷地访问和操作其他系统。一款好用的虚拟机软件能够提高系统互联的效率,进而实现了资源共享、测试环境搭建等多种用途。而在众多的虚拟机软件当中&a…

张驰咨询:降本增效企业突破市场重围的制胜法宝

企业在快速发展的过程中,降本增效是永恒不变的主题。毕竟,在竞争激烈的市场环境中,只有不断提高效率和降低成本,才能在竞争中立于不败之地。那么,为什么企业需要降本增效呢? 首先,降本增效是企业…

vue+springboot的登录图片验证码(前端对接报错)

tip:这个只是一个效果实际要运用,还是需要改改滴! 后台Java自带的 本来我是打算用第三方库的,没有整出来,就跟沈某人说不会来着,他说最好用Java自带的, 不然换个系统第三方的就不能用了,大概…

不可以论文查重,也包含了查AI率吗?

临近毕业,完成一篇符合学术规范的毕业论文是一项繁琐又具挑战性的任务。撰写完论文后,反复的查重降重已让人心身疲累。今年,学校又提出了新要求,论文还需要通过AIGC检测系统(www.checkaigc.com)才行&#x…

Vue2学习笔记(尚硅谷天禹老师)

目录 一、入门案例 二、模板语法 三、数据绑定 四、el和data的两种写法 五、MVVM模型 六、Object.defineproperty方法 七、Vue中响应式原理 八、数据代理 九、methods配置项 十、Vue中的事件处理 十一、Vue中的键盘事件 十二、计算属性 十三、监视属性watch 十四、绑定Class样式…

【echarts】数据起点不从X轴的原点开始【不从0开始】

echarts折线图x轴不从0开始怎么办? 或者说为什么有些图是这样的 有些却是这样的 原因出在这里: boundaryGap: false 默认是true,是指坐标轴两边留白。改为false:不留白即从原点开始。 看一下官方的说明

中小型企业网络实战topo

1、设备命名,务必按照规范进行命名规划; 2、子网划分,申请到了公网地址段,201.1.1.0/24,根据公司的实际情况,合理规划拓扑需要的公网地址, 做到合理规划不浪费; 3、子网划分&a…

嵌入式开发学习--进程、线程

什么是进程 进程和程序的区别 概念 程序:编译好的可执行文件,存放在磁盘上的指令和数据的有序集合(文件),程序是静态的,没有任何执行的概念。 进程:一个独立的可调度的任务,执行一…

做抖音小店如何选品?这几个技巧,精准“锁定”爆品!

哈喽~我是电商月月 做抖音小店最重要的就是选品,这点大家都知道 一个店铺商品选的好,顾客喜欢,质量完好,销量和售后都不用操心,和达人合作时,爆单的机会也就越高 那这种商品是什么样的,新手开…

基于ssm微信小程序的4S店客户管理系统

采用技术 基于ssm微信小程序的4S店客户管理系统的设计与实现~ 开发语言:Java 数据库:MySQL 技术:SpringMVCMyBatis 工具:IDEA/Ecilpse、Navicat、Maven 页面展示效果 管理员端 管理员登录 管理员首页 用户管理 门店管理 …

RustGUI学习(iced)之小部件(一):如何使用按钮和文本标签部件

前言 本专栏是学习Rust的GUI库iced的合集,将介绍iced涉及的各个小部件分别介绍,最后会汇总为一个总的程序。 iced是RustGUI中比较强大的一个,目前处于发展中(即版本可能会改变),本专栏基于版本0.12.1. 概述…

高效一键改写文章,智能伪原创工具轻松搞定

在信息爆炸的时代,想要高效率的一键改写文章却是很多创作者都想了解的方法。然而在人工智能技术发展的今天,智能伪原创工具的出现,也正是成了广大创作者用来一键改写文章的好方法,因为它的优势,可以为大家轻松完成改写…

光伏二次设备主要有哪些

光伏电站二次设备类型比较多,信息显示、数据安全、远动通信、电能质量、微机保护等都有不同设备相互配合完成,根据项目具体需求来选择,简单可以分为以下几种: 一、光伏二次设备保护屏: 1、光伏二次设备预制舱 二次设…