【开源项目】自动字幕生成和字幕翻译

文章目录

  • 1. 安装ffmpeg
  • 2. 克隆项目
  • 3. 配置项目运行环境
  • 4. 填写配置文件
  • 5. 运行项目(仅使用CPU)

项目地址:Github - qinL-cdy/auto_ai_subtitle
项目原理:使用ffmpeg提取视频的音频,使用whisper将音频转写为字幕,使用translate将源语言字幕翻译成目标语言字幕。
说明:translate API免费1000行(行宽70字符),超出需要付费购买API

1. 安装ffmpeg

  • 下载构建好的ffmpeg。Windows版本下载。
  • 用7-zip解压文件,将解压目录下的bin目录对应的路径添加到环境变量
    • 在搜索框中搜索环境变量 > 编辑系统环境变量 > 环境变量 > 系统变量 > Path
    • 将bin目录对应的路径添加到Path中
  • win + R启动运行,输入cmd,在命令提示符中输入以下命令,出现下图所示内容即配置成功。
    ffmpeg -version
    

在这里插入图片描述

2. 克隆项目

  • 打开VSCode,点击Clone Git Repository ...。选择克隆的目标文件夹,克隆完成后打开文件夹。
    在这里插入图片描述

3. 配置项目运行环境

  • 使用conda创建虚拟环境(安装Anaconda、conda换源、pip换源可以去搜索)
    • 启动Anaconda Prompt
    • 输入以下命令创建虚拟环境
    conda create -n auto_ai_subtitle python=3.9 -y
    
    • 激活虚拟环境
    	conda activate auto_ai_subtitle
    
  • VSCode选择虚拟环境
    在这里插入图片描述
  • 右键main.py,点击打开集成终端,输入以下命令安装第三方库。
pip install -r requirements.txt

4. 填写配置文件

打开config.yaml,可以根据自己的实际情况设置相应的参数。

  • 语言简称参照链接后两位字母转小写。
  • 路径中不能有中文
    在这里插入图片描述

5. 运行项目(仅使用CPU)

  • 修改script/audio_tool.py为以下内容:
import ffmpeg
import subprocess

def audio_extract(input, output):
	ffmpeg.input(input, vn=None).output(output).run()

# 解决中文路径ffmpeg无法运行的问题
# def audio_extract(input_path, output_path):
# 	command = [
# 		'ffmpeg', 
# 		'-i', 'pipe:0',  # 从stdin读取输入
# 		'-vn',          # 仅提取音频
# 		output_path     # 输出文件路径
# 	]

# 	with open(input_path, 'rb') as f:
# 		subprocess.run(command, input=f.read())
  • 修改script/whisper_tool.py,添加verbose=True能显示转写过程。
    在这里插入图片描述

  • 在集成终端输入以下命令:

python main.py
  • 运行过程中出现以下警告可以忽略,因为默认使用FP16,但是CPU不支持FP16,程序自动会改成FP32。
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/418957.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

WebService 配置与操作

WebService操作配置 本人idea 2020.3版本,会有毛病。 场景:内网环境 内网环境会导致测试麻烦,所以打个demo包给现场测试是否跑通 环境:Springboot项目 添加WebService ok会加载出来 2020.3版本会关了,找不到这窗口 可以以下…

白酒:酿造过程中的微生物群落结构与功能解析

在豪迈白酒的酿造过程中,微生物群落的结构与功能起着至关重要的作用。这些肉眼难以察觉的小生物在白酒的香气、口感和品质形成中扮演着重要角色。云仓酒庄在酿造过程中对微生物群落的结构与功能进行了深入研究与解析,旨在更好地了解和控制微生物群落&…

DVWA 靶场 SQL 注入报错 Illegal mix of collations for operation ‘UNION‘ 的解决方案

在 dvwa 靶场进行联合 SQL 注入时,遇到报错 Illegal mix of collations for operation UNION 报错如下图: 解决办法: 找到文件 MySQL.php 大致位置在 \dvwa\includes\DBMS 目录下 使用编辑器打开 检索 $create_db 第一个就是 在 {$_DVW…

TcpServer服务器管理模块(模块十)

目录 类功能 类定义 类实现 编译测试 server.cc gdb测试断点 忽略SIGPIPE信号 类功能 类定义 // TcpServer服务器管理模块(即全部模块的整合) class TcpServer { private:uint64_t _next_id; // 这是一个自动增长的连接IDint _port;i…

【详识JAVA语言】猜数字游戏

游戏规则: 系统自动生成一个随机整数(1-100), 然后由用户输入一个猜测的数字. 如果输入的数字比该随机数小, 提示 "低 了", 如果输入的数字比该随机数大, 提示 "高了" , 如果输入的数字和随机数相等, 则提示 "猜对了" . 参考代码 import java.…

Zynq—AD9238数据采集DDR3缓存千兆以太网发送实验(前导)

ACM9238 高速双通道ADC模块自助服务手册AD9238 Zynq—AD9238数据采集DDR3缓存千兆以太网发送实验(一)-CSDN博客 一、AD9238 模块在各方面参数性能上与AD9226保持一致。但是在设计上优化了信号调理电路,将单端信号先转成差分信号&#xff0c…

VS2015报错:error MSB8020和MSB8036的解决方案

VS2015编译报错:error MSB8020 提示信息:error MSB8020: The build tools for v141 (Platform Toolset ‘v141’) cannot be found. To build using the v141 build tools, please install v141 build tools. Alternatively, you may upgrade to the c…

租赁回收系统开发详细流程-干货分享

1.需求分析:首先,需要明确系统的功能和特点。这包括确定租赁回收的物品类型、用户群体、业务流程等。通过需求分析,可以确保系统能够满足市场和用户的需求。 2.系统设计:在需求分析的基础上,进行系统的整体设计。这包…

最新基于SWAT-MODFLOW地表水与地下水耦合技术应用

耦合模型被应用到很多科学和工程领域来改善模型的性能、效率和结果,SWAT作为一个地表水模型可以较好的模拟主要的水文过程,包括地表径流、降水、蒸发、风速、温度、渗流、侧向径流等,但是对于地下水部分的模拟相对粗糙,考虑到SWAT…

第十四篇【传奇开心果系列】Python的文本和语音相互转换库技术点案例示例:深度解读Azure Cognitive Services个性化推荐系统

传奇开心果博文系列 系列博文目录Python的文本和语音相互转换库技术点案例示例系列 博文目录前言一、个性化推荐系统介绍和关键功能以及优势解说二、雏形示例代码三、个性化推荐示例代码四、实时推荐示例代码五、多种推荐算法示例代码六、易于集成示例代码七、数据安全和隐私保…

腾讯云安装MYSQL远程连接不上解决方案

推荐安装步骤博客,写的很详细,如果不会安装的话,可以根据安装步骤一直走。 Windows10下超详细Mysql安装_win10安装mysql-CSDN博客 修改 my.cnf或者my.ini 找到里面bind-address将bind-address 127.0.0.1设置成bind-address 0.0.0.0&#x…

stm32触发硬件错误位置定位

1.背景 1. 项目中,调试过程或者测试中都会出现程序跑飞问题,这个时候问题特别难查找。 2. 触发硬件错误往往是因为内存错误。这种问题特别难查找,尤其是产品到了测试阶段,而这个异常复现又比较难的情况下,简直头疼。…

FaceBook获取广告数据

1、访问 广告管理工具 确认自己登陆的账号下面能看到户。 ​ 2、使用 图谱Api探索工具 生成用户短期口令 ​ 3、get请求(或者浏览器直接打开)访问: https://graph.facebook.com/v19.0/me?fieldsid,name, email&access_token{上一步生成的口令} ​ 4、短期…

MySQL 自增列解析(Auto_increment)

MySQL数据库为列提供了一种自增属性,当列被定义为自增时。Insert语句对该列即使不提供值,MySQL也会自动为该列生成递增的唯一标识,因此这个特性广泛用于主键的自动生成。 一、自增列的用法 自增列具有自动生成序列值,整型&#…

SpringBoot源码解读与原理分析(三十七)SpringBoot整合WebMvc(二)DispatcherServlet的工作全流程

文章目录 前言12.4 DispatcherServlet的工作全流程12.4.1 DispatcherServlet#service12.4.2 processRequest12.4.3 doService12.4.3.1 isIncludeRequest的判断12.4.3.2 FlashMapManager的设计 12.4.4 doDispatch12.4.4.1 处理文件上传请求12.4.4.2 获取可用的Handler&#xff0…

FPGA之进位逻辑

进位逻辑(Carry Logic)Slice 中除了LUT,寄存器,触发器,锁存器外,还提供了专用的快速超前进位逻辑,可以在slice 中执行快速算术加法和减法。CLB 中的专用进位逻辑提高了算术功能(如加…

【BBuf的CUDA笔记】十四,OpenAI Triton入门笔记三 FusedAttention

0x0. 前言 继续Triton的学习,这次来到 https://triton-lang.org/main/getting-started/tutorials/06-fused-attention.html 教程。也就是如何使用Triton来实现FlashAttention V2。对于FlashAttention和FlashAttention V2网上已经有非常多的介绍了,大家如…

PSO-CNN-LSTM多输入回归预测|粒子群算法优化的卷积-长短期神经网络回归预测(Matlab)——附代码数据

目录 一、程序及算法内容介绍: 基本内容: 亮点与优势: 二、实际运行效果: 三、算法介绍: 四、完整程序数据分享下载: 一、程序及算法内容介绍: 基本内容: 本代码基于Matlab平台…

羊大师揭秘,羊奶营养与健康的双重礼赞

羊大师揭秘,羊奶营养与健康的双重礼赞 羊奶,一种古老而珍贵的饮品,自古以来就以其独特的营养价值和健康益处受到人们的青睐。它不仅是滋养的源泉,更是健康的守护者,为我们带来营养与健康的双重礼赞。 羊奶的营养价值不…

通过css修改video标签的原生样式

通过css修改video标签的原生样式 描述实现结果 描述 修改video标签的原生样式 实现 在控制台中打开设置,勾选显示用户代理 shadow DOM,就可以审查video标签的内部样式了 箭头处标出来的就是shodow DOM的内容,这些内容正常不可见的&#x…