whisper 实现语音识别 ASR - python 实现

        语音识别(Speech Recognition),同时称为自动语音识别(英语:Automatic Speech Recognition, ASR),将语音音频转换为文字的技术。

        whisper是一个通用的语音识别模型,由OpenAI公司开发。

whisper 模型相关参数如下:

安装对应的 python 库:

pip install openai-whisper

对应示例音频下载地址:【免费】whisper实现语音识别ASR-python实现音频示例资源-CSDN文库

代码实现如下:

* 另外注意 whisper 语音识别的文本输出可能是繁体中文,可以通过opencc库转为简体中文,以下代码也有具体实现。

import whisper
import opencc
# available models = ['tiny.en', 'tiny', 'base.en', 'base', 'small.en', 'small', 'medium.en', 'medium', 'large-v1', 'large-v2', 'large-v3', 'large']
cache_dir = "./whisper_ckpt/" # 模型缓存地址
model = whisper.load_model("medium",download_root = cache_dir)
result = model.transcribe("test.wav")
# print("result:",result)
print("language:",result["language"])# 识别语种
print("text:",result["text"])# 整句识别内容

m_cc = opencc.OpenCC('t2s') # 繁体转为简体中文
# 依据句子分割进行逐句打印
for ii in range(len(result["segments"])):
    m_ = result["segments"][ii]
    m_text = m_["text"]
    #----------------------
    m_text = m_cc.convert(m_text)
    print(" [{}] {}".format(ii,m_text))

对应的log:

language: zh
text: 尖銳的槍聲打破了寧靜的鹽黃國西部邊垂原始森林天高雲淡 清風吹綠茂密的原始森林一處懸崖斷壁上悄悄探出了一老一少兩顆頭 顱來警惕地打量著四周老的慈眉善目有些先鋒道骨的味道少年有黑俊朗的臉龐上一對黑白分明的眼珠透著好奇和冷靜一切又恢復平靜彷彿剛才什麼都沒發生只有參田的大樹發出沙沙的聲響被驚奇的鳥又飛回樹叢
 [0] 尖锐的枪声打破了宁静的盐黄国西部边垂原始森林
 [1] 天高云淡 清风吹绿
 [2] 茂密的原始森林一处悬崖断壁上
 [3] 悄悄探出了一老一少两颗头颅来
 [4] 警惕地打量著四周
 [5] 老的慈眉善目
 [6] 有些先锋道骨的味道
 [7] 少年有黑
 [8] 俊朗的脸庞上
 [9] 一对黑白分明的眼珠透著好奇和冷静
 [10] 一切又恢复平静
 [11] 仿佛刚才什么都没发生
 [12] 只有参田的大树发出沙沙的声响
 [13] 被惊奇的鸟又飞回树丛

 

助力快速掌握数据集的信息和使用方式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/888130.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Spring】“请求“ 之后端传参重命名,传递数组、集合,@PathVariable,@RequestPart

1. 后端传参重命名(后端参数映射) 某些特殊情况下,前端传递的参数 key 和我们后端接收的 key 可以不一致,比如前端传了一个 time 给后端,而后端是使用 createtime 字段来接收的,这样就会出现参数接收不到的…

【新人系列】Python 入门(一):介绍及环境搭建

✍ 个人博客:https://blog.csdn.net/Newin2020?typeblog 📝 专栏地址:https://blog.csdn.net/newin2020/category_12801353.html 📣 专栏定位:为 0 基础刚入门 Python 的小伙伴提供详细的讲解,也欢迎大佬们…

Python数据分析-远程办公与心理健康分析

一、研究背景 随着信息技术的飞速发展和全球化的推进,远程工作(Remote Work)成为越来越多企业和员工的选择。尤其是在2020年新冠疫情(COVID-19)爆发后,全球范围内的封锁措施使得远程工作模式迅速普及。根据…

【AIGC】ChatGPT提示词Prompt高效编写模式:结构化Prompt、提示词生成器与单样本/少样本提示

博客主页: [小ᶻZ࿆] 本文专栏: AIGC | ChatGPT 文章目录 💯前言💯结构化Prompt (Structured Prompt)组成元素应用实例优势结论 💯提示词生成器 (Prompt Creator)如何工作应用实例优势结论 💯单样本/少样本提示 (O…

(贪心) 反悔贪心之反悔堆

文章目录 ⭐例题🚩题意与思路 ⭐返回贪心🚩原理(反悔池)🚩落实到题🚩AC code ⭐练习题⭐END🌟交流方式 ⭐例题 经典例题: 871. 最低加油次数 🚩题意与思路 题意&#xf…

Microsoft 更新 Copilot AI,未來將能使用語音並看到你瀏覽的網頁

不過受到 Recall 事件的影響,更新的推出將更緩慢謹慎。 Microsoft 也同步對其網頁版及行動版的 Copilot AI 進行大改版。這主要是為網頁版換上了一個較為簡單乾淨的介面,並增加了一些新的功能,像是 Copilot Voice 能讓你與 AI 助手進行對話式…

IDEA:增加类注释模板和方法注释模板

文章目录 概要配置类注释模板配置方法模版 概要 配置类注释和方法注释 配置类注释模板 点击setting->Editor->File and Code Templates,然后找到Class,如下图: 注意勾掉Reformat according to style,否则会格式化。 注…

51单片机的水位检测系统【proteus仿真+程序+报告+原理图+演示视频】

1、主要功能 该系统由AT89C51/STC89C52单片机LCD1602显示模块水位传感器继电器LED、按键和蜂鸣器等模块构成。适用于水位监测、水位控制、水位检测相似项目。 可实现功能: 1、LCD1602实时显示水位高度 2、水位传感器采集水位高度 3、按键可设置水位的下限 4、按键可手动加…

指针(7)

目录 1. sizeof和strlen的对⽐ 1.1 sizeof 1.2 strlen sizeof 和 strlen 总结: 2. 数组和指针 2.1 ⼀维数组 2.2 字符数组 1. sizeof和strlen的对⽐ 1.1 sizeof 计算的是使⽤类型创建的变量所占内存空间的⼤⼩。sizeof不在乎你里面放的什么。sizieof是操作符…

设计模式~~~

简单工厂模式(静态工厂模式) 工厂方法模式 抽象工厂角色 具体工厂角色

王者农药更新版

GPIO简介 STM32开发板有5组GPIO引脚,分别是GPIOA,GPIOB,GPIOC,GPIOD,GPIOE,每组GPIO有16个引脚。 每个引脚都有4个位来配置其端口,可以配置出不同的输入\输出模式。 1、普通推挽输出(GPIO_Mode_Out_PP): 使用场合&…

在不支持WSL2的Windows环境下安装Redis并添加环境变量的方法

如果系统版本支持 WSL 2 可跳过本教程。使用官网提供的教程即可 官网教程 查看是否支持 WSL 2 如果不支持或者觉得麻烦可以按照下面的方式安装 下载 点击打开下载地址 下载 zip 文件即可 安装 将下载的 zip 文件解压到自己想要解压的地方即可。(注意&#x…

sqli-labs less-17密码重置报错注入

密码重置报错植入 来到首页面我们看到页面提示【password reset】,说明这是更改密码的注入,也就是说我们知道一个账户名,修改他的密码,所以我们可以在passwd处进行注入。 闭合方式 添加单引号 有报错 可以知道闭合方式为单引号…

Leetcode—76. 最小覆盖子串【困难】

2024每日刷题&#xff08;167&#xff09; Leetcode—76. 最小覆盖子串 C实现代码 class Solution { public:string minWindow(string s, string t) {int bestL -1;int l 0, r 0;vector<int> cnt(128);for(const char c: t) {cnt[c];}int require t.length();int m…

OJ在线评测系统 微服务 用分布式消息队列 RabbitMQ 解耦判题服务和题目服务 手搓交换机和队列 实现项目异步化

消息队列解耦 项目异步化 分布式消息队列 分布式消息队列是一种用于异步通信的系统&#xff0c;它允许不同的应用程序或服务之间传递消息。消息队列的核心理念是将消息存储在一个队列中&#xff0c;发送方可以将消息发送到队列&#xff0c;而接收方则可以在适当的时候从队列中…

安卓如何实现双击触摸唤醒点亮屏幕功能-Android framework实战开发

背景 经常有学员朋友在群里问到一个目前市场上常见的功能&#xff1a; 手机待机时候双击屏幕可以唤醒点亮手机屏幕功能 如何实现这个功能&#xff0c;经常有同学在群里求助&#xff0c;今天就刚好来讨论一下这个待机时候双击触摸唤醒点亮屏幕的功能的实现方案。 功能核心方案设…

【微服务】服务注册与发现 - Eureka(day3)

CAP理论 P是分区容错性。简单来说&#xff0c;分区容错性表示分布式服务中一个节点挂掉了&#xff0c;并不影响其他节点对外提供服务。也就是一台服务器出错了&#xff0c;仍然可以对外进行响应&#xff0c;不会因为某一台服务器出错而导致所有的请求都无法响应。综上所述&…

dwceqos网络驱动性能优化

文章介绍 本文会分享一些在QNX系统下对io-pkt-v6-hc驱动模块cpu loading过高问题优化的经验&#xff0c;以及一些调优debug的方法。这些优化措施实施之后可以降低io-pkt-v6-hc在高负载的情况下的cpu loading。本文的调优是基于synopsys公司的dwceqos模块&#xff0c;理论上方法…

【Android 源码分析】Activity生命周期之onPause

忽然有一天&#xff0c;我想要做一件事&#xff1a;去代码中去验证那些曾经被“灌输”的理论。                                                                                  – 服装…

【STM32 HAL库】MPU6050 DMP库移植 与 自检失败的处理

【STM32 HAL库】MPU6050 DMP库移植 与 自检失败的处理 本文参考移植步骤文件配置代码修改inv_mpu.cinv_mpu.hinv_mpu_dmp_motion_driver.c 使用 自检失败怎么处理ret -1改正DEBUG过程 ret -9改正DEBUG过程 本文参考 B站 CSDN 移植步骤 文件配置 新建一个 dmp 文件夹 并将…