文字转语音
Python语音合成之第三方库gTTs/pyttsx3/speech横评(内附使用方法)_python_脚本之家
代码示例
from gtts import gTTS
tts = gTTS('你好你在哪儿!',lang='zh-CN')
tts.save('hello.mp3')
import pyttsx3
engine = pyttsx3.init() #创建对象
"""语速"""
rate = engine.getProperty('rate') #获取当前语速的详细信息
print(rate) #打印当前语速
engine.setProperty('rate',200) #重设语速
engine.say('Hello world!')
engine.say('My current speaking rate is '+str(rate))
engine.runAndWait()
engine.stop()
engine.save_to_file('你好,世界!明天你要去哪儿玩','test.mp3')
engine.runAndWait()
相比之下gtts播报效果好一些,局限新大点,pyttsx3出了播报效果差点其他还行,灵活性比较好
语音转字幕,用的是whisper
whisper现有还不错的语音识别,里面有很多模型,看网上很多教程写的很杂,很蒙。此处简化操作。
import whisper
whisper_model = whisper.load_model("tiny")
result = whisper_model.transcribe(r"D:\xy_fs_try\video_to_deal\audio_realize\hello.mp3")
print(", ".join([i["text"] for i in result["segments"] if i is not None]))
此处需要安装ffmpeg ,不知道安装方法的自己去搜索。此处还有坑就是安装torch的问题,卸载原有的torch 安装一下命令即可
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118