使用百度开发者平台处理语音朗读

--TIME

--百度开发者中心-汇聚、开放、助力、共赢

--注册账号

 -- 准备工作

准备工作

更新时间:2023-01-13

成为开发者

三步完成账号的基本注册与认证:

STEP1:点击进入控制台,选择需要使用的AI服务项。若为未登录状态,将跳转至登录界面,请您使用百度账号登录。如还未持有百度账户,可以点击此处注册百度账号。

STEP2:首次使用,登录后将会进入开发者认证页面,请填写相关信息完成开发者认证。注:(如您之前已经是百度云用户或百度开发者中心用户,此步可略过。)

STEP3:通过控制台左侧导航,选择语音技术,进入语音技术的控制面板,进行相关操作。

BB4979E6-CF98-4639-BFAE-696361D6EE1F.JPG

领取免费额度

新用户使用语音技术可以在控制台领取相应接口的免费测试额度进行接口调用,免费额度有效期自领取成功之日开始计算,有效期截止后,免费调用额度清零。详情可点击此处查看 语音识别免费额度 | 语音合成免费额度 | 呼叫中心语音免费额度。

微信截图_20221130182012.png

创建应用

您需要创建应用才可正式调用语音技术能力,应用是您调用服务的基本操作单元,您可以基于应用创建成功后获取的API Key及Secret Key,进行接口调用操作,及相关配置。您可按照下图所示的操作流程,完成创建操作。

微信截图_20221130182124.png

微信截图_20221130182151.png

应用名称: 用于标识您所创建的应用的名称,支持中英文、数字、下划线及中横线,此名称一经创建完毕,不可修改。

接口选择: 每个应用可以勾选业务所需的所有AI服务的接口权限(仅可勾选具备免费试用权限的接口能力),语音技术下全部接口已默认勾选,创建应用完毕,此应用即具备了所勾选服务的调用权限。

语音包名:如果您需要使用语音技术SDK服务(iOS/Android),需要绑定包名信息,以便生成授权License。

应用归属:可选择个人使用或公司使用服务,若为公司使用,可与专属商务经理沟通,获取专业的售前支持。

应用描述: 对此应用的业务场景进行描述。

获取密钥

在您创建完毕应用后,平台将会分配给您此应用的相关凭证,主要为AppID、API Key、Secret Key。以上三个信息是您应用实际开发的主要凭证,请您妥善保管。下图为示例内容:

image.png

生成签名

您需要使用创建应用所分配到的AppID、API Key及Secret Key,进行Access Token(用户身份验证和授权的凭证)的生成,方法详见 Access Token获取,我们为您准备了几种常见语言的请求示例代码。

温馨提示:Access Token的有效期为30天(以秒为单位),请您集成时注意在程序中定期请求新的token。

启动开发

目前语音技术主要有两种方式使用:API与SDK,您可以选择各产品的文档,查看具体使用方法及参数。详情可点击此处查看 语音识别导览 | 语音合成导览 | 呼叫中心语音导览。

 

如何用可视化工具调用

更新时间:2023-01-13

如何使用 Postman 调用语音技术服务 API

本文提供了通过可视化工具 Postman 调用短文本语音合成 API 的样例,帮助您零编码快速体验并熟悉语音技术服务。

1. 下载并安装接口调用工具

1.1 下载接口调用工具 — Postman

下载地址如下:

Mac 下载地址,点击前往>>

Windows 下载地址,点击前往>>

1.2 Postman 安装教程

(1)双击安装包。

(2)初次登录无账号,可直接进入 postman 主界面。

2. 获取 Access Token

将请求格式改为 “POST” 并填写请求地址:https://aip.baidubce.com/oauth/2.0/token

微信截图_20221130185421.png

点击 Body,选择“x-www-form-urlencoded”,在 key 和 value 中分别输入以下3个请求参数。

grant_type: 必须参数,固定为 client_credentials

client_id: 必须参数,应用的 API Key

client_secret: 必须参数,应用的 Secret Key

微信截图_20221130185459.png

点击右上角蓝色“send”,即可在下方返回值区域中获取 access_token。

微信截图_20221130185603.png

3. 进行接口调用

3.1 接口调用 具体操作如下:

(1) 将请求格式改为 “POST” 并填写请求地址(以短文本语音合成为例):https://tsn.baidu.com/text2audio

微信截图_20221130190152.png

(2)点击 Body,选择“x-www-form-urlencoded”,在 key 和 value 中分别输入以下请求参数。

tex: 必须参数,合成文本

tok: 必须参数,获取到的access_token参数

cuid: 必须参数,用户唯一标识

ctp: 必须参数,客户端类型选择,web端填写固定值 1

lan: 必须参数,固定值 zh

(更多参数请到短文本语音合成页面查看)

微信截图_20221130190448.png

(3) 修改请求头,点击 Headers,在 key 和 value 中分别输入1个请求参数。

key 栏输入:Content-Type

value 栏输入:application/x-www-form-urlencoded

微信截图_20221130190958.png

(4)点击右上角蓝色“send”,即可在下方返回值区域中获取音频。

微信截图_20221130190455.png

语音识别SDK

更新时间:2023-01-13

Android SDK快速集成指南

只需四步,即可完成语音识别SDK的应用集成,让您的应用获得稳定一致的识别体验。

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音识别应用。

1. 创建帐户

先点击此处注册百度账户,快速建立一个百度账号,请参考下图: 

屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

创建APP1.png

创建应用时请务必输入应用名称、语音包名(输入示例demo包名:com.baidu.speech.recognizerdemo)等信息,创建完成后就可以看到创建的应用信息了:

创建APP2.png

创建完成的应用信息如下图所示:

APP3.png

Step2:申请语音识别额度

1. 实名认证

语音识别SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成实名认证的用户可以领取免费额度。如下图所示进行实名认证: 

实名认证.png

2. 领取免费额度

完成实名认证后,需领取语音识别的免费额度。如下图所示:

领取免费额度.png

Step3:下载语音识别SDK,填写授权信息

1. 获取鉴权信息

准备好创建应用后获取到的3个鉴权信息,AppID、API Key、Secret Key,需要您登陆控制台查看应用详情获取。

2. 下载语音识别SDK

在SDK下载页面下载 语音识别Android SDK 文件,链接:SDK下载_文字识别SDK_语音识别SDK-百度AI开放平台

3. 不修改SDK,直接运行

解压sdk文件,不做任何修改,直接安装运行程序可以看到以下界面:

安卓修改1.png

4. 填写鉴权信息

填入 AppID、API Key、Secret Key 3个鉴权信息测试,请按照以下步骤全部修改:

修改参数.JPG

Step4: 测试语音识别功能

1. 按照上述文档修改完成后,安装app打开后进入在线识别,点击开始录音可进行在线语音识别:

安卓修改2.png

简单的 语音识别Android SDK 测试完成了,其他各子功能可以按照详细的技术文档进行集成。


 

iOS SDK快速集成指南

只需四步,即可完成语音识别SDK的应用集成,让您的应用获得稳定一致的识别体验。

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音识别应用。

1. 创建帐户

先点击此处注册百度账户,快速建立一个百度账号,请参考下图: 

屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

创建APP1.png

创建应用时请务必输入应用名称、语音包名(输入示例demo包名:com.baidu.speech.BDSClientSample)等信息,创建完成后就可以看到创建的应用信息了:

ios包名创建.png

创建完成的应用信息如下图所示:

iosapp2.png

Step2:申请语音识别额度

1. 实名认证

语音识别SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成实名认证的用户可以领取免费额度。如下图所示进行实名认证: 

实名认证.png

2. 领取免费额度

完成实名认证后,需领取语音识别的免费额度。如下图所示:

领取免费额度.png

Step3:下载语音识别SDK,填写授权信息

1. 获取鉴权信息

准备好创建应用后获取到的3个鉴权信息,AppID、API Key、Secret Key,需要您登陆控制台查看应用详情获取

2. 下载语音识别SDK

在SDK下载页面下载 语音识别IOS SDK 文件,链接:SDK下载_文字识别SDK_语音识别SDK-百度AI开放平台

3. 填写鉴权信息

填入 AppID、API Key、Secret Key 3个鉴权信息测试,请按照以下步骤全部修改:

IOS鉴权修改.png

Step4: 测试语音识别功能

1. 按照上述文档修改完成后,安装app打开后可进行在线语音识别:

ios识别.png

简单的 语音识别IOS SDK 测试完成了,其他各子功能可以按照详细的技术文档进行集成。

 

百度AI开放平台 语音文档~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/216705.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

笔记-模拟角频率和数字角频率的关系理解

先建议阅读前人此文(点击这里),有助于理解。 模拟频率:f 模拟角频率:Ω 数字角频率:ω 其中:在模拟信号中Ω 2πf 正弦波表示:sin(2πft) sin(Ωt) 数字信号就是离散的&#xff…

【动态规划】LeetCode-198/LCR089.打家劫舍

🎈算法那些事专栏说明:这是一个记录刷题日常的专栏,每个文章标题前都会写明这道题使用的算法。专栏每日计划至少更新1道题目,在这立下Flag🚩 🏠个人主页:Jammingpro 📕专栏链接&…

整数和浮点数在内存中的存储

文章目录 每日一言整数在内存中的存储方式浮点数在内存中的存储结语 每日一言 You just can’t beat the person who never gives up. 你无法打败那位永不放弃的人。 整数在内存中的存储方式 整数在内存中的存储方式通常采用二进制形式,即将整数的数值转化为二进制…

笔记66:自注意力和位置编码

本地笔记地址:D:\work_file\(4)DeepLearning_Learning\03_个人笔记\3.循环神经网络\第10章:动手学深度学习~注意力机制 a a a a a a a a a a a a a a a a a a a

3D Web可视化平台助力Aras开发PLM系统:提供数据访问、可视化和发布功能

HOOPS中文网慧都科技是HOOPS全套产品中国地区指定授权经销商,提供3D软件开发工具HOOPS售卖、试用、中文试用指导服务、中文技术支持。http://techsoft3d.evget.com/ Aras是一个面向数字化工业应用的开放性平台,帮助世界领先的复杂互联产品制造商转变其产…

项目管理实践:如何进行项目分解?

项目管理是一个复杂的工程,作为项目管理者,项目经理应该有着统筹管理项目全局的能力。 创建一个项目计划可分为四步: 1、明确项目目标 项目在成立或创建之初就要有清晰明确的目标; 项目达到什么目的? 项目目标是…

CleanMyMac X2024破解注册激活码

CleanMyMac X for Mac中文2024版只需两个简单步骤就可以把系统里那些乱七八糟的无用文件统统清理掉,节省宝贵的磁盘空间。 cleanmymac x个人认为X代表界面上的最大升级,功能方面有更多增加,与最新macOS系统更加兼容,流畅地与系统性…

linux 命令 tmux 用法详解

一、tmux 解决的痛点(screen命令一样可以解决,但是tmux功能更强大) 痛点一:大数据传输的漫长一夜 相信做过 Linux 服务运维的同学,都用 scp 进行过服务器间的大文件网络传输。一般这需要很长的时间,这期间…

用Python创建日历详细指南与实用示例

更多Python学习内容:ipengtao.com 大家好,我是彭涛,今天为大家分享 用Python创建日历详细指南与实用示例,全文4800字,阅读大约15分钟。 在日常生活和工作中,创建和管理日历是一项关键任务。Python提供了丰富…

刷题系列——排序算法

参考:README - 十大经典排序算法 1)排序算法分为内部外部排序两种,这个之前并不了解,外部排序需要访问外存的这个就是指需要额外内存比如另一个list或者dict存储中间结果。 2)稳定性:排序后 2 个相等键值…

DFT新手教程:VASP中ISIF取值设置

新手初学VASP计算时首先接触到的就是结构优化的计算任务。 在结构优化中,INCAR中的关键参数包括 IBRION ,NSW,ISIF,EDIFF和EDIFFG 各个参数均可在vaspwiki查到可设置的参数以及该参数所具有的设置的含义。 https://www.vasp.at/…

Shopify二次开发之三:liquid语法学习(访问Objects和Schema数据模型)

目录 Objects (对象) 全局对象 all_products:商店中所有的商品 articles: 商店中的所有文章 collections:商店中所有的集合 模板对象 在product.json(配置的section中) 访问product对象 在collection.json中可…

软著项目推荐 深度学习的口罩佩戴检测 - opencv 卷积神经网络 机器视觉 深度学习

文章目录 0 简介1 课题背景🚩 2 口罩佩戴算法实现2.1 YOLO 模型概览2.2 YOLOv32.3 YOLO 口罩佩戴检测实现数据集 2.4 实现代码2.5 检测效果 3 口罩佩戴检测算法评价指标3.1 准确率(Accuracy)3.2 精确率(Precision)和召回率(Recall)3.3 平均精…

span标签点击去掉光标

很简单,一行样式搞定 caret-color: transparent;

python获取阿里云云解析dns的域名解析记录

最近由于工作原因接触到阿里云的服务,我需要实时获取所有的域名信息,用于对其进行扫描,因此写了一个自动化爬取脚本 给需要的人分享。 (阿里云有官方的demo,有兴趣的可以自己看一下,后面也会放链接&#xf…

【axios】拦截器:axios.interceptors.request.use|axios.interceptors.response.use

文章目录 概述设置拦截器Axios 拦截器的实现任务注册任务编排任务调度 来源 概述 axios有请求拦截器(request)、响应拦截器(response)、axios自定义回调处理(这里就是我们常用的地方,会将成功和失败的回调…

小红书种草笔记多少钱?给大家揭秘

小红书,一个以生活方式分享为主题的社交电商平台,吸引了众多年轻用户。种草笔记,是指用户在小红书上分享的关于某一产品或服务的使用体验、心得感悟,通过图文并茂的形式,激发其他用户的好奇心和购买欲望,从…

ssm农业信息管理系统源码和论文

摘 要 网络的广泛应用给生活带来了十分的便利。所以把农业信息管理与现在网络相结合,利用java技术建设农业信息管理系统,实现农业信息管理的信息化。则对于进一步提高农业信息管理发展,丰富农业信息管理经验能起到不少的促进作用。 农业信息…

学习使用三个命令实现在腾讯云服务器TencentOS Server 3.1或者CentOS 8上安装ffmpeg

学习使用三个命令实现在腾讯云服务器TencentOS Server 3.1或者CentOS 8上安装ffmpeg Error: Unable to find a match: ffmpeg添加RPMfusion仓库安装SDL安装ffmpeg执行命令测试 Error: Unable to find a match: ffmpeg 添加RPMfusion仓库 yum install https://download1.rpmfus…

HTTP 和 HTTPS的区别

一、HTTP 1.明文传输,不安全 2.默认端口号:80 3.TCP三次握手即可 二、HTTPS 1.加密传输,更安全(在HTTP层与TCP层之间加上了SSL/TTL安全协议) SSL和TTL是在不同时期的两种叫法,含义相同。 2.默认端口号:443 3.TCP三…