PHP对接百度语音识别技术

PHP对接百度语音识别技术

引言

在目前的各种应用场景中,语音识别技术已经越来越常用,并且其应用场景正在不断扩大。

百度提供的语音识别服务允许用户通过简单的接口调用,将语音内容转换为文本。

本文将通过PHP语言集成百度的语音识别服务,并分享一些实施过程中的技巧和需要注意的问题。

准备工作

1.注册百度开放平台账号

在百度官网https://open.baidu.com/ 注册一个账号

2.创建应用并获取API Key和Secret Key

注册完毕后,登录百度开放平台;

点击左侧菜单栏中的"AI开放平台";

然后选择"语音技术",再选择"语音识别"。

在语音识别页面中,点击"创建应用",填写相关信息并提交。

创建成功后,我们可以在应用管理页面中获得API Key和Secret Key;

这两个密钥将在后续中使用。

在这里插入图片描述

3.运行命令安装Laravel框架百度平台扩展包

composer require zhangyu-cq/laravel-baidu-aip

发布配置

php artisan vendor:publish --provider="ZhangyuCq\LaravelBaiduAip\BaiduAipServiceProvider"

配置对应的密钥

    return [
        'app_id' => env('BAIDU_APP_ID',''),
        'app_key' => env('BAIDU_APP_KEY',''),
        'app_secret' => env('BAIDU_APP_SECRET','')
    ];

封装百度语音识别接口

百度语音转文字

public function asrChar(Request $request)
    {
        $this->validate($request, [
            'file' => 'required',
        ]);
        $file = $request->file('file');
        $name = $file->getClientOriginalName();
        $file_info = pathinfo($name);
        $file = file_get_contents($file);
        $data = AipSpeech::asr($file, $file_info['extension'], 16000, ['dev_pid' => 1537]);
        if ($data['err_no'] == 0) {
            $text = $data['result'][0];
            echo $text;
        } else {
            echo '转译失败:'.$data['err_msg'];
        }
    }

百度文字转语音

    public function synthesis(Request $request)
    {
        $this->validate($request, [
            'content' => 'required',
        ]);
        $content = $request->get('content');
        $data = AipSpeech::synthesis($content, 'zh', 1, array(
            'vol' => 5,
        ));
        $time = date('YmdHis') . rand(111111, 999999);
        //设置上传到哪个目录下
        $path = '/uploads/synthesis';
        $file_name = "/$time.mp3";
        //没有则创建
        if (!file_exists(public_path() . $path)) {
            mkdir(public_path() . $path, 0755, true);
        }
        file_put_contents(public_path() . $path . $file_name, $data);
        echo '文件路径如下:'.$path . $file_name;
    }

踩坑日记

百度语音识别接口对音频文件有特定的要求:它仅接受16KHz采样率的wav格式文件。

如果需要识别的音频文件不符合这些要求,必须先转换成合适的格式和采样率。

此外,接口对音频的长度也有限制,单次识别不能超过60秒,因此长音频需要被分割成多个短片段。

在使用接口时,还需要注意错误处理:

通过检查返回结果中的err_no来判断识别是否成功,并根据err_msg字段来处理识别失败的情况。

结论

我们已经能够成功地集成PHP与百度语音识别接口,并根据接口返回的数据执行相应的操作。

在实际的开发过程中,我们还可以进一步扩展功能,例如实现实时的语音识别服务或语音合成技术,以满足更广泛的业务需求。

– 欢迎点赞、关注、转发、收藏【我码玄黄】,gonghao同名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/658398.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【链表】Leetcode 82. 删除排序链表中的重复元素 II【中等】

删除排序链表中的重复元素 II 给定一个已排序的链表的头 head , 删除原始链表中所有重复数字的节点,只留下不同的数字 。返回 已排序的链表 。 示例 1: 输入:head [1,2,3,3,4,4,5] 输出:[1,2,5] 解题思路 由于链表…

2024年5月份架构师考试真题完整版

截至2024-5-28 19:24:14已全部收录完成 共75到选择题,5道案例题,4道论文题。题目顺序不分先后。 全网最全的2024年5月份架构师考试真题回忆版,包含答案和解析。 群友 疯狂程序员 花落无声 半夏 鲁迅-三战老兵(预备役) 本次必成 锦鲤附体 2024…

【启程Golang之旅】掌握Go语言数组基础概念与实际应用

欢迎来到Golang的世界!在当今快节奏的软件开发领域,选择一种高效、简洁的编程语言至关重要。而在这方面,Golang(又称Go)无疑是一个备受瞩目的选择。在本文中,带领您探索Golang的世界,一步步地了…

Gradle的学习

1.1 Gradle的优势 一款最新的,功能最强大的构建工具,用它逼格更高 使用Groovy或Kotlin代替XML,使用程序代替传统的XML配置,项目构建更灵活 丰富的第三方插件,让你随心所欲使用 完善Android,Java开发技术体系 1.2 …

深入解析数据库中的连接方法:四种关键技巧

新书上架~👇全国包邮奥~ python实用小工具开发教程http://pythontoolsteach.com/3 欢迎关注我👆,收藏下次不迷路┗|`O′|┛ 嗷~~ 目录 一、连接方法的重要性 二、左连接(Left Join) 三、右连接&#xff…

C# yolov8 TensorRT Demo

C# yolov8 TensorRT Demo 目录 效果 说明 项目 代码 下载 效果 说明 环境 NVIDIA GeForce RTX 4060 Laptop GPU cuda12.1cudnn 8.8.1TensorRT-8.6.1.6 版本和我不一致的需要重新编译TensorRtExtern.dll,TensorRtExtern源码地址:https://githu…

【全开源】简单商城系统源码(PC/UniAPP)

提供PC版本、UniAPP版本(高级授权)、支持多规格商品、优惠券、积分兑换、快递鸟电子面单、支持移动端样式、统计报表等 提供全部前后台无加密源代码、数据库离线部署。 构建您的在线商店的基石 一、引言:为什么选择简单商城系统源码? 在数字化时代&am…

立创·天空星开发板-GD32F407VE-环境搭建

本文以 立创天空星开发板-GD32F407VET6-青春版 作为学习的板子,记录学习笔记。 立创天空星开发板-GD32F407VET6-环境搭建 单片机ARMARM内核系列Cortex-M系列常用ARM芯片厂商 GD32GD32的产品系列开发板开发板资源、尺寸标注图设计图纸 GD32F407 Keil ARM 安装下载地址…

浏览器下载的文件为什么不允许我指定下载位置

文章目录 问题分析 问题 我们在做B端开发时,通常会遇到用户问道:我下载的文件为什么不能下载到指定位置让我手动去选择呢 分析 我们开发是基于浏览器做的开发,因此要遵循浏览器的限制条件 浏览器限制用户自定义下载地址的主要原因是出于…

Autoware 技术代码解读(三)

Tip: 如果你在进行深度学习、自动驾驶、模型推理、微调或AI绘画出图等任务,并且需要GPU资源,可以考虑使用Compshare的GPU算力云平台。他们提供高性价比的4090 GPU,按时收费每卡2.6元,月卡只需要1.7元每小时,并附带200G…

Nacos 2.x 系列【12】配置加密插件

文章目录 1. 前言2. 安装插件2.1 编译2.2 客户端2.3 服务端 3. 测试 1. 前言 为保证用户敏感配置数据的安全,Nacos提供了配置加密的新特性。降低了用户使用的风险,也不需要再对配置进行单独的加密处理。 前提条件: 版本:老版本暂时不兼容&…

【最新区块链论文录用资讯】CCF A—INFOCOM 2024 共17篇

Conference:IEEE International Conference on Computer Communications CCF level:CCF A Categories:计算机网络 Year:2024 Num:17 A Generic Blockchain-based Steganography Framework with High Capacity via …

openssh升级

原因:因为低版本出现了漏洞 过程: 此时,root不能登录。 修改/etc/pam.d/login 第2行前面加上#,保存退出 /etc/pam.d/remote 第2行前面加上#,保存退出 此时root可以通过telnet登录了 二、升级openssl和openssh 【L…

校园周边美食探索及分享平台,基于 SpringBoot+Vue+MySQL 开发的前后端分离的校园周边美食探索及分享平台设计实现

目录 一. 前言 二. 功能模块 2.1. 前台首页功能模块 2.2. 用户功能模块 2.3. 管理员功能模块 三. 部分代码实现 四. 源码下载 一. 前言 美食一直是与人们日常生活息息相关的产业。传统的电话订餐或者到店消费已经不能适应市场发展的需求。随着网络的迅速崛起&#xff0…

深入分析 Android Activity (十一)

文章目录 深入分析 Android Activity (十一)1. Activity 的内存管理和优化1.1 内存泄漏的常见原因1.2 避免内存泄漏的方法1.3 内存泄漏检测工具 2. Activity 的配置变更处理2.1 处理配置变更2.2 保存和恢复状态2.3 使用 ViewModel 3. Activity 的测试3.1 单元测试3.2 UI 测试 4…

数据结构(三)栈 队列 数组

2024年5月26日一稿(王道P78) 栈 基本概念 基本操作 顺序存储结构 基本操作 共享栈 链式存储结构 队列 基本概念 顺序存储结构 循环队列 链式存储结构 基本操作 双端队列 栈和队列的应用 括号匹配 表达式求值 递归 层次遍历 计算机系统 数组和特殊矩阵…

绘唐app官方版绘唐3AI工具

绘唐app官方版绘唐3AI工具 激活授权方式:https://qvfbz6lhqnd.feishu.cn/wiki/CcaewIWnSiAFgokOwLycwi0Encf 绘唐app是一款基于人工智能和摄影技术的应用程序,旨在帮助用户将照片转化为唐朝画风的艺术作品。 该应用程序使用先进的图像处理算法&#xf…

上海亚商投顾:沪指冲高回落 电力、电网产业链持续爆发

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 一.市场情绪 沪指昨日震荡调整,深成指、创业板指均跌超1%。电力、电网股再度爆发,众智科技、郴电国…

「西安邀请媒体参会」媒体宣发专访报道

传媒如春雨,润物细无声,大家好,我是51媒体网胡老师。 一、媒体邀约目标 为提升活动的知名度和影响力,我们计划邀请西安地区的主流媒体、行业媒体以及网络媒体参与活动,并进行现场报道和专访。通过媒体的力量&#xff…

【云原生 | 59】Docker中通过docker-compose部署ELK

目录 1、组件介绍 2 、项目环境 2.1 各个环境版本 2.2 Docker-Compose变量配置 2.3 Docker-Compose服务配置 3、在Services中声明了四个服务 3.1 ElasticSearch服务 3.2 Logstash服务 3.3 Kibana服务 3.4 Filebeat服务 4、使用方法 4.1 方法一 4.2 方法二 5、启动…