TextToSpeech类学习和简单封装

TextToSpeech类简单学习封装

  • 前言
  • 一、TTS是什么?
  • 二、TextToSpeech简单使用
    • 1.官方介绍
    • 2.简单使用
  • 三、TextToSpeech简单封装
  • 总结


在这里插入图片描述

前言

业务涉及到对接TTS相关,所以简单学习下如何使用。


一、TTS是什么?

TextToSpeech简称为TTS,即从文本转语音,是人机对话的一部分,让机器能够说话。在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。TTS技术对文本文件进行实时转换,转换时间之短可以秒计算。在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。
安卓的TextToSpeech是Android平台上一个重要的系统功能,它能够将文本转换成可听的语音,为用户提供更加方便的交互体验。同时,作为开发者,我们也可以基于TextToSpeech实现一些有趣的应用程序。比如市面上一些小说的听书功能,就是基于TTS播报开发的。

二、TextToSpeech简单使用

1.官方介绍

在这里插入图片描述
我们翻译一下:
从文本中合成语音,以便立即播放或创建声音文件。

TextToSpeech 实例只能在完成初始化后用于合成文本。实现 TextToSpeech.OnInitListener 以通知初始化完成。
当您使用完TextToSpeech实例时,请调用shutdown()方法以释放TextToSpeech引擎使用的本机资源。使用文本到语音的应用程序的目标Android 11应声明TextToSpeech。然后要在清单文件做以下申明。

 <queries>
   ...
  <intent>
      <action android:name="android.intent.action.TTS_SERVICE" />
  </intent>
 </queries>

什么意思呢,就是使用之前要用queries标签在清单文件中声明TTS_SERVICE这个action,告诉你的app你要对tts进行通信,不要拦截你的tts引擎与你的app进行通信,我自己试的时候没有申请这个action也能访问,但是为了保险咱们还是加上哈。

2.简单使用

上面官方把使用方法都告诉我们了,我们来简单试一试。
清单文件是这个样子的:

<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:android="http://schemas.android.com/apk/res/android"
    xmlns:tools="http://schemas.android.com/tools">

    <application
        android:allowBackup="true"
        android:dataExtractionRules="@xml/data_extraction_rules"
        android:fullBackupContent="@xml/backup_rules"
        android:icon="@mipmap/ic_launcher"
        android:label="@string/app_name"
        android:roundIcon="@mipmap/ic_launcher_round"
        android:supportsRtl="true"
        android:theme="@style/Theme.TEST"
        tools:targetApi="31">
        <activity
            android:name=".MainActivity"
            android:exported="true">
            <intent-filter>
                <action android:name="android.intent.action.MAIN" />

                <category android:name="android.intent.category.LAUNCHER" />
            </intent-filter>
        </activity>
    </application>

    <queries>
        <intent>
            <action android:name="android.intent.action.TTS_SERVICE" />
        </intent>
    </queries>

</manifest>

布局文件是这个样子的:

<?xml version="1.0" encoding="utf-8"?>
<androidx.constraintlayout.widget.ConstraintLayout xmlns:android="http://schemas.android.com/apk/res/android"
    xmlns:app="http://schemas.android.com/apk/res-auto"
    xmlns:tools="http://schemas.android.com/tools"
    android:layout_width="match_parent"
    android:layout_height="match_parent"
    tools:context=".MainActivity">
    <EditText
        android:id="@+id/edit"
        android:text="我是要转为语音的文字"
        android:layout_width="match_parent"
        android:layout_height="wrap_content"
        app:layout_constraintBottom_toBottomOf="parent"
        app:layout_constraintEnd_toEndOf="parent"
        app:layout_constraintStart_toStartOf="parent"
        app:layout_constraintTop_toTopOf="parent"/>

    <Button
        android:id="@+id/test"
        android:layout_width="wrap_content"
        android:layout_height="wrap_content"
        android:text="将上面的文字转为语音"
        app:layout_constraintEnd_toEndOf="parent"
        app:layout_constraintStart_toStartOf="parent"
        app:layout_constraintTop_toBottomOf="@+id/edit"/>



</androidx.constraintlayout.widget.ConstraintLayout>

布局预览就是这样的:
在这里插入图片描述
activity代码是这样的:

package com.example.test

import android.annotation.SuppressLint
import android.os.Bundle
import android.speech.tts.TextToSpeech
import android.util.Log
import android.widget.Button
import android.widget.EditText
import androidx.appcompat.app.AppCompatActivity
import java.util.Locale


class MainActivity : AppCompatActivity() {
    private  val TAG = "MainActivity"
    var button :Button ? = null
    var editText :EditText?=null
    private lateinit var tts :TextToSpeech


    @SuppressLint("MissingInflatedId")
    override fun onCreate(savedInstanceState: Bundle?) {
        super.onCreate(savedInstanceState)
        setContentView(R.layout.activity_main)
        button = findViewById(R.id.test)
        editText = findViewById(R.id.edit)
        tts = TextToSpeech(this@MainActivity
        ) { status ->
            if (status == TextToSpeech.SUCCESS) {
                Log.d(TAG, "onInit: ")
            }
        }
        tts.language = Locale.CHINA
        button?.setOnClickListener {
            tts.speak(editText?.text.toString(), TextToSpeech.QUEUE_ADD, null, "custom_pronunciation")
        }


    }



    override fun onDestroy() {
        super.onDestroy()
        tts.shutdown()

    }


}

这段代码是一个简单的Android应用程序,其主要功能是将用户在EditText中输入的文本转化为语音。以下是这段代码的详细解释:

首先,我们定义了一个名为 MainActivity 的类,它继承自 AppCompatActivity。在Android开发中,AppCompatActivity 是一个为兼容不同版本Android API设计的Activity类。

MainActivity 类中,我们定义了一些变量:

  • buttoneditText 是这个应用中的两个UI组件,分别是一个按钮和一个文本输入框。
  • tts 是一个 TextToSpeech 对象,它的作用是将文本转化为语音。

onCreate 方法中,首先调用了 super.onCreate(savedInstanceState) 来初始化Activity。然后,通过 findViewById 方法找到了 buttoneditText 这两个UI组件。之后,我们实例化了 tts,并在其初始化完成后(onInit)打印了一条日志。然后设置了 tts 的语言为中文。最后,设置了 button 的点击监听器,当用户点击按钮时,会将 editText 中的文本转化为语音。

onDestroy 方法中,我们调用了 tts.shutdown() 来释放 tts 对象占用的资源。这是很重要的,因为在Android中,如果一个Activity不再需要时(例如,当用户按下返回键,或者Activity已经完成了它的任务),系统会销毁这个Activity。在销毁Activity之前,我们需要手动关闭一些可能正在运行的后台任务,以释放资源并避免内存泄漏。

此外,代码中使用了 @SuppressLint("MissingInflatedId") 注解来抑制一些可能会在真实应用中出现的警告或错误。例如,可能出现的 “MissingInflatedId” 错误是因为在代码中直接使用视图ID,而在实际的XML布局文件中并没有定义这个ID。这个注解告诉Android编译器忽略这个错误或警告。

我是用的荣耀50进行调试,我在

设置 − > 辅助功能 − > 无障碍 − > 文本转语音 设置->辅助功能->无障碍->文本转语音 设置>辅助功能>无障碍>文本转语音

找到了tts相关设置,将其设置为了荣耀语音引擎
在这里插入图片描述

然后运行程序,成功播报!

三、TextToSpeech简单封装

虽然成功进行播报了,但是在实际使用的时候我们肯定不能就把代码直接贴进去,我们简单封装一下,新建一个TextToSpeechUntil的object

package com.example.test

import android.content.Context
import android.speech.tts.TextToSpeech
import android.speech.tts.UtteranceProgressListener
import android.util.Log
import java.util.Locale

object TextToSpeechUntil  {
    private const val TAG = "TextToSpeechUntil"
    private lateinit var tts : TextToSpeech
    private var utteranceId = System.currentTimeMillis()

    fun init(context: Context){
        tts = TextToSpeech(context
        ) { status ->
            if (status == TextToSpeech.SUCCESS) {
                Log.d(TAG, "onInit: ")
            }
        }
        tts.language = Locale.CHINA
        Log.d(TAG, "init: defaultEngine ${tts.defaultEngine}")
        tts.setOnUtteranceProgressListener(object : UtteranceProgressListener() {
            override fun onStart(utteranceId: String?) {
                Log.d(TAG, "onStart: $utteranceId")
            }

            override fun onDone(utteranceId: String?) {
                Log.d(TAG, "onDone: $utteranceId")
            }

            override fun onError(utteranceId: String?) {
                Log.d(TAG, "onError: $utteranceId")
            }

        })


    }

    fun speak(string: String){
        utteranceId = System.currentTimeMillis()
        tts.speak(string, TextToSpeech.QUEUE_ADD, null, utteranceId.toString())
    }

    fun destroy(){
        tts.shutdown()
    }
}

这个代码是一个简单的TextToSpeech模块,可以将输入的字符串转化为语音并播放出来。同时,它还监听了语音合成器的状态,可以在日志中看到每一次语音合成的信息,该模块可以将文本转化为语音。现在我来为你简单解释下这个代码:

代码导入了几个Android的类,包括Context(用于获取应用程序环境的类)、TextToSpeech(用于将文本转化为语音的类)、UtteranceProgressListener(用于监听语音合成器状态的类)和Log(用于记录日志的类)。

之后,代码定义了一个名为TextToSpeechUntil的Object,这个Object包含了一些变量和方法。

其中,tts是一个TextToSpeech对象,用于将文本转化为语音。utteranceId是一个变量,用于唯一标识每一次的语音合成。

init方法中,我们首先初始化了一个TextToSpeech对象,并设置其语言为中文。然后设置了一个UtteranceProgressListener,它可以监听语音合成器的状态。在开始、完成和出错时,都会打印相应的日志。

speak方法中,我们调用TextToSpeech对象的speak方法,将传入的字符串转化为语音。同时,我们设置了utteranceId,这样我们可以在日志中清楚地知道每一次语音合成的情况。

最后,在destroy方法中,我们调用TextToSpeech对象的shutdown方法,关闭TextToSpeech引擎并释放资源。

然后我们将activity的代码更改如下:

package com.example.test

import android.annotation.SuppressLint
import android.os.Bundle
import android.speech.tts.TextToSpeech
import android.util.Log
import android.widget.Button
import android.widget.EditText
import androidx.appcompat.app.AppCompatActivity
import java.util.Locale


class MainActivity : AppCompatActivity() {
    private  val TAG = "MainActivity"
    var button :Button ? = null
    var editText :EditText?=null
    private lateinit var tts :TextToSpeech


    @SuppressLint("MissingInflatedId")
    override fun onCreate(savedInstanceState: Bundle?) {
        super.onCreate(savedInstanceState)
        setContentView(R.layout.activity_main)
        button = findViewById(R.id.test)
        editText = findViewById(R.id.edit)
        testTextToSpeechUntil()
    }



    override fun onDestroy() {
        super.onDestroy()
        TextToSpeechUntil.destroy()
    }

    private fun testTextToSpeechUntil(){
    	//这里偷懒没将初始化放到applicaiton中
        TextToSpeechUntil.init(this)
        button?.setOnClickListener {
            TextToSpeechUntil.speak(editText?.text.toString())
        }
    }
}

然后再次运行,播报成功,并且defaultEngine 打印出包名为荣耀语音引擎,如果你需要使用其他引擎可以自行下载然后通过代码设置。
在这里插入图片描述


总结

本文主要介绍了Android平台上的文本转语音功能TextToSpeech的使用方法和简单封装。首先介绍了TTS的作用和官方介绍,然后通过一个简单的示例程序演示了如何使用TextToSpeech进行文本转语音。最后,针对实际应用场景,对TextToSpeech进行了简单封装,方便开发者调用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/209279.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[网鼎杯 2020 青龙组]singal 1

前言 在主函数中找到了一个vm的译码器&#xff0c;译码器主要是解释传入的opcode&#xff0c;然后对我们输入的字符操作&#xff0c;这里我们发现他是单字节比较的&#xff0c;方法很多可以使用单字节映射&#xff0c;也可以是使用符号化执行&#xff0c;当然也可以硬着头皮去…

软件测试计划书

测试计划书 1.测试参考文档和测试提交文档 2.测试进度计划 3.测试资源 4.系统风险、优先级 5.测试策略 6.缺陷管理 7.测试停止标准 软件开发全文档下载进入主页。

Linux部署elasticsearch集群

文章目录 一、集群规划二、安装前准备(所有节点操作)创建数据目录修改系统配置文件/etc/sysctl.conf创建用户组设置limits.conf 三、初始化配置(在节点1上操作)下载安装包解压安装包修改jvm.options文件下配置的所占内存修改集群配置文件elasticsearch.yml将安装包传到另外两个…

JavaFramework JDK Version Test

测试JDK8 JDK17编译包 当前环境JDK8 CASE 1&#xff1a; /*** * author ZengWenFeng* email 117791303QQ.com* mobile 13805029595* date 2023-08-07*/ package zwf;import a.T; import ce.pub.util.GUID;/*** 测试高版本JDK编译JAR&#xff0c;低版本错误** author ZengWenF…

电梯导航的小练习

目录 css代码 html代码 js代码 完整代码 效果图 需求&#xff1a;点击某个模块&#xff0c;显示对应内容 css代码 <style>*{padding: 0;margin: 0;list-style: none;}ul{display: flex;justify-content: center;position: fixed;top: 0;left: 20%;}ul>li{text-…

对换数组的维度numpy.transpose()

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 对换数组的维度 numpy.transpose() 请以下代码执行print(np.transpose(a))后输出的结果是&#xff1f; import numpy as np a np.array([[0, 1], [2, 3]]) b np.array([[0, 1], [2, 3], […

Tomcat 漏洞修复

1、去掉请求响应中Server信息 修复方法&#xff1a; 在Tomcat的配置文件的Connector中增加 server" " &#xff0c;server 的值可以改成你任意想返回的值。

Gee教程5.中间件

鉴权认证、日志记录等这些保障和支持系统业务属于全系统的业务&#xff0c;和具体的系统业务没有关联&#xff0c;对于系统中的很多业务都适用。 因此&#xff0c;在业务开发过程中&#xff0c;为了更好的梳理系统架构&#xff0c;可以将上述描述所涉及的一些通用业务单独抽离…

蓝桥杯第198题 人物相关性分析 C++ 模拟 字符串 双指针

题目 思路和解题方法 程序首先定义了一个函数check&#xff0c;用于判断一个字符是否为字母。接下来&#xff0c;程序读取输入的整数k和一行字符串str。定义了两个空的向量a和b&#xff0c;用于存储满足条件的子串的起始位置。使用for循环遍历字符串str的每个字符&#xff0c;检…

Python--使用布林线设计均值回归策略

在本教程中,我们将探讨均值回归的概念以及如何使用 Python 中的布林线设计交易策略。均值回归是一种流行的交易策略,它基于这样的假设:随着时间的推移,资产价格往往会恢复到历史平均水平。布林线 (Bollinger Bands) 由约翰布林格 (John Bollinger) 开发,是一种技术分析工具…

喜讯 | Circulation(IF:37.8)ChIP-seq+RNA-seq助力解析USP28在糖尿病性心脏病的调控机制

2023年11月23日&#xff0c;国际知名期刊Circulation&#xff08;IF:37.8&&#xff09;在线发表了武汉大学人民医院心内科唐其柱教授团队题为 ” USP28 Serves as a Key Suppressor of Mitochondrial Morphofunctional Defects and Cardiac Dysfunction in the Diabetic He…

OSI七层模型与TCP/IP四层模型

一、OSI七层模型简述 OSI 模型的七层是什么&#xff1f;在 OSI 模型中如何进行通信&#xff1f;OSI 模型有哪些替代方案&#xff1f; TCP/IP 模型关于专有协议和模型的说明 二、七层模型详解&#xff08;DNS、CDN、OSI&#xff09; 状态码DNS nslookup命令 CDN whois命令 …

熬夜会秃头——beta冲刺Day4

这个作业属于哪个课程2301-计算机学院-软件工程社区-CSDN社区云这个作业要求在哪里团队作业—beta冲刺事后诸葛亮-CSDN社区这个作业的目标记录beta冲刺Day4团队名称熬夜会秃头团队置顶集合随笔链接熬夜会秃头——Beta冲刺置顶随笔-CSDN社区 一、团队成员会议总结 1、成员工作进…

计算机网络——数据链路层-封装成帧(帧定界、透明传输-字节填充,比特填充、MTU)

目录 介绍 帧定界 PPP帧 以太网帧 透明传输 字节填充&#xff08;字符填充&#xff09; 比特填充 比特填充习题 MTU 介绍 所谓封装成帧&#xff0c;就是指数据链路层给上层交付下来的协议数据单元添加帧头和帧尾&#xff0c;使之成为帧。 例如下图所示&#xff1a; …

【LeetCode刷题笔记】102. 二叉树的层序遍历

创作不易&#xff0c;本篇文章如果帮助到了你&#xff0c;还请点赞 关注支持一下♡>&#x16966;<)!! 主页专栏有更多知识&#xff0c;如有疑问欢迎大家指正讨论&#xff0c;共同进步&#xff01; 更多算法知识专栏&#xff1a;算法分析&#x1f525; 给大家跳段街舞感谢…

NRF24L01 无线收发模块与 Arduino 的应用

NRF24L01 是一款常用的无线收发模块&#xff0c;与 Arduino 兼容性良好&#xff0c;可以用于实现无线通信和数据传输。本文将介绍如何将 NRF24L01 模块与 Arduino 配合使用&#xff0c;包括硬件的连接和配置&#xff0c;以及相应的代码示例。 一、引言 NRF24L01 是一款基于 2.…

图解「差分」入门(“前缀和“ 到 “差分“ 丝滑过渡)

题目描述 这是 LeetCode 上的 「1094. 拼车」 &#xff0c;难度为 「中等」。 Tag : 「差分」、「前缀和」 车上最初有 capacity 个空座位&#xff0c;车只能向一个方向行驶&#xff08;不允许掉头或改变方向&#xff09;。 给定整数 capacity 和一个数组 trips, 表示第 i 次旅…

HarmonyOs 4 (三) ArkTS语言

目录 一 认识ArkTs语言1.1 ArkTs1.2 基本结构 二 基本语法2.1 声明式UI2.1.1 创建组件2.1.1.1 无参数2.1.1.2 有参数2.1.1.3 组件样式2.1.1.4 组件方法2.1.1.5 组件嵌套 2.1.2 自定义组件2.1.2.1 基本结构2.1.2.2 成员函数/变量2.1.2.3 自定义组件的参数规定2.1.2.4 Build函数2…

最新版dede织梦CMS采集侠工具

在网络时代&#xff0c;拥有一个充实而有吸引力的网站是吸引访客、提高流量的关键。织梦CMS一直以其简单易用、灵活性强而备受欢迎。而如何让网站内容更富有吸引力&#xff0c;如何在激烈的网络竞争中脱颖而出&#xff1f;新版织梦采集侠以及147SEO插件或许是你的得力助手。 新…

创始人于东来:胖东来员工不想上班,请假不允许不批假!

12月2日早晨&#xff0c;一则关于“胖东来员工不想上班请假不允许不批假”的新闻登上了热搜&#xff0c;引起了广泛关注。熟悉胖东来的网友们可能知道&#xff0c;这并不是这家企业第一次成为热搜的焦点。据白鹿视频12月1日报道&#xff0c;11月25日&#xff0c;河南许昌的胖东…