音频基础知识和音频指标

音频基础知识

声音

声音(sound)是由物体振动产生的声波。物体在一秒钟之内振动的次数叫做频率,单位是赫兹,字母Hz。人耳可以识别的声音频率在         20 Hz~20000 Hz之间;

声音三要素:

响度
    响度,又称声强或音量,它表示的是声音能量的强弱程度,主要取决于声波振幅的大小。

音调
    音高也称音调,表示人耳对声音调子高低的主观感受。客观上音高大小主要取决于声波基频的高低,频率高则音调高,反之则低。

音色
    音色又称音品,由声音波形的谐波频谱和包络决定。声音波形的基频所产生的听得最清楚的音称为基音,各次谐波的微小振动所产生的声音称泛音

DAC与喇叭

DAC: 将数字信号转换成模拟信号的电路,称为数模转换器(简称D/A转换器或DAC,Digital to Analog Converter),D/A转换的作用是将时间离散、幅值也离散的数字信号转换为时间连续、幅值也连续的模拟信号。

喇叭:是一种将电能转换成声音的一种转换设备。当喇叭接收到由音源设备输出的电信号时,电流会通过喇叭上的线圈,并产生磁场反应。利用磁场的吸引或者排斥使振膜产生振动,发出声音。

ADC与麦克风

麦克风是将声音信号转换为电信号的能量转换器件。(声波带动振膜振动使两极板间的距离改变,即电容C改变,会引起电压的变化,这种电压变化频率反映了外界声音的频率,这就是驻极体传声器地工作原理。)

ADC:将模拟信号转换成数字信号的电路,称为模数转换器(简称A/D转换器或ADC,Analog to Digital Converter),A/D转换的作用是将时间连续、幅值也连续的模拟信号转换为时间离散、幅值也离散的数字信号。

模拟信号-直流与交流

音频的系统的输入和输出的有效信号都是交流信号。直流信号是不能使喇叭发声振动的,也不能传送声音信号。轻微的直流偏移会使耳机/喇叭的音圈不在磁隙的最佳位置,对音效有影响。严重的直流偏置,使音圈剧烈发热,音圈胶融化,线圈烧毁,振膜在巨大的磁推力和音圈的热量作用下变形损坏

偏置电压

输入输出的偏置电压:

因为大部分芯片没有负电压,所以如果直流偏置点在 0V电平,信号的压值负半轴部分将会丢失。所以如果要完整地输入/输出一段交流信号,需要抬升一定的偏置电压作为信号输入/输出的参考 0 点,此时理论上能输入/输出的信号最大不失真幅度为偏置电压的 2 倍.

DAC隔直输出

       隔直输出时,在 DAC 输出端与喇叭间串一个电容可以起到隔绝直流的作用。电抗分感抗和容抗,与电阻一样都起到阻碍电流通过的作用单位也都用欧姆,不同的是:电阻对所有频率的电流都有相同的阻碍作用,感抗与频率成正比,电流的频率越大,相应的感抗就越大容抗与频率成反比,电流的频率越大,相应的容抗就越小,

DAC差分输出

        差分输出时,喇叭两端各接DAC的一端输出,其中一段输出偏置直流加信号,另一端输出偏置直流加反向信号,所以喇叭的电压等于DAC两端电压之差,同时偏置直流被抵消,所以差分输出时最大幅度为单端最大输出幅度的两倍。

DAC直推输出

       直推输出时,喇叭两端分别DAC的一端输出和一个输出DAC直流偏置的公共地,所以喇叭的电压等于DAC端与公共地间电压之差,同时偏置直流被抵消,所以直推输出时最大幅度与单端隔直最大输出幅度相同.

MIC隔直输入

       MIC隔直输入时,电源串联电阻分压得到一个使麦克风正常工作状态的偏置电压,该偏置电压与芯片引脚偏置电压不一定相等,所以电容起到了隔绝两边偏置电压的作用,使MIC_IN可以正常输入麦克风的交流信号.

 MIC省电容输入

       MIC省电容方式输入时,麦克风直接正端接 MIC_IN 引脚,负端接模拟地。芯片内部会给麦克风提供一个满足正常工作的偏置电压,并产生一个与偏置电压相同压值的参考电压,在后级处理中把 MIC_IN 的直流分量处理掉,得到麦克风采集到的交流信号

LINEIN隔直输入

        LINEIN隔直输入时,在输出设备的输出端与芯片的输入端间串联一个电阻,可以起到隔绝两个不同系统的偏置电压作用。
        LINEIN选模拟输入时,可以简单理解为芯片通过模拟电路把LINEIN输入端口的信号直接连接到DAC输出端。优点是延时短,信噪比好。
        LINEIN选数字输入时,则是通过ADC采集成数字信号,再通过DAC把数字信号转为模拟信号输出。优点是CPU可以获取到输入的音频数据流,并可以进行一些效果处理再输出.

数字信号调制方式

PCM:脉冲编码调制(Pulse Code Modulation)
PDM:脉冲密度调制(Pulse Density Modulation)
PWM:脉冲宽度调制(Pulse Width Modulation)
PPM:脉冲位置调制(Pulse Position Modulation)
...

脉冲编码调制(PCM)

       脉冲编码调制(Pulse Code Modulation,PCM)就是把一个时间连续,取值连续的模拟信号变换成时间离散,取值离散的数字信号后在信道中传输。脉冲编码调制就是对模拟信号先抽样,再对样值幅度量化,编码的过程。

PCM数据格式

PCM数据格式可以理解成把采样后每个点的量化值按时间顺序一直排列。多声道时候也是把每个点的量化值按通道顺序和时间顺序交叉排列。
采样位数为 8 时,每个点占 1 个字节,数值范围 -128 ~ 127。
采样位数为16时,每个点占 2 个字节,数值范围 -32768 ~ 32767。
采样位数为24时,每个点占 3 个字节,数值范围 -16777216 ~ 16777215。
采样位数为32时,每个点占 4 个字节,数值范围 -2147483648 ~ 2147483647。

时域信号与频域信号

音频数字信号的属性

一、采样率
每秒从连续信号中提取并组成离散信号的采样个数,单位赫兹(Hz)。在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。采样频率必须大于等于需要采集音频信号的最大频率的两倍。
例如:8KHz    16KHz    44.1KHz       48KHz
二、采样位数
样位数也叫采样大小或量化位数,用来衡量声音波动变化的一个参数,也可以理解为采样的分辨率或者声音的解析度。数值越大,量化分辨率也就越高,采集到的数字信号越能还原实际的模拟信号。
例如:8bit:256级    16bit:65536级    32bit:4294967296级
三、通道数
声音的通道的数目。常见的单声道和立体声(双声道),现在发展到了四声环绕(四声道)和5.1声道。

傅里叶变换

时域与频域

常见的各种噪声

白噪声

白噪声(white noise)是指功率谱密度在整个频域内是常数的噪声。 所有频率具有相同能量密度的随机噪声称为白噪声。白噪声是一种功率谱密度为常数的随机信号。换句话说,此信号在各个频段上的功率谱密度是一样的,由于白光是由各种频率(颜色)的单色光混合而成,因而此信号的这种具有平坦功率谱的性质被称作是“白色的”,此信号也因此被称作白噪声。

 

 粉红噪声

粉红噪声(pink noise)是物理学概念,它在每个倍频程的强度相等,即在一定的范围(倍频程)内具有相同或类似的能量。粉红噪音虽然是一个功率谱密度与频率成反比的频谱的信号或过程。但由于听觉是对数(倍频程)感知,在高频处每个倍频程带宽更大,功率谱密度与带宽抵消,所以每个倍频程的强度其实是相等的

频率噪声

频率噪声是一种有频率信息的噪声,噪声的频率往往和瞬时强度与干扰源的工作频率和瞬时功率相关,可以根据噪声的频率和瞬时强弱关系去排除干扰的来源(例如有些短短续续的干扰,可以从干扰出现时正在工作的模块去分析)。噪声有可能来自于外部的电磁辐射干扰,电源干扰,接地回路干扰。

po声

po声是一种短暂的爆破性杂音,是由于幅度不连续,变化太大导致。很多情况都会产生这个声音,例如DAC偏置电压上抬太快、数据突然中断、音频数据不连续等等情况都会导致po声的产生。

 

常用的音频指标

峰峰值与有效值

峰峰值(peak-to-peak value)是指一个周期内信号最高值和最低值之间的距离,描述了信号值的变化范围的大小。

有效值是根据电流的热效应规定的,让交变电流和直流电通过同样的电阻,如果它们在同一时间内产生的热量相等,就把这一直流电的数值叫做这一交流电的有效值。直流的有效值就是其本身。

信噪比(SNR)

信噪比(SIGNAL NOISE RATIO,SNR or S/N)是指信号电平与噪声电平之比,单位为分贝(dB)。音频信噪比是指音响设备播放时,正常声音信号强度与噪声信号强度的比值。当信噪比低,小信号输入时噪音严重,严重影响音质。信噪比的大小是用有用信号功率(或电压)和噪声功率(或电压)比值的对数来表示的。

频率响应范围

频率响应是对MP3播放器的数模/模数转换器频率响应能力的一个评价标准。好的频率响应,是在每一个频率点都能输出稳定足够的信号,不同频率点彼此之间的信号大小均一样。然而在低频与高频部分,信号的重建比较困难,所以在这两个频段通常都会有衰减的现象。输出品质越好的装置,频率响应曲线就越平直,反之不但在高低频处衰减得很快,在一般频段,也可能呈现抖动的现象。

总谐波失真加噪声(THD+N)

THD+N 是英文Total Harmonic Distortion +Noise 的缩写,译成中文是“总谐波失真加噪声”。它是音频功率放大器的一个主要性能指标,也是音频功率放大器的额定输出功率的一个条件。

THD(Total Harmonic Distortion)总谐波失真是指输出信号比输入信号多出的谐波成分。谐波失真是系统不完全线性造成的。所有附加谐波电平之和称为总谐波失真。总谐波失真与频率有关。一般说来,1000Hz频率处的总谐波失真最小,因此不少产品均以该频率的失真作为它的指标。一般产品的总谐波失真都小于1%@1000Hz,但这个数值越小,表明产品的品质越高。

动态范围(Dynamic Range)

动态范围(Dynamic Range)是指音响系统重放时最大不失真输出功率与静态时系统噪声输出功率之比的对数值,又指一个多媒体硬盘播放器输出图像的最亮和最暗部分之间的相对比值。一般性能较好的音频设备动态范围在100dB以上。最大不失真时候失真度的取值有所不同,常见的有1%、3%、5%、和10%,在多媒体音箱中一般都取值为10%,而在高保真放大器中一般取值为1%。

动态范围是指设备能够处理的最大信号与最小信号的比值。这个概念容易与“信噪比”的概念混淆,那么二者有什么区别呢?可以理解,小于噪声幅度的信号是无法正确还原的,但是有的设备能够在无信号或信号特别低时从某些环节将噪声连同小信号切除,从而得出更好的信噪比指标(这就是“动态降噪”的基本原理)。这时实质上还是无法正确处理小信号的,而动态范围的测量就可以避免这样的人为优化。动态范围的测量是用一个小信号(一般用-60dB/1000Hz的正弦波)输给设备,然后滤除信号,测量其余频率的噪声和谐波水平,再用最大信号与之相比,结果就是动态范围。可以预见动态范围一般要低于信噪比,但在没有特殊电路或软件处理噪声的情况下,一般二者差距不大,可以互相参考。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/730034.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

昨天gitee网站访问不了,开始以为电脑哪里有问题了

昨天gitee网站下午访问不了,开始以为是什么毛病。 结果同样的网络,手机是可以访问的。 当然就ping www.gitee.com 结果也下面那样是正常的 以为是好的,但就是访问www.gitee.com也是不行,后来用阿里云的服务器curl访问是下面情况&…

芯片制作流程

1、系统需求-》设计-》光罩-》芯片制造-》检测-》封装-》测试。 光罩-》光阻涂布-》曝光-》显影和烘烤-》刻蚀-》等离子体去胶-》湿法刻蚀 化学机械研磨-》薄膜沉积-》制作金属薄膜-》化学气相沉积-》离子注入

2023数A题——WLAN网络信道接入机制建模

A题——WLAN网络信道接入机制建模 思路:该题主要考察的WLAN下退避机制建模仿真。 资料获取 问题1: 假设AP发送包的载荷长度为1500Bytes(1Bytes 8bits),PHY头时长为13.6μs,MAC头为30Bytes,MA…

Comparison method violates its general contract! 神奇的报错

发生情况 定位到问题代码如下&#xff08;脱敏处理过后&#xff09;&#xff0c;意思是集合排序&#xff0c;如果第一个元素大于第二个元素&#xff0c;比较结果返回1&#xff0c;否则返回-1&#xff0c;这里粗略的认为小于和等于是一样的结果 List<Integer> list Arr…

下载caj viewer查看caj论文

前言 CAJ是“中国学术期刊全文数据库”&#xff08;China Academic Journals&#xff09;的英文缩写&#xff0c;同时也是“中国学术期刊全文数据库”中的一种文件格式。我们从CNKI&#xff08;中国知网&#xff09;下载的资料一般都是这种文件格式。 CAJ不同于PDF等&#xff…

智赢选品,OZON数据分析选品利器丨萌啦OZON数据

在电商行业的激烈竞争中&#xff0c;如何快速准确地把握市场动态、洞察消费者需求、实现精准选品&#xff0c;是每个电商卖家都面临的挑战。而在这个数据驱动的时代&#xff0c;一款强大的数据分析工具无疑是电商卖家们的得力助手。今天&#xff0c;我们就来聊聊这样一款选品利…

JSP基础知识概述

目录 JSP一、什么是JSP1.1 概念1.2 创建JSP1.3 JSP编写Java代码1.4 JSP实现原理 二、JSP与HTML集成2.1 普通脚本2.2 声明脚本2.3 输出脚本2.4 JSP指令2.5 动作标签 三、内置对象3.1 四大域对象 JSP 一、什么是JSP 1.1 概念 简化的Servlet设计&#xff0c;在HTMl标签中嵌套Jav…

华为重磅官宣:超9亿台、5000个头部应用已加入鸿蒙生态!人形机器人现身 专注AI芯片!英伟达挑战者Cerebras要上市了

内容提要 华为表示&#xff0c;盘古大模型5.0加持&#xff0c;小艺能力全新升级。小艺智能体与导航条融为一体&#xff0c;无处不在&#xff0c;随时召唤。只需将文字、图片、文档“投喂”小艺&#xff0c;即可便捷高效处理文字、识别图像、分析文档。 正文 据华为终端官方微…

高速公路声光预警定向广播助力安全出行

近年来&#xff0c;高速重大交通事故屡见不鲜&#xff0c;安全管控一直是高速运营的重中之重。如何利用现代化技术和信息化手段&#xff0c;创新、智能、高效的压降交通事故的发生概率&#xff0c;优化交通安全管控质量&#xff0c;是近年来交管部门的主要工作&#xff0c;也是…

如何恢复电脑硬盘删除数据?提供一套实用恢复方案

在数字化时代&#xff0c;电脑硬盘中存储的数据对于个人和企业来说都至关重要。然而&#xff0c;有时我们可能会不小心删除了一些重要文件&#xff0c;或者因为某种原因导致数据丢失。这时候&#xff0c;恢复硬盘上被删除的数据就显得尤为重要。本文将为您提供一套实用的电脑硬…

stable diffusion 模型和lora融合

炜哥的AI学习笔记——SuperMerger插件学习 - 哔哩哔哩接下来学习的插件名字叫做 SuperMerger,它的作用正如其名,可以融合大模型或者 LoRA,一般来说会结合之前的插件 LoRA Block Weight 使用,在调整完成 LoRA 模型的权重后使用改插件进行重新打包。除了 LoRA ,Checkpoint 也…

Starlink全系卫星详细介绍,波段频谱、激光星间链路技术、数据传输速率等等

Starlink全系卫星详细介绍&#xff0c;波段频谱、激光星间链路技术、数据传输速率等等。 Starlink是SpaceX公司开发的一个低轨道&#xff08;LEO&#xff09;卫星网络系统&#xff0c;旨在为全球用户提供高速宽带互联网服务。截至2024年6月&#xff0c;Starlink已经发射并运行…

90 岁老人靠一辆自行车年赚 170 亿,捷安特如何打造山地车极致产品力?

一位富家小开在中年时经商失败&#xff0c;38岁时从零开始创业&#xff0c;最终在自行车整车市场占据了70%的份额&#xff0c;他是怎么做到的&#xff1f; 一家曾为美国自行车品牌代工的台湾工厂&#xff0c;成功从ToB转型为ToC业务&#xff0c;从90%的代工业务转变为全球最大…

创新实训2024.05.01日志:document-loaders

在建立易学知识库的过程中&#xff0c;仅仅有向量数据库以及词嵌入模型、分词器是不够的&#xff0c;因为我们有大量的非结构化文本&#xff08;如doc,pdf&#xff09;或者是图片需要上传&#xff08;例如pdf里面有图片&#xff09;&#xff0c;此时词嵌入无法直接向向量数据库…

Scikit-Learn梯度提升决策树(GBDT)

Scikit-Learn梯度提升决策树 1、梯度提升决策树(GBDT)1.1、Boosting方法1.2、GBDT的原理1.3、GBDT回归的损失函数1.4、梯度下降与梯度提升1.5、随机森林与GBDT1.6、GBDT的优缺点2、Scikit-Learn梯度提升决策树(GBDT)2.1、Scikit-Learn GBDT回归2.1.1、Scikit-Learn GBDT回归…

中国灌溉农田空间分布

针对全国灌溉农田空间分布数据缺失的现状&#xff0c;融合MODIS植被指数和统计数据生成MIrAD-GI临时灌溉数据集&#xff0c;再利用约束统计和协同绘图方法将其与中国区域现有灌溉数据进行集成、整合&#xff0c;生成了2000-2019年中国逐年灌溉农田分布数据集&#xff08;500米空…

【vLLM】核心技术PagedAttention,调度原理

vLLM 简介 来自加州大学伯克利分校、斯坦福大学、加州大学圣迭戈分校的研究人员基于操作系统中经典的虚拟(Virtual)内存和分页(Page)技术&#xff0c;提出了一个新的注意力算法 PagedAttention&#xff0c;并打造了一个LLM服务系统——vLLM&#xff0c;官网为&#xff1a;http…

Anthropic AI模型Claude 3.5 Sonnet在Amazon Bedrock上正式可用

Claude 3.5 Sonnet是Anthropic最先进的Claude系列AI模型的新成员&#xff0c;比Claude 3 Opus更智能且价格只有其五分之一 北京——2024年6月21日 亚马逊云科技宣布&#xff0c;Anthropic最新、最强大的模型Claude 3.5 Sonnet现已在Amazon Bedrock上正式可用&#xff0c;该模型…

在智星云租用算力时,如何选择适合的GPU?

智星云平台分配GPU、CPU、内存的机制为&#xff1a;按租用的GPU数量成比例分配CPU和内存&#xff0c;算力市场显示的CPU和内存均为每GPU分配的CPU和内存&#xff0c;如果租用两块GPU&#xff0c;那么CPU和内存就x2。此外GPU非共享&#xff0c;每个实例对GPU是独占的。 一. CPU…

推动产业数字化转型,六个方面引领变革

从工业经济时代走向数字经济时代&#xff0c;世界经济发生着全方位、革命性的变化&#xff0c;产业数字化便是最显著的表现之一。当前&#xff0c;产业数字化不断深入发展&#xff0c;平台经济、工业互联网、智能制造等新业态、新模式不断涌现&#xff0c;成为了数字经济的重要…