基本声学知识

记录一下声波、信噪比、声音信号强度、白噪音等概念。

声波

声波是机械波,同时,声波也是压力波(pressure wave)。震动源通过震动压缩空气,这部分空气的总体压力会增大。同时,压缩空气的过程也会使另一部分的空气气压下降。声波在传播过程中对原本静止的压力之上叠加了即时的影响,我们叫它即时压力。这里的介质也可以是任何东西(水、钢铁)。

但是,除了机械震动,雷电和热效应等都能够产生声波。例如吹笛子,引发了空气颗粒震动制造了声波,但是种振动导致的空气颗粒运动的模型与机械振动是不同的,所以要分开讨论。

在讨论声学问题的时候,我们考虑的两个最基本参数是声压(p)与空气颗粒速度(v)。空气颗粒速度不是声波的传播速度

信噪比

信噪比(英语: Signal-to-noise ratio,缩写为 SNRS/N),又称 訊噪比,是科学和工程中所用的一种度量,用于比较所需信号的强度与背景噪声的强度。其定义为信号功率与噪声功率的比率,以分贝(dB)为单位表示。大于比率 1:1(高于 0 分贝)表示信号多于噪声。信噪比通常用于描述电子信号,也可以应用在各种形式的信号,比如冰芯内的同位素量,或细胞间的生物化学信号

声音信号的强度

表述声音信号强度的几个概念

用来描述声音强度的物理量有很多:声压,功率,产生声音信号的电压等,使用不同的物理量来表示声音的强度,其得到的分贝也是不同的。

分贝(decibel)

什么是分贝?

​ 分贝(dB)是一个对数单位(logarithmic unit), 它和很多常见的单位如“米”,“秒”或者“千克”等物理单位是不同的,它并不能直接用来描述一个物理量的大小或者多少,它表示的是两个相同单位物理量的比值。分贝经常用来描述声音,如超过50dB的噪声就会影响人的睡眠和休息,但分贝不仅仅用来描述声音,它还被用来描述电子学等其他领域的物理量,如描述信号强度的衰减 、信噪比等等。分贝表示的是两个物理量的比值,作为分母的那个量通常是一个标准的基准值(standard reference value),分贝描述的就是作为分子的物理量相对于这个基准值的大小,分贝的计算公式如下: \[ dB = 10 × log_{10}\frac{value}{value_{ref}} \] 其中\(value_{ref}\)是基准值。无论是用分贝来描述什么,基准值都是0dB。

dBSPL是什么?

声音本质上来说是一种波,通过空气传播,传到人耳朵里引发鼓膜的振动。所以,声音的大小,实际就是对这种振动强度的反映。而由于空气的振动会引起大气压强的变换,可以使用压强变化的程度来描述声音的大小,这就是“声压(SPL,Sound Pressure Levels)”概念,其单位是Pa。例如:1米外步枪射击的声音大约是7000Pa;10米外开过汽车大约是0.2Pa。使用声压作为测量量的分贝就是dBSPL,通常用来表示声音大小的dB多说指的就是dBSPL。声压和声音大小的关系,可以使用如下公式表示 \[ I(dB) = 10 \times \log_{10}(\frac{P^2}{P_{ref}^2}) = 20 \times \log_{10}\frac{P}{P_{ref}} \] 其中,\(I\)是分贝,\(P\)是该声音的声压测量值,\(P_{ref}\)是表示基准值(0dBSPL),这里选择的声压标准值为\(2×10^{−5}Pa,20μPa\),是人耳在1KHz这个频率下能听到的最小的声音,大致相当于3米外一只蚊子在飞的声音。将标准值代入上式: \[ I(dBSPL) = 20 \times \log_{10}(\frac{P}{2 \times 10^{-5}}),\mbox{P是被测声压值} \]

分贝只是一个单位,连物理量都不是,非常广泛,不仅用于声学,多用于衡量各种信号的强度、增益等;分贝是一种描述物理量比值的单位。一般我们用分贝来作为测量得到的振幅的单位

dBm,dBu,dBV又是什么?

  • dBm

根据声音的振动,在传播的过程引起大气压强的变化,使用声压作为测量量来计算声音的分贝值。除了自然产生的声音外,现在大多数的声音都是使用电信号作为存储和传播的载体的,例如电视广播,各种音频文件等。dBm,dBu,dBV是使用和电信号相关的物理量作为被测物理量,计算其产生声音的分贝值。dBm是使用产生声音信号的功率作为被测物理量,选择1毫瓦(1mW)作为基准值,计算分贝值。计算公式: \[ dBm = 10 \times \log_{10}(\frac{P}{1 \times 10^{-3}})),\ \mbox{P是被测电工率} \]

  • dBu

电功率可以由电压\[V\]和电阻\[R\]计算得到:\[P = \frac{V^2}{R}\],由该公式可以得到dBu,使用电压作为测量量,计算声音的分贝值。在十九世纪三十年代,音频设备的输入电阻都是600欧姆,也就上面公式中的 R = 600 欧姆。在dBm中,使用 1mW 作为基准值,那么在 R = 600 欧姆时就可以得到此时的电压为\[\sqrt{PR}=\sqrt{10^{-3}\times 600}=0.775V\]。所以,dBu是以电压作为测量量,计算声音的分贝值,选择的基准电压为0.775V。计算公式: \[ dBu = 20 \times \log_{10}(\frac{V}{0.775}),\mbox{V是被测电压} \]

  • dBv

上上个世纪音频设备的输入阻抗都是600欧姆,是固定不变的。但是到了现代,就有了更高阻抗的设备,例如1000欧姆,这样再选择0.775作为电压的基准值,显然是不合理的。所以,就有了一个新基准值1V。本质上dBudBV是没有区别的,都是选择电压作为被测单位,只是选择的基准值不同罢了。dBV仍然是以电压作为被测量,计算声音的分贝值,选择1V作为基准值。计算公式: \[ dBV = 20 \times \log_{10}(\frac{V}{1}) \]

dBFS是什么?

前面的几个被测量都是模拟量,在数字时代更多的音频分贝表示是dBFSdBFS的全称为Decibels Full Scale全分贝刻度,是数值音频分贝值的表示方法。和前面几个不一样的时,dBFS的基准并不是最小的或者是中间的某一个值,是最大的那个值!也就是说0dBFS是数字设备能达到的最大值,除了最大值外都是负值。以数字音频采样位为无符号16位(即位深为2 byte/16 bit,用16位2进制数字刻画音频信号,范围是0-65536),16位的无符号的最大值为\(65536(2^{16})\),因此dBFS的计算公式: \[ dBFS = 20 \times \log_{10}(\frac{sample}{65536}) \] 这样,\(min\ dBFS=20 \times \log_{10}{\frac{1}{65536}} = -96dBFS\)。也就是说16位无符号音频的动态范围为\(0dBFS\sim-96dBFS\)

dBFs和dBu之间的转换

dBu是度量模拟信号的,而dBFS是度量数字信号的,并且dBFS不会用于度量模拟信号,所以没有在dBu和dBFS之间没有统一的转换公式,依赖于具体的数字设备。在dBu和dBFS转换时,需要规定一个峰值电压,该电压下产生的音频信号经过AD转换后得到的sample为0dBFS。例如,+18dBu对应于0dBFS,在该条件下 求 xdBu对应于ydBFS,那么就有\(y=x-18\)

总结

本文主要介绍和声音相关的分贝概念,分贝不同于其他的物理单位,表示的是相同物理量的比值,其具体的值依赖于选择的被测量。

  • dBSPL,通常所说的dB,使用声压作为被测量,选择20μPa20μPa作为基准值。
  • dBm,使用功率作为被测量,选择1mW作为基准值。
  • dBu,使用电压作为被测量,选择0.775V作为基准值。
  • dBV,和dBu一样,使用电压作为被测量,选择1V作为基准值。
  • dBFS,和上面的量都不相同,上面的量都是测量模拟值的,dBFS是测量数字音频的,其选择的基准值为sample的最大值为0dBFS,其他的值都为负值。

dBFS和模拟量之间的转换,例如dBu,需要规定一个基础的对应关系。例如+18dBu 对应于0dBFS,则\[ydBFS = x - 18\]

测量单位 基准值 物理符号
声压 SPL (Pa/帕斯卡) \[2×10^{−5}Pa/20μPa\] dBSPL
电功率 (W/瓦特) \[1mW\] dBm
电压(V/伏特) \[0.775V\] dBu
电压(V/伏特) 1V dBV
数字信号测量值(bit/比特) 65536 dBFS

声(音)强级/声(音)强等级(sound intensity level)

  • 声强的单位是瓦/米,声强级的单位是分贝。

声强级(SIL)是声音的声强基准声强的比值取常用对数再乘以10的值,也是一种描述声音强弱的单位,定义为单位面积上的声音功率。在物理学中,把单位时间内通过垂直于声波传播方向的单位面积的平均声能,称为声强。声强用\[I\]表示,单位为瓦/平米。实验的研究表明,人对声音强弱的感觉并不是与声强成正比,而是与其对数成正比的。这正是人们使用声强级来表示声强的原因。其单位为贝尔声强级(贝尔,Bel)。 \[ L = log_{10}(\frac{I}{I_{ref}}) \] 一般人对强度相差十倍贝尔的两个声音便可区别出来,因此用贝尔的十倍来作为声强的单位则更为方便,这个单位称为分贝尔(decibel),简称分贝(dB),即: \[ SIL = 10 \times log_{10}(\frac{I}{I_{ref}}) \] 式中\[I\]为声强,\[I_ref=10^{-12} 瓦/平米\]称为基准声强,声强级的常用单位是分贝(dB)。从物理上说,音强决定于发音体振动的振幅。振幅越大,音强越强。从生理上说,音强取决于发音时声门下压力的大小。发音时发音器官的肌肉活动增强(用力大),呼出的气流量大,则气流对发音器官的压力大,则发音体振幅大,于是音强就强;反之,音强就弱。

声(音)压级/声(音)压等级(sound pressure level)

  • 声压的单位是帕斯卡 ,声压级的单位是分贝。

声压等级是我们用来科学描述声音大小的物理量。声压等级(SPL)即时压力的均方根(rms)直接联系。在分贝这种单位下,声压等级为零时,大概是一个听力正常的人刚好不能听到声音的声音大小。也就是说,当即时压力的均方根与刚好听不到的声音比值为1时,计声压等级为0。由于人的听力由基因和后天环境决定,所以人和人的听力都是有差异的,科学家对很多人进行了统计,从而规定了一个大概人们刚好不能听到声音的大小为 \[ dBSPL = 0 \]

两个 50dB 的声压级加在一起不是 100dB 而是 53dB。

响度(loudness)

响度又称音响,是与声强相对应的声音大小的知觉量。声强是客观的物理量,响度是主观的心理量。响度不仅跟声强有关,还与振幅/声压和频率相关,以1kHz为基准值;

为了在数量上估计一个纯音的响度,就把这个纯音和1000Hz的某个声强级的纯音在响度上作比较。这两个声音在听觉上认为是相同的响度时,就可以把1000Hz纯音的这个声强级规定为该频率纯音的响度级。响度级的单位为方(Phon)。响度是和听感相关的量,与振幅/声压和频率相关,以1kHz为基准值。

也就是说声强级可以直接用于表示响度。

响度由固定的赫兹来表示,决定因素的人的听觉,不同的人可能会产生不同的结果。

  • 以下内容存疑:

空气颗粒移动速度的导数就是空气颗粒速度(v)。特性声阻(specific acoustic impedance)等于声压(p)与空气颗粒速度(v)的比值。 \[ \textcolor{Green} {Specific\ Acoustic\ Impedance = p / v} \] 可以推得振幅与声压的关系,从而推得其与声压等级,进而与响度的关系。

增益(gain)

增益(GAIN)是调整信号电压,控制小信号放大的倍数。处于放大电路的最前端,决定了灵敏度和信噪比,决定了灵敏度和信噪比,调整时强音偶尔点亮指示灯,最强音刚好常亮即可,过大容易破声、削波,过小信噪比低。

话筒利用磁生电将声音产生的震动转化成微弱的电压变化,增益负责将这种微弱的震动放大。

音量(volume)

  • 百度百科解释:

音量又称响度、音强,是指人耳对所听到的声音大小强弱的主观感受,其客观评价尺度是声音的振幅大小。这种感受源自物体振动时所产生的压力,即声压。物体振动通过不同的介质,将其振动能量传导开去。人们为了对声音的感受量化成可以监测的指标,就把声压分成“级”——声压级,以便能客观的表示声音的强弱,其单位称为“分贝”(dB)。也就是说音量就是响度、音强的别称。

  • 音频电路中的音量控制:

音量调节音频设备的输入阻抗,是衰减器。阻抗是电阻和电抗的总和。电阻是指在直流电中,物体对电流的阻碍作用。在交流点中,除了电阻会阻碍电流,电容和电感也会阻碍电流,这就是电抗了。阻抗值其实对音质没有关键性影响。但是,如果阻抗过低,造成电流过大,也容易使声音失真。音量旋钮,位于前置放大电路前端,有刻度且0dB为最大的话,-10dB是正常演出的音量最佳(也就是保留10dB的动态裕量。耳放道理相同,音源的输出电平高,增益应该调低,反之调高。

阻抗高,意味着同样的输出功率,加到耳机上的电流就小了,要更大的功率才能充分驱动。低阻耳机只要一点点功率就足以驱动起来。 听感上你是听不出耳机阻抗高低的。录音室使用的耳机很多是300欧或600欧,但这只是因为调音台的阻抗匹配

白噪音

非周期性的振动产生的声波由于杂乱无章,又称为噪音,其中含有各种频率,且每种频率的强度一致的噪音成为白色噪音(white noise).

声音的三大主观属性

声音的三个主要的主观属性,包括音量(响度)、音调、音色(也称音品)。

音量(volume)

同上

音调(pitch)

表示人的听觉分辨一个声音的调子高低的程度。音调主要由声音的频率决定,同时也与声音强度有关。

频率影响音调 对一定强度的纯音,音调随频率的升降而升降,物体振动的快,发出声音的音调就高。振动的慢,发出声音的音调就低。

响度影响音调一定频率的纯音、低频纯音的音调随声强增加而下降高频纯音的音调却随强度增加而上升。大体上,500 赫兹以下的低频纯音的音调随响度的增加而下降,1500 赫兹以上高频纯音的音调随响度的增加而上升。

对音调可以进行定量的判断。音调的单位称为美(mel):取频率1000赫兹、声压级为40 分贝的纯音的音调作标准,称为1000 美,另一些纯音,听起来调子高一倍的称为2000 美,调子低一倍的称为500 美,依此类推,可建立起整个可听频率内的音调标度。这样得到的声压级40 分贝的纯音音调与频率的关系见下表:

频率f/Hz 音调/mel 频率/fHz 音调/mel
20 0 900 929
30 24 1000 1000
40 46 1250 1154
60 87 1500 1296
80 126 1750 1428
100 161 2000 1545
150 237 2500 1771
200 301 3000 1962
250 358 3500 2116
300 409 4000 2250
350 460 5000 2478
400 508 6000 2657
500 602 7000 2800
600 690 10000 3075
700 775
800 854

音调高:空灵,清凉,纤细 音调低:雄浑,澎湃,粗犷

音色/音品(Timbre)

声音的品质叫做音色,又叫音品,它反映了每个物体发出的声音特有的品质。

音色是指不同声音表现在波形方面总是有与众不同的特性,不同的物体振动都有不同的特点。

不同的发声体由于其材料、结构不同,则发出声音的音色也不同。例如钢琴、小提琴和人发出的声音不一样,每一个人发出的声音也不一样。因此,可以把音色理解为声音的特征。

频谱和功率谱

频谱是频率谱密度的简称,就是频率的分布曲线。复杂振荡分解为振幅不同和频率不同的谐振荡,这些谐振荡的幅值按频率排列的图形叫做频谱。广泛应用在声学、光学和无线电技术等方面。它对信号的研究从时域引到频域,从而带来更直观的认识。

频谱是从频域范围对音频进行分析的结果,

频谱


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!