基本声学知识
记录一下声波、信噪比、声音信号强度、白噪音等概念。
声波
声波是机械波,同时,声波也是压力波(pressure wave)。震动源通过震动压缩空气,这部分空气的总体压力会增大。同时,压缩空气的过程也会使另一部分的空气气压下降。声波在传播过程中对原本静止的压力之上叠加了即时的影响,我们叫它即时压力。这里的介质也可以是任何东西(水、钢铁)。
但是,除了机械震动,雷电和热效应等都能够产生声波。例如吹笛子,引发了空气颗粒震动制造了声波,但是种振动导致的空气颗粒运动的模型与机械振动是不同的,所以要分开讨论。
在讨论声学问题的时候,我们考虑的两个最基本参数是声压(p)与空气颗粒速度(v)。空气颗粒速度不是声波的传播速度
信噪比
信噪比(英语: Signal-to-noise ratio,缩写为 SNR 或 S/N),又称 訊噪比,是科学和工程中所用的一种度量,用于比较所需信号的强度与背景噪声的强度。其定义为信号功率与噪声功率的比率,以分贝(dB)为单位表示。大于比率 1:1(高于 0 分贝)表示信号多于噪声。信噪比通常用于描述电子信号,也可以应用在各种形式的信号,比如冰芯内的同位素量,或细胞间的生物化学信号。
声音信号的强度
表述声音信号强度的几个概念
用来描述声音强度的物理量有很多:声压,功率,产生声音信号的电压等,使用不同的物理量来表示声音的强度,其得到的分贝也是不同的。
分贝(decibel)
什么是分贝?
分贝(dB)是一个对数单位(logarithmic unit), 它和很多常见的单位如“米”,“秒”或者“千克”等物理单位是不同的,它并不能直接用来描述一个物理量的大小或者多少,它表示的是两个相同单位物理量的比值。分贝经常用来描述声音,如超过50dB的噪声就会影响人的睡眠和休息,但分贝不仅仅用来描述声音,它还被用来描述电子学等其他领域的物理量,如描述信号强度的衰减 、信噪比等等。分贝表示的是两个物理量的比值,作为分母的那个量通常是一个标准的基准值(standard reference value),分贝描述的就是作为分子的物理量相对于这个基准值的大小,分贝的计算公式如下: \[ dB = 10 × log_{10}\frac{value}{value_{ref}} \] 其中\(value_{ref}\)是基准值。无论是用分贝来描述什么,基准值都是0dB。
dBSPL是什么?
声音本质上来说是一种波,通过空气传播,传到人耳朵里引发鼓膜的振动。所以,声音的大小,实际就是对这种振动强度的反映。而由于空气的振动会引起大气压强的变换,可以使用压强变化的程度来描述声音的大小,这就是“声压(SPL,Sound Pressure Levels)”概念,其单位是Pa。例如:1米外步枪射击的声音大约是7000Pa;10米外开过汽车大约是0.2Pa。使用声压作为测量量的分贝就是dBSPL,通常用来表示声音大小的dB多说指的就是dBSPL。声压和声音大小的关系,可以使用如下公式表示 \[ I(dB) = 10 \times \log_{10}(\frac{P^2}{P_{ref}^2}) = 20 \times \log_{10}\frac{P}{P_{ref}} \] 其中,\(I\)是分贝,\(P\)是该声音的声压测量值,\(P_{ref}\)是表示基准值(0dBSPL),这里选择的声压标准值为\(2×10^{−5}Pa,20μPa\),是人耳在1KHz这个频率下能听到的最小的声音,大致相当于3米外一只蚊子在飞的声音。将标准值代入上式: \[ I(dBSPL) = 20 \times \log_{10}(\frac{P}{2 \times 10^{-5}}),\mbox{P是被测声压值} \]
分贝只是一个单位,连物理量都不是,非常广泛,不仅用于声学,多用于衡量各种信号的强度、增益等;分贝是一种描述物理量比值的单位。一般我们用分贝来作为测量得到的振幅的单位。
dBm,dBu,dBV又是什么?
- dBm
根据声音的振动,在传播的过程引起大气压强的变化,使用声压作为测量量来计算声音的分贝值。除了自然产生的声音外,现在大多数的声音都是使用电信号作为存储和传播的载体的,例如电视广播,各种音频文件等。dBm,dBu,dBV是使用和电信号相关的物理量作为被测物理量,计算其产生声音的分贝值。dBm是使用产生声音信号的功率作为被测物理量,选择1毫瓦(1mW)作为基准值,计算分贝值。计算公式: \[ dBm = 10 \times \log_{10}(\frac{P}{1 \times 10^{-3}})),\ \mbox{P是被测电工率} \]
- dBu
电功率可以由电压\[V\]和电阻\[R\]计算得到:\[P = \frac{V^2}{R}\],由该公式可以得到dBu,使用电压作为测量量,计算声音的分贝值。在十九世纪三十年代,音频设备的输入电阻都是600欧姆,也就上面公式中的 R = 600
欧姆。在dBm中,使用 1mW
作为基准值,那么在 R = 600 欧姆时就可以得到此时的电压为\[\sqrt{PR}=\sqrt{10^{-3}\times 600}=0.775V\]。所以,dBu是以电压作为测量量,计算声音的分贝值,选择的基准电压为0.775V。计算公式: \[
dBu = 20 \times \log_{10}(\frac{V}{0.775}),\mbox{V是被测电压}
\]
- dBv
上上个世纪音频设备的输入阻抗都是600欧姆,是固定不变的。但是到了现代,就有了更高阻抗的设备,例如1000欧姆,这样再选择0.775作为电压的基准值,显然是不合理的。所以,就有了一个新基准值1V。本质上dBu和dBV是没有区别的,都是选择电压作为被测单位,只是选择的基准值不同罢了。dBV仍然是以电压作为被测量,计算声音的分贝值,选择1V作为基准值。计算公式: \[ dBV = 20 \times \log_{10}(\frac{V}{1}) \]
dBFS是什么?
前面的几个被测量都是模拟量,在数字时代更多的音频分贝表示是dBFS。dBFS的全称为Decibels Full Scale,全分贝刻度,是数值音频分贝值的表示方法。和前面几个不一样的时,dBFS的基准并不是最小的或者是中间的某一个值,是最大的那个值!也就是说0dBFS是数字设备能达到的最大值,除了最大值外都是负值。以数字音频采样位为无符号16位(即位深为2 byte/16 bit,用16位2进制数字刻画音频信号,范围是0-65536),16位的无符号的最大值为\(65536(2^{16})\),因此dBFS的计算公式: \[ dBFS = 20 \times \log_{10}(\frac{sample}{65536}) \] 这样,\(min\ dBFS=20 \times \log_{10}{\frac{1}{65536}} = -96dBFS\)。也就是说16位无符号音频的动态范围为\(0dBFS\sim-96dBFS\)。
dBFs和dBu之间的转换
dBu是度量模拟信号的,而dBFS是度量数字信号的,并且dBFS不会用于度量模拟信号,所以没有在dBu和dBFS之间没有统一的转换公式,依赖于具体的数字设备。在dBu和dBFS转换时,需要规定一个峰值电压,该电压下产生的音频信号经过AD转换后得到的sample为0dBFS。例如,+18dBu对应于0dBFS,在该条件下 求 xdBu对应于ydBFS,那么就有\(y=x-18\)。
总结
本文主要介绍和声音相关的分贝概念,分贝不同于其他的物理单位,表示的是相同物理量的比值,其具体的值依赖于选择的被测量。
- dBSPL,通常所说的dB,使用声压作为被测量,选择20μPa20μPa作为基准值。
- dBm,使用功率作为被测量,选择1mW作为基准值。
- dBu,使用电压作为被测量,选择0.775V作为基准值。
- dBV,和dBu一样,使用电压作为被测量,选择1V作为基准值。
- dBFS,和上面的量都不相同,上面的量都是测量模拟值的,dBFS是测量数字音频的,其选择的基准值为sample的最大值为0dBFS,其他的值都为负值。
dBFS和模拟量之间的转换,例如dBu,需要规定一个基础的对应关系。例如+18dBu 对应于0dBFS,则\[ydBFS = x - 18\]。
测量单位 | 基准值 | 物理符号 |
---|---|---|
声压 SPL (Pa/帕斯卡) | \[2×10^{−5}Pa/20μPa\] | dBSPL |
电功率 (W/瓦特) | \[1mW\] | dBm |
电压(V/伏特) | \[0.775V\] | dBu |
电压(V/伏特) | 1V | dBV |
数字信号测量值(bit/比特) | 65536 | dBFS |
声(音)强级/声(音)强等级(sound intensity level)
- 声强的单位是瓦/米,声强级的单位是分贝。
声强级(SIL)是声音的声强与基准声强的比值取常用对数再乘以10的值,也是一种描述声音强弱的单位,定义为单位面积上的声音功率。在物理学中,把单位时间内通过垂直于声波传播方向的单位面积的平均声能,称为声强。声强用\[I\]表示,单位为瓦/平米。实验的研究表明,人对声音强弱的感觉并不是与声强成正比,而是与其对数成正比的。这正是人们使用声强级来表示声强的原因。其单位为贝尔声强级(贝尔,Bel)。 \[ L = log_{10}(\frac{I}{I_{ref}}) \] 一般人对强度相差十倍贝尔的两个声音便可区别出来,因此用贝尔的十倍来作为声强的单位则更为方便,这个单位称为分贝尔(decibel),简称分贝(dB),即: \[ SIL = 10 \times log_{10}(\frac{I}{I_{ref}}) \] 式中\[I\]为声强,\[I_ref=10^{-12} 瓦/平米\]称为基准声强,声强级的常用单位是分贝(dB)。从物理上说,音强决定于发音体振动的振幅。振幅越大,音强越强。从生理上说,音强取决于发音时声门下压力的大小。发音时发音器官的肌肉活动增强(用力大),呼出的气流量大,则气流对发音器官的压力大,则发音体振幅大,于是音强就强;反之,音强就弱。
声(音)压级/声(音)压等级(sound pressure level)
- 声压的单位是帕斯卡 ,声压级的单位是分贝。
声压等级是我们用来科学描述声音大小的物理量。声压等级(SPL)和即时压力的均方根(rms)直接联系。在分贝这种单位下,声压等级为零时,大概是一个听力正常的人刚好不能听到声音的声音大小。也就是说,当即时压力的均方根与刚好听不到的声音比值为1时,计声压等级为0。由于人的听力由基因和后天环境决定,所以人和人的听力都是有差异的,科学家对很多人进行了统计,从而规定了一个大概人们刚好不能听到声音的大小为 \[ dBSPL = 0 \]
两个 50dB 的声压级加在一起不是 100dB 而是 53dB。
响度(loudness)
响度又称音响,是与声强相对应的声音大小的知觉量。声强是客观的物理量,响度是主观的心理量。响度不仅跟声强有关,还与振幅/声压和频率相关,以1kHz为基准值;
为了在数量上估计一个纯音的响度,就把这个纯音和1000Hz的某个声强级的纯音在响度上作比较。这两个声音在听觉上认为是相同的响度时,就可以把1000Hz纯音的这个声强级规定为该频率纯音的响度级。响度级的单位为方(Phon)。响度是和听感相关的量,与振幅/声压和频率相关,以1kHz为基准值。
也就是说声强级可以直接用于表示响度。
响度由固定的赫兹来表示,决定因素的人的听觉,不同的人可能会产生不同的结果。
- 以下内容存疑:
空气颗粒移动速度的导数就是空气颗粒速度(v)。特性声阻(specific acoustic impedance)等于声压(p)与空气颗粒速度(v)的比值。 \[ \textcolor{Green} {Specific\ Acoustic\ Impedance = p / v} \] 可以推得振幅与声压的关系,从而推得其与声压等级,进而与响度的关系。
增益(gain)
增益(GAIN)是调整信号电压,控制小信号放大的倍数。处于放大电路的最前端,决定了灵敏度和信噪比,决定了灵敏度和信噪比,调整时强音偶尔点亮指示灯,最强音刚好常亮即可,过大容易破声、削波,过小信噪比低。
话筒利用磁生电将声音产生的震动转化成微弱的电压变化,增益负责将这种微弱的震动放大。
音量(volume)
- 百度百科解释:
音量又称响度、音强,是指人耳对所听到的声音大小强弱的主观感受,其客观评价尺度是声音的振幅大小。这种感受源自物体振动时所产生的压力,即声压。物体振动通过不同的介质,将其振动能量传导开去。人们为了对声音的感受量化成可以监测的指标,就把声压分成“级”——声压级,以便能客观的表示声音的强弱,其单位称为“分贝”(dB)。也就是说音量就是响度、音强的别称。
- 音频电路中的音量控制:
音量调节音频设备的输入阻抗,是衰减器。阻抗是电阻和电抗的总和。电阻是指在直流电中,物体对电流的阻碍作用。在交流点中,除了电阻会阻碍电流,电容和电感也会阻碍电流,这就是电抗了。阻抗值其实对音质没有关键性影响。但是,如果阻抗过低,造成电流过大,也容易使声音失真。音量旋钮,位于前置放大电路前端,有刻度且0dB为最大的话,-10dB是正常演出的音量最佳(也就是保留10dB的动态裕量。耳放道理相同,音源的输出电平高,增益应该调低,反之调高。
阻抗高,意味着同样的输出功率,加到耳机上的电流就小了,要更大的功率才能充分驱动。低阻耳机只要一点点功率就足以驱动起来。 听感上你是听不出耳机阻抗高低的。录音室使用的耳机很多是300欧或600欧,但这只是因为调音台的阻抗匹配
白噪音
非周期性的振动产生的声波由于杂乱无章,又称为噪音,其中含有各种频率,且每种频率的强度一致的噪音成为白色噪音(white noise).
声音的三大主观属性
声音的三个主要的主观属性,包括音量(响度)、音调、音色(也称音品)。
音量(volume)
音调(pitch)
表示人的听觉分辨一个声音的调子高低的程度。音调主要由声音的频率决定,同时也与声音强度有关。
频率影响音调 对一定强度的纯音,音调随频率的升降而升降,物体振动的快,发出声音的音调就高。振动的慢,发出声音的音调就低。
响度影响音调 对一定频率的纯音、低频纯音的音调随声强增加而下降,高频纯音的音调却随强度增加而上升。大体上,500 赫兹以下的低频纯音的音调随响度的增加而下降,1500 赫兹以上高频纯音的音调随响度的增加而上升。
对音调可以进行定量的判断。音调的单位称为美(mel):取频率1000赫兹、声压级为40 分贝的纯音的音调作标准,称为1000 美,另一些纯音,听起来调子高一倍的称为2000 美,调子低一倍的称为500 美,依此类推,可建立起整个可听频率内的音调标度。这样得到的声压级40 分贝的纯音音调与频率的关系见下表:
频率f/Hz | 音调/mel | 频率/fHz | 音调/mel |
---|---|---|---|
20 | 0 | 900 | 929 |
30 | 24 | 1000 | 1000 |
40 | 46 | 1250 | 1154 |
60 | 87 | 1500 | 1296 |
80 | 126 | 1750 | 1428 |
100 | 161 | 2000 | 1545 |
150 | 237 | 2500 | 1771 |
200 | 301 | 3000 | 1962 |
250 | 358 | 3500 | 2116 |
300 | 409 | 4000 | 2250 |
350 | 460 | 5000 | 2478 |
400 | 508 | 6000 | 2657 |
500 | 602 | 7000 | 2800 |
600 | 690 | 10000 | 3075 |
700 | 775 | ||
800 | 854 |
音调高:空灵,清凉,纤细 音调低:雄浑,澎湃,粗犷
音色/音品(Timbre)
声音的品质叫做音色,又叫音品,它反映了每个物体发出的声音特有的品质。
音色是指不同声音表现在波形方面总是有与众不同的特性,不同的物体振动都有不同的特点。
不同的发声体由于其材料、结构不同,则发出声音的音色也不同。例如钢琴、小提琴和人发出的声音不一样,每一个人发出的声音也不一样。因此,可以把音色理解为声音的特征。
频谱和功率谱
频谱是频率谱密度的简称,就是频率的分布曲线。复杂振荡分解为振幅不同和频率不同的谐振荡,这些谐振荡的幅值按频率排列的图形叫做频谱。广泛应用在声学、光学和无线电技术等方面。它对信号的研究从时域引到频域,从而带来更直观的认识。
频谱是从频域范围对音频进行分析的结果,
本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!