音频文件相关的属性概念整理,比如:比特率、采样率、声道、位深度 等等

音频文件格式&有损/无损格式

我们试听或者下载音乐的时候,常常会看到 音质 选择。

属性含义

1. 采样率

采样率指的是在数字化信号处理中,每秒钟对模拟信号进行采样的次数。采样率决定了数字信号能够多精确地表示原始模拟信号。

采样频率一般共分为 22.05KHz、44.1KHz、48KHz 三个等级。

  • 22.05 KHz: FM 广播的声音品质
  • 44.1KHz: CD 音质
  • 48KHz: DVD 音质

2. 比特率

比特率是指每秒钟传输的数据量,单位通常是比特每秒(bps,bits per second),通常用千比特每秒(kbps)来表示。比特率直接影响音频的质量和文件大小。以下是一些常用的音频比特率及其应用场景:

  • 低质量:64 kbps到128 kbps(适合网络传输)
  • 中等质量:128 kbps到192 kbps(适合普通播放)
  • 高质量:192 kbps到320 kbps(接近CD音质)
  • 无损音频:300 kbps到1000 kbps(专业音频制作)

3. 位深度

音频位深度(Bit Depth)是指每个采样点所使用的比特数,它决定了音频信号的精度和动态范围。位深度越高,音频信号的细节越丰富,动态范围也越大。

精度: 位深度越高,每个采样点可以表示的数值范围越大,从而能够更精细地表示音频信号。

[!Note] 例如,8位位深度可以表示 (2^8 = 256) 个不同的值,而16位位深度可以表示 (2^{16} = 65536) 个不同的值。

动态范围: 动态范围是指音频信号的最大值与最小值之比。位深度越高,动态范围越大。

[!Note] 例如,16位位深度的动态范围约为96 dB(分贝),而24位位深度的动态范围约为144 dB。

常见的位深度

  • 8位(8-bit): 通常用于早期的计算机游戏音频和简单的音频应用。 动态范围较小,约为48 dB。适用于低质量音频。

  • 16位(16-bit): 最常见的位深度,广泛应用于CD音频和其他高质量音频格式。 动态范围约为96 dB。适用于大多数音频播放和录音场合。

  • 24位(24-bit): 高质量音频录制和后期制作中常用的位深度。 动态范围约为144 dB。适用于专业音频制作和高端音频设备。

  • 32位(32-bit): 极高的精度,通常用于音频处理和浮点运算。 动态范围超过192 dB。适用于专业音频处理和高端音频设备。

4. 声道

当人听到声音时,能对声源进行定位,那么通过在不同的位置设置声源,就可以造就出更好的听觉感受,如果配合影像进行音频位置的调整,则会得到更好的视听效果。常见的声道有:

  • 单声道,mono

  • 双声道,stereo,最常见的类型,包含左声道以及右声道

  • 2.1声道,在双声道基础上加入一个低音声道

  • 5.1声道,包含一个正面声道、左前方声道、右前方声道、左环绕声道、右环绕声道、一个低音声道,最早应用于早期的电影院

  • 7.1声道,在5.1声道的基础上,把左右的环绕声道拆分为左右环绕声道以及左右后置声道,主要应用于BD以及现代的电影院