|
音频采样率与比特率
. b7 {( p. O3 ]) E% }/ o- H2 V6 T" T& x x# ^4 M; Q
9 s# ~; m( }0 ^0 |( u" V$ A
简单来讲,采样率和比特率就像是坐标轴上的横纵坐标。
6 A7 |8 e, T" T, ]( Y; `: S6 ?
横坐标的采样率表示了每秒钟的采样次数。
0 X: l9 m3 i9 O, n& t3 u$ q. n纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。7 E- d8 j/ K; n! J* d& H; P8 N
采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ采样的声音,绝大部分人已经觉察不到其中的分别了。5 }/ l4 k: l# ~, X) o0 p4 d# v, T
而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。5 X: X6 A' K" X% S! v
当你理解了以上这两个概念,比特率就很容易理解了。以电话为例,每秒3000次取样,每个取样是7比特,那么电话的比特率是21000。而CD是每秒44100次取样,两个声道,每个取样是13位PCM编码,所以CD的比特率是44100*2*13=1146600,也就是说CD每秒的数据量大约是1446KB,% z4 d- d1 @) B0 ], F; h
/ l `0 s& i) O0 o) b. X8 f比特率这个词有多种翻译,比如码率等,表示经过编码(压缩)后的音频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最少的单位,要么是0,要么是1。比特率与音频压缩的关系简单的说就是比特率越高音质就越好,但编码后的文件就越大;如果比特率越少则情况刚好翻转。6 L7 J. j& F9 r; J) E
+ i; R1 `5 W6 C1 ^4 L+ ]% c
9 x5 y) B$ i$ E5 ?; dVBR(Variable Bitrate)动态比特率 也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式;% T8 B- k& P/ Q7 L9 w2 [! x
ABR(Average Bitrate)平均比特率 是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。
# O8 l* H: U5 Y9 JCBR(Constant Bitrate),常数比特率 指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高
8 l9 U: p' {4 R5 P% ?9 A3 X! p! _ |
|