|
|
一、关于MIDI的几个初步概念
1 J5 x% T# f* H! ]4 W8 j6 T& U* Z' c" x- a" Z2 @2 X
( Y* ~/ O) n+ H. B1 \5 j
在切入正题以前让我们首先来简单地认识一下MIDI,了解几个初步的概念。这对于我们了解波表合成技术可以起到“引航”地作用。7 h% k6 {. v3 D. P$ Q% N# o
: y6 k1 T3 M0 O& }1 k3 l1 D
1.MIDI简介
% a1 y& P0 ^5 k& p/ s5 W; o9 `. x5 t; P4 |& z9 u
MIDI是Musical Instrument Digital Interface的简称,意为音乐设备数字接口。它是一种电子乐器之间以及电子乐器与电脑之间的统一交流协议。从80年代初问世至今,它经历了长时间的发展,现已成为电脑音乐的代名词。我们可以从广义上将为理解为电子合成器、电脑音乐的统称,包括协议、设备等等相关的含义。" r$ C" q: r0 B' y; [% S9 u W( W2 c- N
) x! X; p9 ?0 z( y9 \/ D 2.三个标准
; I2 H# W6 ?9 E$ J3 P+ b7 D4 l5 y3 p
/ w& k6 S8 ]# q4 F 由于早期的MIDI设备在乐器的音色排列上没有统一的标准,造成不同型号的设备回放同一首乐曲时也会出现音色偏差。为了弥补这一不足,便出现了GS、GM和XG这类音色排列方式的标准。1 Z' B/ |5 X7 c5 b0 u) V
0 _( m2 m( |3 C6 ^0 ~& O- r 之所以将GS排在第一位是由于它最早出台,并且是由业界大名鼎鼎的ROLAND公司制定并推出的。ROLAND是日本非常出名的电子乐器厂商,其生产开发的电子键盘、MIDI音源以及软波表都享有盛誉。所以GS颇具权威性,它完整的定义了128种乐器的统一排列方式,并规定了MIDI设备的最大复音数不可少于24个等详尽的规范。, p6 L3 x0 I0 {% R: A! [* f. m# T! r
" T' j* q8 g' H) K7 \2 q* M# ~
GM标准则是在GS的基础上,加以适当简化而成的。由于它比较符合众多中小厂商的口味,一时间成为了业界广泛接受的标准。
! I5 S8 S; L" `2 t9 P, n8 f
8 ~$ v# g7 O' ~7 U3 K3 t 在电子乐器方面唯一可与ROLAND相匹敌的YAMAHA公司也不甘示弱,于94年推出自己的标准——XG。与GM、GS相比XG提供了更为强劲的功能和一流的扩展能力,并且完全兼容以上两大标准。而且凭借YAMAHA公司在电脑声卡方面的优势,使得XG在PC上有着广阔的用户群。
1 X* e! E7 b6 R. ^7 Y4 }* l; \! h' t6 E. K; Z& C
3.MIDI文件的本质
, y) x3 {/ g+ j
& C) E/ x6 s- R' N$ O" q* y; E1 s 眼下在一些游戏软件和娱乐软件中我们经常可以发现很多以MID、RMI为扩展名的音乐文件,这些就是在电脑上最为常用的MIDI格式。有的朋友可能会惊奇的发现,一首4分钟左右长度的MIDI,其容量只有百余K字节。而同样长度的波形音乐文件(*.WAV)则高达40MB左右,即使是经过高比例压缩处理的MP3也要有4MB大小,相比之下为什么MIDI会如此小巧玲珑呢?因为MIDI文件并非像WAV或MP3那样量化的纪录乐曲每一时刻的声音变化,它只是一种描述性的“音乐语言”,只要将所要演奏的乐曲信息表述下来就可以了。譬如“在某一时刻,使用什么乐器,以什么音符开始,以什么音调结束,加以什么伴奏”等等,这些信息所占用的几十K空间对于如今大容量的硬盘来说只是沧海一粟罢了。而且小巧的体积也成为MIDI越来越受到欢迎的因素之一。
Q: @7 \" o) l, }5 Z) {, [4 K: z6 i
4.MIDI文件的回放合成手段
3 w2 ~; A* ]) D g! N4 K9 X
' @7 e+ _3 b1 P+ _7 [ 既然MIDI文件只是一种对乐曲的描述,本身不包含任何可供回放的声音信息,那么一首首动听的电脑音乐又是如何被我们的声卡播放出来的哪?这就要通过形式多样的合成手段了。就电脑声卡而言,最为常见的手段是FM合成与波表合成。前者多用于以前的ISA声卡,FM是“频率调变”的英文缩写,它运用声音振荡的原理对MIDI进行合成处理。但由于技术本身的局限,加上这类声卡采用的大多数为廉价的YAMAHA OPL系列芯片,效果自然很差劲;而波表合成则要好得多。
$ v2 k+ {% b' D3 J
, ]; [( Y1 r6 p; I: @ x/ i7 S/ G二.MIDI合成技术
9 ]4 L5 y6 M. a6 ~1 [! T% p( H! C$ C) L3 `5 |. P0 `
1. FM合成. m* N T) v4 F- k1 W
/ x Z1 m- ?% h FM合成是根据傅立叶原理——一个任何形状的波形都可以用几个正弦波的叠加来解释。它通过正弦波来模拟各种乐器的波形。但是由于民用市场上,声卡的FM振荡器只有2到3个,因此导致效果很差,坏了FM的名声。实际上,专业领域中FM一般有20个左右的振荡器,效果已经很好了。$ X6 g2 W7 e2 j- i2 M
$ r0 \; k9 m' f. e m: A0 b 2.采样合成
6 I" V" ]9 R9 d' a, O( V) W e! ~, d! d: B) Y) O
提到波表合成,就必须先提到采样。采样通常说来就是一段声音的样本,比如说钢琴中央C的声音。假设如果所有的声音都可以被记录下来,那么当合成时,只需要回放声音样本就可以了。因此,如果可以的话,你可以完全记录下钢琴88个键的声音,到时候回放波形就可以了,效果会很逼真,不是吗?- j8 G# Y# ]" y
/ M/ F u$ e4 A
3.波表合成3 V% y# ?$ X' @+ \. J/ ]4 `! j
4 l# h1 s. Z0 \* ^
采样合成的优点是可以提供最完美的还原效果,但是有一个很大的缺点——容量问题,设想一个乐器——如钢琴,有88键,还有各种不同的音量,那么采样的总量将达到88*N个,假设一个采样需要1MB,这么多的采样需要多大?因此,波表合成产生了。波表合成就是通过一定的算法用有限个真实的采样模拟无限种采样的效果——即真实乐器的效果。波表合成对采样进行升调,降调,增益(提高音量)或衰减(减少音量)的处理,然后输出处理后的波形。波表合成的缺点之一是有些设备的波表是固定的,无法更换。: ^$ q+ z6 X9 w% T/ D* x4 @& h4 L
1 n3 ~# H6 i$ Z% R) B4 I 4.物理建模合成+ I0 j" p2 V: B# n# Q" `5 f
4 o4 f: D$ b3 Z6 F ] K% l 物理建模合成——就是通过建立一个真实乐器的声学模型来模拟真实乐器发声。由于采用的大量的数学和物理模型,因此不需要采样,但是需要极为强大的运算能力。物理建模对于吹管乐器以及弦乐器的还原效果极好!但是也是有缺点的。如果说采样的缺点在于“死”,那么物理建模合成的缺点在于模型太普遍了,无法描述特定乐器的一些特殊个性。比如不同牌子的钢琴和小提琴音色就不同。
+ R+ d# R$ F% p7 s& W) t) N' \) Q9 L- O, @- O
三.MIDI合成的现在与未来% z/ L9 Q3 E4 i9 o7 c
! C D. \# o, o6 J1 d
1.SoundFont& T' P" V) v# I
h' E, l8 Y, U8 L- j
SoundFont是如今民用音乐制作领域中普遍采用的一种采样合成技术,特点就是可以随意更换波表和采样,因此这种技术拥有无穷的扩展力。除了创新AWE32级别以上的声卡支持Soundfont,现在很大一部分合成软件也支持Soundfont了。
, U' b" s3 T5 M8 s8 W; m
/ ~& \5 L0 Z2 d6 W1 }+ @ 2.GIGA Studio% U" r5 S* c8 @% K3 P4 s' n6 t
# o4 M/ R9 I! g/ k& G8 R
这是目前专业领域风头正劲的软采样,它的特点或者说是唯一的优点就是在于可以提供对GB容量级别的采样的支持(好恐怖……)。GigaStudio由于使用了GSIF接口,配合使用此接口的声卡可以达到几乎实时的合成响应速度,只需要配上一块支持GSIF的音频卡,MIDI合成与采样就变得如此简单方便。# h1 j0 |9 I; ~/ e0 {
$ P0 R W2 ?8 r" b% j u0 C" k 3.插件音源
6 W8 d( f3 d1 i+ \& S; E& N4 S& D, W: E9 K/ j& W
也是软件采样或波表的一种,格式主要有VSTi和DXi。即在Cubase或Cakewalk Sonar中使用的音源。/ F) D @. d* I' D: @, x- ^0 W9 {" V
MIDI发展到现在,已经达到了很高的境界。目前MIDI合成部分可以说是“软”风劲吹。现在的音乐家已经越来越依赖于MIDI合成乐器而不是真实乐器了,可以说,再过两年,MIDI乐器的前景将会变得明朗。
& F' K% \; f9 _ |
|