声明:此文虽不是100%原创,但没有一个字是从网上复制得来的KKK打字爆慢,受了显示器好几个小时的辐射折磨才完工,所以恳请大家耐心看看,如有不同意见---我正等着挨骂呢,呵呵!对于MP3的拥护者,我没有长MD帮志气而灭MP3派威风的意思,我主要是想让你们真正认识MD的优越性,而消除以往的种种曲解,如有关于MP3的深层资料,还望赐教!
最近关于md和mp3何者更优秀的贴子又多了起来,我专门收集了一些有关md的深层资料,以供各位从一个比较客观的角度来重新衡量这两种压缩算法的优劣.
在深入分析MD的算法之前,我们先来了解一些有关CD的知识:唱片记录的16BIT&44.1KHZ的数码信号在一秒时间里记录的信息总量为16*2*44100/8=0.175MBYTE.但实际上在这1.4MBIT的数据中,不但有相当部分的是在平时空置不用的,而且还有一些是被浪费的(人们设计CD时,是让CD记录下全部模拟信号的量化编码结果,可想而知,这是多大的浪费).这就是说,一张650MBYTE的光盘上所记录的并不都是在还原模拟信号时有用的数据.这正是MD实现压缩算法的前提---即CD有一定的裁员空间.
但这还不是数码压缩,通俗说来只能算是种对空间的节约.MD要压缩的,是模拟信号的量化编码结果;简单的说,就像WINZIP那样对数字数据进行压缩.MD使用的压缩技术即自适应声频编码ATRAC,其实现原理称为频谱(频率成分)记录.MD的音源信号和CD一样也是16BIT的数码信号,不过MD会把这种信号分解成频谱后再加以分析记录(这并不意味着MD会把数码信号逐一转换为相应的频率信号,在MD上只需表示出瞬间的振幅即可)此时,MD把信号划分为0.02毫秒间隔的512份,以供频谱分析.(512分共有11.6毫秒的间隔,对人耳来说这是个极短的时间周期,所以可以认为在这个周期中音乐信号是无变化的,这才使MD有条件去分析这一期间的频谱)而频谱分析则是对11.6毫秒周期(通常,在11.6毫秒内的信号均属有规则的反复过程;但是遇到上升沿陡峭的诸如打击乐之类的声音信号时,要缩短抽样时间范围后再进行分析;同样有时也有必要增长抽样时间范围;所以11.6毫秒并非一成不变)中的各个正弦信号来个称为变形离散余弦变换MDCT的特殊运算,最后把结果以数字方式加以记录.
单靠频谱记录还不能使压缩比达到最大;实际上,还会对频谱分析的结果做一个选择.上文提到512个频带的间隔并非一定是11.6毫秒,这称为不均一的灵活频带划分,他涉及一个"临界带宽"的概念:当频率相近的强音与弱音同时出现时,弱音会由于掩蔽效应而不被听见;如果两者的频率相差很远,即使两个声音的强弱对比悬殊,掩蔽效应也微乎其微,即掩蔽效应只有在两个强弱对比悬殊的声音信号的频率接近到某种程度时才有效(在1KHZ时,临界带宽为160HZ,即在840~1160HZ范围内,掩蔽效应会起作用;当频率增加到10.5KHZ时,临界带宽也随之扩展为2.5KHZ,即在8~13KHZ范围内,掩蔽效应会起作用.可见掩蔽效应起作用的临界带宽会因频率而异)所以在利用掩蔽效应来决定舍弃两各声音中的一个时必须考虑频率范围这一因素.而ATRAC正是考虑到了临界带宽的特点,让中频以下的分割频带较窄,高频的分割频带较宽,使临界带宽在较大的频率范围内都会起作用.现在,我们可以理解到ATRAC为何使512个频带的间隔不同的好处了吧---为了更好的利用掩蔽效应来更彻底的忽略人耳听不道的声音!
MD的压缩技术的妙处还在于充分利用了"量化噪声"这一数码处理的弊端来进一步加深压缩深度.众所周知,数码化模拟信号时,连续变化的模拟信号的振幅会由一级级的数码表示,当遇到中间值时必须采用四舍五入的方式,将中间值归入上一级或下一级,这样就使得数码信号还原出的模拟信号不像原来那么圆滑,即产生失真.这种失真也可视为原信号被加入了新的成分---干扰噪声而造成的.所以原模拟信号的一部分会因为量化噪声而被掩蔽,徒然的记录倒不如大方的舍弃(这是ATRAC的特征之一)如某16BIT信号含有4BIT量化噪声,那就只记录12BIT,
这样在重放时就只能得到12BIT的振幅---显然与原信号不符,因此必须注明该信号是由16BIT压缩为12BIT的,这样就能使原来含有4BIT噪声的不圆滑信号不仅变得圆滑,而且更合理的利用了数据位
此外,MD还进行另一种频谱分析:把信号用QMF(QUADRATURE MIRROR FILTER)滤波器分为低(0~5.5KHZ)中(5.5~11KHZ)高(11~22KHZ)三个频带,而且各段宽度只有输入时的一半(因此MDCT对QMF输出进行抽样时可采取一半的比率)当然,由于与理想滤波器存在一定偏差,将信号一分为二后以一半比率进行抽样时会产生"折叠误差".为此,QMF在解码时要通过三段频带的合成来抵消折叠误差成分.可见,由于频带减少一半而使得抽样结果也减少了一半,数据位的利用率又有了提高!
至此,MD的压制过程,也就是ATRAC的原理总算笼统的交待了一遍.就算再看不明白的人,也会感到,这是一种非常人性化的压缩技术.之所以有那么多人认为现在的MP3已经和MD不相上下甚至已经超越了MD(我指压制技术)
是因为绝大多数人用的随身听的条件限制了ATRAC的优越性,一旦高档的台式机(如安桥的利物浦)出来叫阵,MP3是不会有任何机会的.至于为何MP3能够在这种情形下活到(或者说是发展到)今天,在我看来,是该技术的开放性受到了欢迎(或是利用)在对盗版异常饥渴的西方,MP3一开始处于利益争论不休却没人管的良好发展环境中,而ATRAC却由于索尼的死心眼(或是小日本的小家子气)被关在了闺阁中.
有人说,MP3会随着半导体的发展而发展,最终会有一天闪存会物美价贱,从而让广大MD拥护者重投MP3的怀抱.而MD就不会发展了吗?这类观点单纯得就像50年代有人乐观的认为50年中国会超过当时的列强一样---幼稚的三岁小孩的理想!在我看来,只要索尼愿意,MD至少还可以发展出和今天的MO一样的功能,然后在盘片的容量上还可以做做文章(想象一下DVD的盘片容量吧)
最近有很多关于LP4作课堂录音的贴子,我想总结一下我的体会.以前,我一直认为LP4是种单声道压缩格式,
现在我发现这并不完全正确.LP4的左右两个声道的确不是独立的,他是对左右声道的信号进行合并式编码,并使左右声道的相似部分剥离出来增加压缩比.可见是种并接式的立体声,两个声道的内容基本一致.单声道驻极体话筒和标准的随生听用双声道话筒我都用过,驻极体话筒虽是单声道的,但由于话筒内部接线的原因,回放时两个声道都有声音,而且特性一致;而用随生听用双声道话筒录制的内容在回放时,两个声道的音量很不一致(我坐在靠墙的位置)听回放内容时,这是很不舒服的.所以我建议大家去买个好点的单声道的话筒(如IMAC上的那个话筒,3.5插头各节点定义与随身听用话筒不同,需自己动手改一下,它的灵敏度时很高的,而且IMAC上的东西,外形绝对COOL!)
-------------------------------------------------------------------------------------------
这个家伙很懒,什么也没留下......