你是否曾经在寝室的夜晚,偷偷戴着MP3播放器躺在被窝里静静地听着喜欢的音乐?那个时候我们还没有智能手机、还没有高速网络。许多无聊的时光就靠各式各样的MP3播放器陪我们读过的,可能是一个人听,也或许是通过3.5mm孔口的分线器与喜欢的人分享音乐。我们对MP3已经不能再熟悉了,但是你知道MP3其实并不只是一个播放器的名字,还是一种编码和格式吗?又是谁发明了MP3呢?
MP3到底是什么?
MP3其实是一种非常流行的音频文件编码和有损压缩格式。它的出现在很大程度上促进了现代数字音乐在线使用率的快速增长,而且给我们消费音乐的方式带来了很大的变化。它完整的名称叫“动态图像专家组音频层 - 3”(MPEG-1 Audio Layer III)。
MPEG代表的是“动态图像专家组”,该组织成立于1988年,致力开发视频、音频的压缩编码技术。MPEG是国际标准组织(ISO)的一个分支,其总部位于日内瓦,负责为全球各行各业制定标准。
各地的跑步者都要感谢MP3的发明
MP3可以将单声道或立体声道的数字音频压缩到其原始大小的十分之一左右的电脑上、CD、DVD或MP3播放器中(HiFi 党听的无损格式音乐为.flac大小刚好为一般MP3的十倍)。这一过程其实是会损失一点音频质量的,但相比较而言,对于大多数人来说,MP3已经是很好的选择了。
MP3是如何将音频压缩的呢?
首先,MP3编码器将音频数据量化为数字,将这些数字全部除以另外一个数字并且进行舍入来缩小。这样可以缩放音频的各个频带以调整精度。
然后,编码器使用霍夫曼编码(一种无损数据压缩的熵编码),将这些数字转换成更短的二进制信息串。这样一个过程就保持了尽可能高的音质,同时又减少了数据文件的大小。
霍夫曼树 图源/wikipedia
除此之外,MP3还利用了一些“心理声学”的知识(比如人们如何感知声音)来将音频文件压缩到更小。
比如,它会丢弃人耳实际听得到的声音范围之外的数据(我们人耳的听觉范围是20Hz到20,000Hz)。
MP3编码也使用了哈斯效应,这是一种双耳心理声学效应:在第一声发出后25-35毫秒内发出第二声,我们人耳只能听到一个整体融合的声音;但是如果超过35毫秒,我们就能听出第二声源。MP3编码可以将一些相似的声音整合,从而减少数据。这种丢弃音频数据的方法倾向也是MP3被称为有损压缩方法的原因。(也是一些发烧友不待见的原因)
这也是我们玩吃鸡时能听音辩位的原因 图源/google
这项荣誉归谁?
MP3格式从1995年开始流行于全世界,但它的发展早在几年前就开始了。MP3根源于许多早期的数字编码研究,其中最值得注意的是Karlheinz Brandenburg的博士论文,他常被一些人称为“MP3之父”,但如果遇到他本人,他一定会告诉你这不是他一个人能够完成的。
MP3的发明团队,戴耳机的为Karlheinz Brandenburg 图源/google
20世纪80年代初,Brandenburg 在攻读博士学位期间,其教授鼓励他和其他学生研究通过综合业务数字网(ISDN)电信线路传输音乐文件的方法。Brandenburg 则研究了心理声学,并且提出了一种高效的音频压缩算法,他称之为频域最优编码(OCF)。
后来 Brandenburg 成为了助理教授并继续他的研究,他曾与弗劳恩霍夫集成电路研究所(德国56家研究机构的成员,弗劳恩霍夫协会成员)合作,与纽伦堡大学建立起了合作关系。在研究所中,OCF由团队进行了改进,得到了许多其他研究人员的帮助,一种叫做自适应光谱感知熵编码(ASPEC)编解码器就这样诞生了。
在20世纪80年代末和90年代初期,MPEG收到了各个团体的提议,希望采用它们的编码方法。MPEG选择了多种提案,将这些提案合并为三种格式:MPEG-1 Audio Layer I,Layer II和Layer III。其中MPEG-1 Audio Layer III就是主要基于ASPEC。
Brandenburg 和在弗劳恩霍夫集成电路研究所参与该项目的其他工程师一起开发了MP3编码和解码所需要的软件和硬件。1993年,Brandenburg 正式加入弗劳恩霍夫集成电路研究所成为其中一员,担任音频/多媒体部门的负责人。2000年,因为MP3的发明,Brandenburg 等三人代表整个团队获得了“德国未来奖”。2007年,国际消费电子协会(CEA)将 Brandenburg 和另外两名主要贡献者引入了 CEA 的名人堂。
PS:CEA名人堂 是国际消费电子协会为那些对消费电子领域做出突出贡献或创造过大众熟知的电子产品的创始人或工程师所设计的最高荣誉。从工业时代的托马斯・爱迪生到 LG 电子、森海塞尔的创始人、苹果公司创始人史蒂夫・乔布斯、沃兹尼亚克还有 PS 之父久多良木健都是 CEA 名人堂中的成员...
每一项创新都依赖于先前的突破,因此在MP3出现之前所做的相关研究不可忽视。例如,哈斯效应是以赫尔穆特哈斯的名字命名的,赫尔穆特哈斯于1949年在他的博士论文中提出了这一想法。同年,克劳德·香农和罗伯特·范宁提出了赫夫曼编码的前身。大卫·霍夫曼是法诺的学生,他在1952年改进了他们的技术。MP3研究人员就是正在这些巨人的肩膀上才获得的成功。
甚至当年的美国歌手苏珊娜·薇佳(Suzanne Vega)也在其中做出过一个小小的贡献,因为 Brandenburg 和他的团队曾经尝试压缩她的歌曲“Tom's Dinner”的无伴奏版,以确认其音频压缩技术是否成熟。
MP3的影响和未来
回到当年,很少有人能够预测到MP3对于未来音乐产业的冲击。1997年,MP3播放器软件 Winamp 上市。同年,微软的 Windows Media Player 开始支持MP3 格式文件播放。在20世纪90年代末期,各种各样昂贵的MP3便携播放器也开始出现,比如之前猫哥介绍过的 Walkman系列以及后来苹果设计的 iPod...
Saehan Information System的 MPMAN 图源/wikipedia
因为MP3的无处不在,更加方便了音乐的传播过程。1999年,点对点(P2P)音乐共享服务 Napster 推出,它提供了前所未有的规模化数字音乐,因此还引发了许多侵权、非法音乐下载、盗版等争议。美国唱片协会 ahi 追究了 Napster及个人音乐下载者的责任,最终 Napster 在2001年被关闭。
但是数字音乐的趋势无法逆转,许多工作室虽然在继续打击盗版,但还是接受了在线音乐销售的方式。工作室开始将他们的大部分音乐许可给Apple、亚马逊等公司。
JJW认为:其实在中国,公众的版权意识太弱了,许多这样的行为放在其他国家可能都是犯法的。或者说,国内的盗版产业十分猖狂,原创正版只能依靠忠实粉丝的支持才能够获得部分利润。这也是我们能够在国内获得许多免费资源的原因,不知道是幸运还是不幸。
对于未来,MP3已经深入我们的生活之中,这已经成了数字音乐的常态,它拥有者强大的用户基础和更长的历史。虽然目前已经出现了AAC格式(高品质音乐格式),它比MP3表现出了更好的性能,但是由于专利保护,它的使用范围较小且大多是需要收费的。
MP3这个词伴随了我们整整一代人,或许未来高速网络的普及会让MP3逐渐退出时代的舞台,更高品质的无损音乐将走上巅峰。但是它给我们带来的音乐体验是无法替代的。
如果真有那么一天到来,不要忘记它的存在。