各种音频编码方式的对比
- 格式:docx
- 大小:73.97 KB
- 文档页数:7
音频编码格式比较MPFLAC和WAV音频编码格式比较 MP3、FLAC 和 WAV随着数字音频的快速发展,人们对音频编码格式的需求也越来越多。
在众多音频编码格式中,MP3、FLAC 和 WAV 是最常用的几种格式。
本文将对这三种格式进行比较,包括其特点、优缺点以及适用场景。
通过了解它们的差异,读者可以更好地选择适合自己需求的音频编码格式。
1. MP3MP3(MPEG-1 Audio Layer 3)是最流行的音频编码格式之一。
它具备以下特点:- 压缩比高:MP3 通过去除音频信号中的冗余部分,实现对音频数据的高压缩比。
这使得 MP3 的文件大小相对较小,方便存储和传输。
- 相对较低的音质损失:尽管 MP3 使用了有损压缩算法,但通过合理的压缩参数设置,音质损失可以控制在较低的程度。
- 广泛兼容性:MP3 格式得到了广泛的应用和支持,在各类设备和平台上都能得到良好的兼容。
然而,MP3 也存在一些缺点:- 原始音质较差:由于 MP3 使用了有损压缩算法,相比无损格式,如 FLAC 和 WAV,原始音质会有所损失。
- 频谱细节丢失:为了减小文件大小,MP3 在压缩过程中会丢失一些频谱细节。
对于非专业音频需求,这个损失可能并不明显。
适用场景:- 在存储空间有限或带宽有限的情况下,选择 MP3 格式可以减小音频文件大小,方便网络传输和存储。
- 对音频质量要求一般,例如背景音乐、在线广播等。
2. FLACFLAC(Free Lossless Audio Codec)是一种无损音频编码格式,其特点包括:- 无损压缩:FLAC 通过压缩音频数据,但不损失任何音质信息,实现了无损的音频编码。
解码后的音质与原始音频完全一致。
- 高保真音质:相比于有损压缩格式,FLAC 能够还原音频的原始质量,提供更高保真的音质体验。
- 高兼容性:FLAC 格式在各类音频设备和软件中都得到了良好的支持,可以广泛应用。
然而,FLAC 的缺点也不容忽视:- 文件大小较大:由于是无损压缩,FLAC 文件大小通常较大,占用较多的存储空间和带宽。
24bit音乐和16bit音乐及多音乐编码格式的解析24bit音乐和16bit音乐及多音乐编码格式的解析现在绝大部分音乐CD,是16bit的。
声音信息是以16bit形式记录在唱片上的。
播放音乐CD,也就是16bit声音信息的重放。
16bit能处理的最大的声音与最小的声音的倍数是96db(db是分贝,声响的单位)。
夜深人静,我们的房间里声音的响度大约是20db,交通繁忙时市中心的街口,是100db,喷气式飞机飞天时,声响可达140db。
正常说话的声音响度约是50db,大声说话,声音响度会有60-70db,军事教官操练士兵时发的口号声可达90-100db。
所以16bit的CD唱片的信息不能完全记录实际世界的声音变化---16bit,最多可记录96db的声音差别。
并且由于数字化,声音的变化最小是1bit,难以细分声音的微小差别:以最大的声音16个1来比较,最小的声音变化1bit,是2的16次方分之一;以平均声响(10bit)来比较,则只有2的10次方分之一了,2的10次方约1000,也就是说16bit的CD唱片只有千分之一的分辨度,所以听CD唱片,有时候感觉甚至不如听卡式磁带“好听”。
卡式磁带录音机,是前CD时代的音乐载体。
磁带,由于磁粉的非均匀度等原因,噪声很大,整体上说,信号与噪声之比最多能达到60db,做了非线性处理以后,信噪比能达到70db。
单从信噪比上,磁带是不能与CD唱片相比(CD唱片的信噪比,轻松达到90db),但是,从声音的变化分辩度上,磁带记录的是模拟信号,不是象CD的数字信号,不是人能够听到的声音变化,所以感觉有时候卡式磁带比CD要细一些。
这个问题,一般称为“数码声”,就是CD的声音是“数码声”,不细,有些“空”。
注:信噪比(Signal/Noise),通常以S/N表示,单位为分贝(dB)。
模拟的时代,还有一种记录介质叫---LP,信噪比约80db。
LP,黑胶唱片(不是指黑胶CD),Long Playing唱片。
音视频编码标准的对比分析随着数字技术的快速发展和普及,音视频编码技术也迅猛发展。
为了适应不同的使用场景和需求,人们开发了多种编码标准。
本文将从压缩率、视频质量、编解码速度和适用领域四个方面对常见的音视频编码标准进行分析和比较,以期为读者提供更全面、系统的了解。
一、压缩率压缩率指的是编码后的音视频文件大小与未压缩文件大小之比。
一般情况下,压缩率越高,文件大小越小,传输和存储成本越低。
常见的音视频编码标准包括H.264、H.265、AV1和VP9等,它们的压缩率如下:1. H.264H.264是一种广泛使用的视频编码标准,具有很高的兼容性和稳定性。
它的压缩率相对较低,在同等视频质量下,文件大小通常比其他标准要大。
2. H.265H.265是一种高效的视频编码标准,也称为HEVC。
相比于H.264,在同等视频质量下,H.265的压缩率可以提高40%-60%,文件大小更小。
3. AV1AV1是由联合视频编码小组(Alliance for Open Media,简称AOM)开发的一种新型视频编码标准。
它借鉴了现有的编码标准,并进行了优化,压缩率比H.265更高。
4. VP9VP9也是由Google开发的一种视频编码标准,与AV1类似,也是由现有的标准进行优化。
它的压缩率比H.264高,但比H.265和AV1低一些。
综合来看,AV1的压缩率最高,H.264的压缩率最低,而H.265和VP9介于两者之间。
二、视频质量视频质量是衡量一个视频编码标准好坏的重要指标之一。
常见的评估方法有RMSE和PSNR等,这里不再赘述。
下面是不同编码标准在视频质量方面的表现:1. H.264H.264具有较好的画质表现,尤其对于快速移动的物体,能够保持较高的清晰度和稳定性。
2. H.265H.265在相同码流下具有更好的画质表现,可以在高压缩比下保持较高的清晰度和细节还原度。
3. AV1AV1在视频质量方面表现优异,可以在压缩率很高的情况下仍然保持高质量的视频。
各种主流无损音频之间的区别是什么?随着高清音频的概念逐渐的被更多人知晓,很多人也逐渐的关注起无损音频。
一直以来无损音频的兼容性也是困扰很多网友的一个问题,同时种类繁多的编码以及格式也让人摸不着头脑,下面我们就罗列几个目前较为主流的无损音频格式,同时也带来了它们彼此的一些对比,说不定能够解开你们心中的疑惑。
no.1有损压缩的优劣势因为早期受到存储容量和网络宽带的限制,一直以来电脑当中经常使用有损压缩编码来存储音频,其中MP3就是使用非常普遍的一种格式。
有损压缩能够达到很高的压缩比,比如5分钟左右的音乐采用320k码率的MP3压缩能够做到10MB左右,相比于无损不压缩格式的,要有很大的优势,不过有损压缩响应的也会使得原始数据丢失,而且码率越小也就越明显,同时听感上也有非常明显的失真,虽然能够满足大部分用户的需要,但是作为HIFI的音源显然是不可行的。
no.2常见的几种无损音频无损编码除了WAV、AIFF、DFF这类的不压缩文件的格式之外,各类的无损压缩的编码、格式非常多,像ape、flac、alac等了解的人会比较多,但是TTA、TAK、WMA lossless、WAVPACK等这种就相对会冷门一些,因为宽带和兼容性的问题,即便是现在无损音频的使用程度依然不是很大。
APE很多网友都应该知道这是一种无损的压缩编码格式,全称是Monkey's Audio,文件的拓展名为ape,这种编码格式是由Matthew T. Ashland开发的,是一种非商业化的产品,ape在压缩比方面会有巨大的优势,同时也允许用户在编码的时候设置多种的压缩等级,不过最大的压缩等级情况下解码是需要硬件配置比较高的,目前缺乏设备的原生支持,大部分移动设备自带的播放器都不能解码ape,需要我们自行下载专门的第三方播放器,而支持ape的硬件设备就更少了,仅仅是飞傲等品牌的几款HiFi播放器能够原生支持。
ALACApple Lossless Audio Codec的缩写,显然这是由苹果开发,到了11年苹果公开了它的源代码,ALAC属于是MPEG-4 Part 14标准的一部分,使用的是m4a格式封装,因为之前是属于苹果的私有编码,所以基本上只支持自家的软硬件,即便是现在开源,alac支持的设备依然不是很多,alac除了能够支持CD规格的音频压缩之外,最大是能够支持八声道的,16-32bit位深,384kHz采样率的音频压缩,应对未来的高清毫无压力。
比较两种音频编码方式:MP3与FLACMP3与FLAC是两种常见的音频编码方式,在音频压缩方面具有不同的优缺点。
本文将介绍MP3和FLAC编码方式的原理、特点,以及优劣势的区别,帮助读者更好地理解音频编码技术。
一、MP3编码方式1.原理MP3是一种有损压缩音频编码技术。
具体而言,它采用了人类听觉知觉原理,通过去除人耳听不出的音频信号,减少冗余数据,以达到压缩音频的目的。
此过程中,基于FFT(快速傅里叶变换)技术,将音频数据进行分段处理,然后进行量化与编码,再保存至文件中。
2.特点①文件体积小,最多可压缩1:12;②码率可调,音质有很大的可调性;③广泛应用于音乐播放器、移动设备等终端设备;④可“刻板化”,即同等码率下,不同压缩软件产生的音质可能有较大差别。
3.优缺点①优势MP3是一种流行的编码方式,因其压缩率高、应用广泛、操作简便、可调码率等优点,很受用户喜爱。
②缺陷然而,由于其为有损数据压缩方式,故重要信息可能会有损失;此外,同样的码率下,压缩失真程度较大,无法保证音质完整性。
二、FLAC编码方式1.原理FLAC全称Free Lossless Audio Codec,即无损音频编码格式。
FLAC采用带有探测音频数据中的稳定的不规则性的预测算法,用线性预测滤波(LP)方法对音频信号进行处理,再通过编码压缩,以生成不过是自我保证完好无损数据。
2.特点①体积小、音质清晰:FLAC的良好无损压缩方式减少了音频数据大量的部分,同时还保持了最原始的音质,因此在存储、传输等方面有着较高的性价比。
②精简易懂:FLAC编码器拥有基于语句的语法,编码方式共有38个语句,易于使用,且具有良好的可读性。
③适用范围广:由于FLAC码率较小,它在网络传输和存储中非常方便,经常被用作音频存储和分发。
④无损要求:FLAC编码只适用于音频设备,不能符合设备的适用要求。
3.优缺点①优势FLAC是一种惠及于音乐爱好者和媒体制作人的编码方式,既保证了音频文件的原始质量,又能满足网络传输和存储的各种需求,因此在一些音乐爱好者和媒体发行商中受到了欢迎。
各种音频编码方式的对比各种音频编码方式的对比内容简介:文章介绍了PCM编码、WMA编码、ADPCM 编码、LPC编码、MP3编码、AAC编码、CELP编码等,包括优缺点对比和主要应用领域。
PCM编码(原始数字音频信号流)类型:Audio制定者:ITU-T所需频宽:1411.2 Kbps特性:音源信息完整,但冗余度过大优点:音源信息保存完整,音质好缺点:信息量大,体积大,冗余度过大应用领域:voip版税方式:Free备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD 以及我们常见的WAV文件中均有应用。
因此,PCM 约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。
要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。
一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2 =1411.2Kbps。
我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
WMA(Windows Media Audio)类型:Audio制定者:微软公司所需频宽:320~112kbps(压缩10~12倍)特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。
优点:当Bitrate小于128K时,WMA最为出色且编码后得到的音频文件很小。
缺点:当Bitrate大于128K时,WMA音质损失过大。
WMA标准不开放,由微软掌握。
应用领域:voip版税方式:按个收取备注:WMA的全称是Windows Media Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。
电脑音频编码技术常见音频格式的比较和应用场景随着数字技术的不断发展,电脑音频编码技术也在不断进步,各种音频格式应运而生。
在日常生活中,我们常常接触到各种不同格式的音频文件,比如MP3、WAV、AAC等。
每种音频格式都有其特点和优势,针对不同的应用场景有不同的使用。
一、MP3格式MP3是目前应用最广泛的音频格式之一,它采用压缩算法可以将音频文件大小缩小至原始大小的十分之一,从而减少了存储空间的占用。
MP3格式在音乐欣赏、网络传输等方面有着广泛的应用,因其压缩比高和兼容性好而备受青睐。
二、WAV格式WAV是一种无损音频格式,它保留了音频文件的所有信息,音质更加纯净和逼真。
WAV格式适用于一些对音质要求较高的场景,比如音乐制作、录音等。
由于其文件较大,存储空间相对较大,因此在对音质要求高的情况下更为适用。
三、AAC格式AAC是一种高级音频编码格式,它具有更好的压缩性能和音质表现力,相较于MP3格式有更高的音质。
AAC格式适用于一些对音质要求较高的场景,比如影视欣赏、音乐制作等。
由于其压缩性能和音质表现力优秀,因此在各种专业领域被广泛应用。
四、FLAC格式FLAC是一种无损音频格式,它保留了音频文件的所有信息,音质和WAV格式相媲美。
FLAC格式适用于对音质要求极高的场景,比如专业音乐制作、无损音乐欣赏等。
由于其无损特性,因此在对音质要求极高的领域被广泛应用。
五、AMR格式AMR格式是专门为移动通信领域设计的音频格式,其压缩比高和音质较差,适用于一些对音频传输速度要求较高的场景。
在移动通信领域,AMR格式常常用于语音通话、语音留言等场景。
总结来看,不同的音频格式各有优势,针对不同的应用场景有不同的选择。
在日常使用中,我们可以根据需要选择合适的音频格式来满足需求,从而获得更好的音频体验。
【字数超过1500字】。
19种音频格式介绍及音质压缩比的比较目录前言 (3)1.数码音乐简介 (3)2.WMV格式 (5)3.MP3格式 (5)4.WMA格式 (6)5.Mp3Pro格式 (6)6.MOD格式 (7)7.RA系列 (7)8.MD格式 (8)9.ASF格式 (8)10.AAC格式 (9)11.VQF格式 (9)12.MID格式 (9)13.OGG格式 (10)14.M4A格式 (11)15.AAC+格式 (11)16.AIFF与AU格式 (12)17.CD格式 (12)18.WAV格式 (13)19.FLAC格式 (13)20.APE格式 (14)21.压缩比比较: (15)22.音质比较: (15)前言在日常生活中,我们会听各种音乐,而这些音乐大多数都是以数码的形式传播的,无论是在电脑上试听或下载还是在MP3或CD机上试听。
当然也会经常看到各式各类的诸如MP3、WMV、APE等格式,但你是否明白这些格式的意思呢?下面小编就为你整理了一些这方面的内容,希望能有帮助。
1.数码音乐简介数字音源,也就是数字音频格式,最早指的是CD,CD经过压缩之后,又衍生出多种适于在随身听上播放的格式,这些压缩过的格式,我们可以分为两大类:有损压缩的和无损压缩的。
这里所说的压缩,是指把PCM编码的或者是WAV格式的音频流经过特殊的压缩处理,转换成其他格式,从而达到减小文件体积的效果。
有损/无损,是指经过压缩过后,新文件所保留的声音信号相对于原来的PCM/WAV 格式的信号是否有所削减。
PCM编码是Pulse Code Modulation的缩写,又叫脉冲编码调制,它是数字通信的编码方式之一,其编码主要过程是将话音、图像等模拟信号每隔一定时间进行取样,使其离散化,同时将抽样值按分层单位四舍五入取整量化,同时将抽样值按一组二进制码来表示抽样脉冲的幅值。
数码音频信号的最终形式仍然是“0/1”构成的。
它们可能是任何排列和组合,比如“0001110101”或者“11100001010”。
蓝牙耳机的音频传输方式蓝牙耳机作为一种无线音频设备,能够与手机、平板电脑、电脑等蓝牙设备进行无线连接,实现音频的传输和收听。
在蓝牙耳机中,音频传输方式起着至关重要的作用,它决定了音质的好坏以及连接的稳定性。
本文将就蓝牙耳机的音频传输方式进行详细介绍。
一、蓝牙音频分析与编码方式蓝牙耳机的音频传输主要通过蓝牙技术来实现,而蓝牙技术又有多种音频分析与编码方式。
在蓝牙规范中,常见的音频传输方式包括SBC,AAC,aptX等。
1. SBC (Sub-Band Coding)SBC是一种基本的音频编码方式,通过将音频信号分为多个子频带,对每个子频带进行编码。
由于SBC编码率较低,音质相对较差,但兼容性较好,广泛应用于蓝牙耳机中。
2. AAC (Advanced Audio Coding)AAC是一种高级音频编码方式,它具有更高的编码效率和更好的音质表现。
相比于SBC,AAC编码能够提供更为清晰、富有细节的音频体验。
但是,AAC编码方式要求蓝牙耳机和连接设备都支持AAC,以获得最佳的音频传输效果。
3. aptXaptX是一种由CSR公司开发的音频编码方式,它能够提供更高质量的音频传输。
aptX编码方式在保证高音质的同时,还能够降低音频传输的时延,提升连接的稳定性。
然而,aptX编码要求耳机和发送设备都支持aptX才能发挥其优势。
二、蓝牙耳机的音频传输协议蓝牙耳机的音频传输不仅与编码方式相关,还与传输协议密切相关。
目前,蓝牙耳机主要采用的音频传输协议有A2DP和AAC。
1. A2DP (Advanced Audio Distribution Profile)A2DP是一种蓝牙音频分发协议,它定义了蓝牙设备间音频数据的传输方式。
A2DP协议可以实现高质量音频的传输,并支持双通道立体声。
大多数蓝牙耳机都采用A2DP协议进行音频传输。
2. AAC (Advanced Audio Coding)除了作为编码方式,AAC也可作为传输协议在蓝牙耳机中应用。
电脑音频编码格式介绍选择适合你的格式随着科技的不断发展,电脑音频编码格式成为我们日常生活中不可或缺的一部分。
音频编码格式的选择对于我们使用电脑、手机、平板等设备来播放音频文件所产生的影响非常重要。
本文将介绍几种常见的电脑音频编码格式并分享一些选择适合个人需求的技巧。
一、无损音频编码格式1. WAV(Waveform Audio File Format)WAV是一种无损音频编码格式,它以其高音质和对音频数据的准确性而闻名。
WAV文件通常较大,因为它们没有经过任何压缩处理,但其音质优秀。
尤其适合那些追求高保真音质的专业音频工作者。
2. FLAC(Free Lossless Audio Codec)FLAC是一种免费的无损音频编码格式,其压缩率较高,能够将音频文件压缩至原始文件大小的一半或更小。
FLAC文件不损失音频质量,但同时也保留了足够的空间,可供音频编辑和后期处理使用。
对于音频发烧友以及需要经常编辑音频文件的个人用户而言,FLAC是一个不错的选择。
二、有损音频编码格式1. MP3(MPEG Audio Layer-3)MP3是一种有损音频编码格式,它选择性地删除人耳听觉上不敏感的音频内容,从而实现了对音频文件的压缩。
MP3文件较小,适合用于网络传输和存储,同时也在各种设备上广泛使用。
然而,由于其压缩算法的特性,MP3会损失一些细节和音频质量。
2. AAC(Advanced Audio Coding)AAC是一种高效的有损音频编码格式,它提供了更好的音频质量和更低的比特率(音频数据传输速率)。
与MP3相比,AAC在相同比特率下能够提供更好的音质。
由于其优质的音频表现,AAC已成为许多移动设备和音频播放器的首选格式。
三、选择适合个人需求的音频编码格式的技巧1. 根据存储空间进行选择如果您拥有较大的存储空间并且追求最高的音频质量,无损音频编码格式如WAV或FLAC是较好的选择。
如果您的存储空间有限,可以考虑使用有损音频编码格式如MP3或AAC来节省空间。
了解电脑音频格式和编码在现代科技的快速发展下,电脑已经成为人们生活中不可或缺的一部分。
在使用电脑进行各种操作时,音频是我们经常会涉及到的一个方面。
然而,对于普通用户来说,对电脑音频格式和编码的了解可能相对较少。
因此,本文将就电脑音频格式和编码进行介绍和解释,帮助大家更好地了解和使用电脑音频。
首先,我们需要了解什么是电脑音频格式。
简单地说,音频格式指的是音频文件在存储和传输过程中所采取的文件格式。
不同的音频格式对于存储空间和音质有不同的要求和限制。
在电脑中常见的音频格式有MP3、WAV、FLAC等等。
MP3是最常见和广泛使用的音频格式之一。
它采用了一种称为“有损压缩”的编码技术,即通过减少音频文件的部分信息,来达到减小文件大小的目的。
虽然MP3格式可以实现较小的文件大小,但其音质相对于原始音频会有一定的损失。
与MP3相比,WAV是一种无损音频格式。
它以较高的音质为代价,保留了音频文件的原始完整性。
由于WAV文件采用的是无损压缩技术,所以相较于MP3格式,它的文件大小更大。
除了MP3和WAV以外,FLAC也是一种常见的音频格式。
FLAC格式是一种无损压缩格式,与WAV相比可以实现更小的文件大小,同时保持了较高的音质。
因此,FLAC格式常被音乐爱好者和专业人士所采用。
了解了电脑音频格式后,我们还需要了解什么是音频编码。
音频编码指的是将原始音频信号转换成数字音频文件的过程。
在电脑中,常见的音频编码方式有PCM、AAC、AC3等。
PCM是一种常见的音频编码方式,它将音频信号进行采样和量化,并以数字形式进行存储。
PCM编码可以保持音频的原始完整性,但相对于其他编码方式来说,它会占用较大的存储空间。
AAC是一种高效的音频编码方式,它可以在保持相对较小文件大小的同时,提供较高的音质。
由于其出色的音质和高压缩比,AAC编码方式在音乐和视频文件中得到了广泛应用。
AC3是一种多声道音频编码方式,例如在影片中常见的5.1声道。
常用的语音编码方法有常用的语音编码方法主要包括:PCM(脉冲编码调制)、ADPCM(自适应差分脉冲编码调制)、MP3(MPEG音频层3)、AAC(高级音频编码)、OPUS、GSM(全球系统移动通信)、ILBC(无损语音编码器)、G.722等。
1.PCM(脉冲编码调制)PCM是最常用的语音编码方法之一,将模拟语音信号采样后,通过量化和编码来数字化语音信号。
PCM编码质量较好,但占用存储空间较大。
2.ADPCM(自适应差分脉冲编码调制)ADPCM是对PCM的改进,通过预测和差分编码的方式来压缩语音数据。
ADPCM编码可以减小文件大小,但也会损失一定的音质。
3.MP3(MPEG音频层3)MP3是一种无损的音频压缩格式,通过删除人耳难以察觉的音频信号细节来减小文件大小。
MP3编码在音质和文件大小之间取得了平衡,成为广泛应用于音乐和语音传输的标准格式。
4.AAC(高级音频编码)AAC是一种高级音频编码方法,能够提供较好的音质和较小的文件大小。
AAC在广播、音乐和视频领域都有广泛应用。
5.OPUSOPUS是一种开放和免版权的音频编码格式,适用于广泛的应用场景,如实时通信、网络音频流传输等。
OPUS编码可以根据不同场景的需求,在音质和延迟之间做出灵活权衡。
6.GSM(全球系统移动通信)GSM编码是一种在移动通信领域广泛使用的语音编码方法,它通过移除语音频带中的高频和低频信息来实现数据压缩。
7.iLBC(无损语音编码器)iLBC是一种专为网络语音传输设计的编码格式,能够在高丢包环境下提供较好的语音质量。
8.G.722G.722是一种宽带语音编码方法,提供更好的语音质量和更宽的频带宽度,适用于音频和视频会议等高质量语音通信场景。
1. 音频简介经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等.44100HZ 16bit stereo: 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);22050HZ 8bit mono: 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道;当然也可以有 16bit 的单声道或 8bit 的立体声, 等等。
采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。
采样值是指每一次采样周期内声音模拟信号的积分值。
对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位(左声道)和低八位(右声道)分别代表两个声道。
人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100已是CD音质, 超过48000的采样对人耳已经没有意义。
这和电影的每秒 24 帧图片的道理差不多。
每个采样数据记录的是振幅, 采样精度取决于储存空间的大小:1 字节(也就是8bit) 只能记录 256 个数, 也就是只能将振幅划分成 256 个等级;2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;4 字节(也就是32bit) 能把振幅细分到 4294967296 个等级, 实在是没必要了.如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.这样我们就可以根据一个 wav 文件的大小、采样频率和采样大小估算出一个wav 文件的播放长度。
譬如 "Windows XP 启动.wav" 的文件长度是 424,644 字节, 它是"22050HZ / 16bit / 立体声" 格式(这可以从其 "属性->摘要" 里看到),那么它的每秒的传输速率(位速, 也叫比特率、取样率)是 22050*16*2 = 705600(bit/s), 换算成字节单位就是 705600/8 = 88200(字节/秒), 播放时间:424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒)。
各种音频格式介绍大全AAC音频的来源及特性其实,AAC的技术早在1997年就成型了,当时被称为MPEG-2 AAC,但是随着2000年MPEG-4音频标准的出台,MPEG-2 AAC被用在这一标准中,同时追加了一些新的编码特性,所以它就改称为MPEG-4 AAC。
与MP3不同,AAC的技术掌握在多家厂商手中,这使得AAC编码器非常多,既有纯商业的编码器,也有完全免费的编码器。
纯商业的编码器如Fraunhofer IIS 的FhG、杜比公司的Dolby AAC,免费的有Free AAC、苹果公司的iTune,Nero也通过它的Nero 6提供了Nero AAC。
AC是一种高压缩比的音频压缩算法,它的压缩比可达20:1,远远超过了AC-3、MP3等较老的音频压缩算法。
一般认为,AAC格式在96Kbps码率的表现超过了128Kbps的MP3音频。
AAC另一个引人注目的地方就是它的多声道特性,它支持1~48个全音域音轨和15个低频音轨。
除此之外,AAC 最高支持96KHz的采样率,其解析能力足可以和DVD-Audio的PCM编码相提并论,因此,它得到了DVD论坛的支持,成为了下一代DVD的标准音频编码。
AAC的家族非常庞大,有9种规格,可适应不同场合应用的需要。
其中LC 低复杂性规格去掉了预测和增益控制模块,降低了复杂度,提高编码效率,是目前使用得最多的规格。
CD:一般来说大家能听到最好的音频格式就是CD了,CD是无损的格式,所以能最大限度的还原声音,而且CD的解码比起其他格式,如MP3等要容易,但同时CD的体积也很大,标准CD格式也就是44.1K的采样频率,速率1411KB/S,16位量化位数,其实CD是以音轨的形式存在的,在电脑上识别为*.cda的样子,这个cda文件只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。
所以直接复制这个文件到硬盘上是没有用的,如果想复制的话我们只有用软件把它转换成其他的格式。
音频编解码标准PCMU(G.711U)类型:Audio制定者:ITU-T所需频宽:64Kbps(90.4)特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。
优点:语音质量优缺点:占用的带宽较高应用领域:voip版税方式:Free备注:PCMU and PCMA都能够达到CD音质,但是它们消耗的带宽也最多(64kbps)。
如果网络带宽比较低,可以选用低比特速率的编码方法,如G.723或G.729,这两种编码的方法也能达到传统长途电话的音质,但是需要很少的带宽(G723需要5.3/6.3kbps,G729需要8kbps)。
如果带宽足够并且需要更好的语音质量,就使用PCMU 和 PCMA,甚至可以使用宽带的编码方法G722(64kbps),这可以提供有高保真度的音质。
PCMA(G.711A)类型:Audio制定者:ITU-T所需频宽:64Kbps(90.4)特性:PCMU和PCMA都能提供较好的语音质量,但是它们占用的带宽较高,需要64kbps。
优点:语音质量优缺点:占用的带宽较高应用领域:voip版税方式:Free备注:PCMU and PCMA都能够达到CD音质,但是它们消耗的带宽也最多(64kbps)。
如果网络带宽比较低,可以选用低比特速率的编码方法,如G.723或G.729,这两种编码的方法也能达到传统长途电话的音质,但是需要很少的带宽(G723需要5.3/6.3kbps,G729需要8kbps)。
如果带宽足够并且需要更好的语音质量,就使用PCMU 和 PCMA,甚至可以使用宽带的编码方法G722(64kbps),这可以提供有高保真度的音质。
ADPCM(自适应差分PCM)类型:Audio制定者:ITU-T所需频宽:32Kbps特性:ADPCM(adaptive difference pulse code modulation)综合了APCM的自适应特性和DPCM 系统的差分特性,是一种性能比较好的波形编码。
⾳视频中的CBR,VBR,ABRCBR:固定码率 CBR(Constants Bit Rate)即,就是静态(恒定)的意思,CBR是⼀种固定的压缩⽅式。
优点是压缩快,能被⼤多数软件和设备⽀持,缺点是占⽤空间相对⼤,效果不⼗分理想,现已逐步被的⽅式取代。
固定码率是⼀个⽤来形容通信服务质量(QoS,Qualityof Service)的术语。
和该词相对应的词是或可变⽐特率(英⽂variable bit rate,缩写VBR)。
当形容编解码器的时候,指的是编码器的输出码率(或者解码器的输⼊码率)应该是固定制(常数)。
当在⼀个带宽受限的信道中进⾏多媒体通讯的时候CBR是⾮常有⽤的,因为这时候受限的是最⾼码率,CBR可以更好的易⽤这样的信道。
但是CBR不适合进⾏存储,因为CBR将导致没有⾜够的码率对复杂的内容部分进⾏编码(从⽽导致质量下降),同时在简单的内容部分会浪费⼀些码率。
⼤部分编码⽅案的输出都是可变长的码字,例如霍夫曼编码或者游程编码(run-length coding),这使得编码器很难做到完美的CBR。
编码器可以通过调整量化(进⽽调整编码质量)来部分的解决这个问题,如果同时使⽤填充码来完美的达到CBR。
(有时候,CBR也指⼀种⾮常简单的编码⽅案,⽐如将⼀个16位精度的⾳频数据流通过抽样得到⼀个8位精度的数据流)。
VBRVBR(VariableBit Rate)。
也就是⾮固定的⽐特率,软件在编码时根据⾳频数据的复杂程度即时确定使⽤什么⽐特率,这是以质量为前提兼顾⽂件⼤⼩的编码⽅式。
VBR也称为动态⽐特率编码,使⽤这个⽅式时,你可以选择从最差⾳质/最⼤压缩⽐到最好⾳质/最低压缩⽐之间的种种过渡级数,在MP3⽂件编码之时,程序会尝试保持所选定的整个⽂件的品质,将选择适合⾳乐⽂件不同部分的不同⽐特率来编码。
主要优点是可以让整⾸歌的⾳质都能⼤致达到我们的品质要求,缺点是编码时⽆法估计压缩后的⽂件⼤⼩。
各种主流音频编码格式介绍一、PCM编码PCM 脉冲编码调制是Pulse Code Modulation的缩写。
前面的文字我们提到了PCM大致的工作流程,我们不需要关心PCM最终编码采用的是什么计算方式,我们只需要知道PCM编码的音频流的优点和缺点就可以了。
PCM编码的最大的优点就是音质好,最大的缺点就是体积大。
我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
二、W A VE这是一种古老的音频文件格式,由微软开发。
W A V是一种文件格式,符合PIFF Resource Interchange File Format规范。
所有的W A V都有一个文件头,这个文件头音频流的编码参数。
WA V对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为W AV的音频流进行编码。
很多朋友没有这个概念,我们拿A VI做个示范,因为A VI和WAV在文件结构上是非常相似的,不过A VI多了一个视频流而已。
我们接触到的A VI 有很多种,因此我们经常需要安装一些Decode才能观看一些A VI,我们接触到比较多的DivX 就是一种视频编码,A VI可以采用DivX编码来压缩视频流,当然也可以使用其他的编码压缩。
同样,W AV也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的W A V,但这不表示W A V只能使用PCM编码,MP3编码同样也可以运用在W A V中,和A VI一样,只要安装好了相应的Decode,就可以欣赏这些W A V了。
在Windows平台下,基于PCM编码的W A V是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,W A V也是音乐编辑创作的首选格式,适合保存音乐素材。
因此,基于PCM编码的W A V被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。
各种音频编码格式对比WAVE:是微软公司开发的一种声音文件格式,它符合Resource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。
WAVE 文件作为最经典的Windows 多媒体音频格式,应用非常广泛,它使用三个参数来表示声音:采样位数、采样频率和声道数。
声道有单声道和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和44100Hz (44kHz)三种。
“*.WAV”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。
WAV音频格式的优点包括:简单的编/解码(几乎直接存储来自模/数转换器(ADC)的信号)、普遍的认同/支持以及无损耗存储。
WAV格式的主要缺点是需要音频存储空间。
对于小的存储限制或小带宽应用而言,这可能是一个重要的问题。
WAV 格式的另外一个潜在缺陷是在32位WAV文件中的2G限制,这种限制已在为SoundForge开发的W64格式中得到了改善。
MP3:MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。
根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2”/“*.mp3”这3种声音文件。
MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz 到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV 格式的声音文件。
各种音频编码方式的对比————————————————————————————————作者: ————————————————————————————————日期:ﻩ各种音频编码方式的对比内容简介:文章介绍了PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、CELP编码等,包括优缺点对比和主要应用领域。
PCM编码(原始数字音频信号流)ﻫ类型:Audio制定者:ITU-T所需频宽:1411.2Kbpsﻫ特性:音源信息完整,但冗余度过大优点:音源信息保存完整,音质好缺点:信息量大,体积大,冗余度过大ﻫ应用领域:voipﻫ版税方式:Freeﻫ备注:在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV文件中均有应用。
因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。
要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。
一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为44.1K×16×2 =1411.2Kbps。
我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
WMA(Windows MediaAudio)类型:Audio制定者:微软公司所需频宽:320~112kbps(压缩10~12倍)特性:当Bitrate小于128K时,WMA几乎在同级别的所有有损编码格式中表现得最出色,但似乎128k 是WMA一个槛,当Bitrate再往上提升时,不会有太多的音质改变。
ﻫ优点:当Bitrate小于128K时,WMA 最为出色且编码后得到的音频文件很小。
ﻫ缺点:当Bitrate大于128K时,WMA音质损失过大。
WMA标准不开放,由微软掌握。
ﻫ应用领域:voipﻫ版税方式:按个收取ﻫ备注:WMA的全称是WindowsMedia Audio,它是微软公司推出的与MP3格式齐名的一种新的音频格式。
由于WMA在压缩比和音质方面都超过了MP3,更是远胜于RA(Real Audio),即使在较低的采样频率下也能产生较好的音质,再加上WMA有微软的WindowsMedia Player做其强大的后盾,所以一经推出就赢得一片喝彩。
ADPCM( 自适应差分PCM)ﻫ类型:Audio制定者:ITU-Tﻫ所需频宽:32Kbps特性:ADPCM(adaptive difference pulse code modulation)综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。
ﻫ它的核心想法是:①利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;②使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。
ﻫ优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)ﻫ缺点:声音质量一般ﻫ应用领域:voip版税方式:Freeﻫ备注:ADPCM (ADPCM Adaptive Differential Pulse Code Modulation),是一种针对16bit(或者更高?) 声音波形数据的一种有损压缩算法, 它将声音流中每次采样的16bit 数据以4bit存储, 所以压缩比1:4而压缩/解压缩算法非常的简单, 所以是一种低空间消耗,高质量声音获得的好途径。
LPC(Linear PredictiveCoding,线性预测编码)ﻫ类型:Audio制定者:ﻫ所需频宽:2Kbps-4.8Kbps特性:压缩比大,计算量大,音质不高,廉价ﻫ优点:压缩比大,廉价缺点:计算量大,语音质量不是很好,自然度较低ﻫ应用领域:voipﻫ版税方式:Free备注:参数编码又称为声源编码,是将信源信号在频率域或其它正交变换域提取特征参数,并将其变换成数字代码进行传输。
译码为其反过程,将收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。
具体说,参数编码是通过对语音信号特征参数的提取和编码,力图使重建语音信号具有尽可能高的准确性,但重建信号的波形同原语音信号的波形可能会有相当大的差别。
如:线性预测编码(LPC)及其它各种改进型都属于参数编码。
该编码比特率可压缩到2Kbit/s-4.8Kbit/s,甚至更低,但语音质量只能达到中等,特别是自然度较低。
CELP(CodeExcited LinearPrediction码激励线性预测编码)类型:Audioﻫ制定者:欧洲通信标准协会(ETSI)ﻫ所需频宽:4~16Kbps的速率ﻫ特性:改善语音的质量:①对误差信号进行感觉加权,利用人类听觉的掩蔽特性来提高语音的主观质量;②用分数延迟改进基音预测,使浊音的表达更为准确,尤其改善了女性语音的质量;ﻫ③使用修正的MSPE准则来寻找“最佳”的延迟,使得基音周期延迟的外形更为平滑;ﻫ④根据长时预测的效率,调整随机激励矢量的大小,提高语音的主观质量;⑤使用基于信道错误率估计的自适应平滑器,在信道误码率较高的情况下也能合成自然度较高的语音。
结论:①CELP算法在低速率编码环境下可以得到令人满意的压缩效果;ﻫ②使用快速算法,可以有效地降低CELP算法的复杂度,使它完全可以实时地实现;③CELP可以成功地对各种不同类型的语音信号进行编码,这种适应性对于真实环境,尤其是背景噪声存在时更为重要。
优点:用很低的带宽提供了较清晰的语音ﻫ缺点:-应用领域:voipﻫ版税方式:Freeﻫ备注:1999年欧洲通信标准协会(ETSI)推出了基于码激励线性预测编码(CELP)的第三代移动通信语音编码标准自适应多速率语音编码器(AMR),其中最低速率为4.75kb/s,达到通信质量。
CELP码激励线性预测编码是Code Excited Linear Prediction的缩写。
CELP 是近10年来最成功的语音编码算法。
CELP语音编码算法用线性预测提取声道参数,用一个包含许多典型的激励矢量的码本作为激励参数,每次编码时都在这个码本中搜索一个最佳的激励矢量,这个激励矢量的编码值就是这个序列的码本中的序号。
CELP已经被许多语音编码标准所采用,美国联邦标准FS1016就是采用CELP的编码方法,主要用于高质量的窄带语音保密通信。
CELP(Code-Excited Linear Prediction)这是一个简化的LP C算法,以其低比特率著称(4800-9600Kbps),具有很清晰的语音品质和很高的背景噪音免疫性。
CELP是一种在中低速率上广泛使用的语音压缩编码方案。
MPEG-1audiolayer 1类型:Audio制定者:MPEGﻫ所需频宽:384kbps(压缩4倍)特性:编码简单,用于数字盒式录音磁带,2声道,VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。
优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。
可以达到“完全透明”的声音质量(EBU音质标准)ﻫ缺点:频宽要求较高应用领域:voip版税方式:Free备注:MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:ﻫ--层1(Layer 1):编码简单,用于数字盒式录音磁带ﻫ--层2(Layer2):算法复杂度中等,用于数字音频广播(DAB)和VCD等--层3(Layer3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍MUSICAM(MPEG-1audio layer 2,即MP2)类型:Audioﻫ制定者:MPEGﻫ所需频宽:256~192kbps(压缩6~8倍)特性:算法复杂度中等,用于数字音频广播(DAB)和VCD等,2声道,而MUSICAM由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。
ﻫ优点:压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。
可以达到“完全透明”的声音质量(EBU音质标准)缺点:应用领域:voipﻫ版税方式:Freeﻫ备注:同MPEG-1 audio layer 1MP3(MPEG-1 audiolayer 3)类型:Audioﻫ制定者:MPEG所需频宽:128~112kbps(压缩10~12倍)特性:编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍,2声道。
MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术,在当时的技术条件下,MP3的复杂度显得相对较高,编码不利于实时,但由于MP3在低码率条件下高水准的声音质量,使得它成为软解压及网络广播的宠儿。
ﻫ优点:压缩比高,适合用于互联网上的传播ﻫ缺点:MP3在128KBitrate及以下时,会出现明显的高频丢失应用领域:voip版税方式:Freeﻫ备注:同MPEG-1 audio layer 1MPEG-2 audio layerﻫ类型:Audioﻫ制定者:MPEG所需频宽:与MPEG-1层1,层2,层3相同特性:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
ﻫ优点:支持5.1声道和7.1声道的环绕立体声ﻫ缺点:-应用领域:voip版税方式:按个收取ﻫ备注:MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。
AAC(Advanced Audio Coding,先进音频编码)类型:Audioﻫ制定者:MPEGﻫ所需频宽:96-128kbpsﻫ特性:AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音声道,以及15路数据。
它可同时传送16套节目,每套节目的音频及数据结构可任意规定。
ﻫAAC主要可能的应用范围集中在因特网网络传播、数字音频广播,包括卫星直播和数字AM、以及数字电视及影院系统等方面。
AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。
具有48个主要音频通道,16 个低频增强通道,16个集成数据流, 16个配音,16 种编排。
优点:支持多种音频声道组合,提供优质的音质ﻫ缺点:-应用领域:voipﻫ版税方式:一次性收费备注:AAC于1997年形成国际标准ISO13818-7。