语音压缩编码技术
- 格式:doc
- 大小:28.00 KB
- 文档页数:2
语音压缩编码技术
上传时间:2004-12-22
随着通信、计算机网络等技术的飞速发展,语音压缩编码技术得到了快速发展和广泛应用,尤其是最近20年,语音压缩编码技术在移动通信、卫星通信、多媒体技术以及IP电话通信中得到普遍应用,起着举足轻重的作用。
语音压缩编码技术的类别
语音编码就是将模拟语音信号数字化,数字化之后可以作为数字信号传输、存储或处理,可以充分利用数字信号处理的各种技术。
为了减小存储空间或降低传输比特率节省带宽,还需要对数字化之后的语音信号进行压缩编码,这就是语音压缩编码技术。
语音的压缩编码方法归纳起来可以分为三大类:波形编码、参数编码和混合编码。
波形编码比较简单,失真最小,方法简单,但数码率比较高。
参数编码的编码速率可以很低,但音质较差,只能达到合成语音质量,其次是复杂度高。
混合编码吸收了波形编码和参数编码的优点,从而在较低的比特率上获得较高的语音质量,当前受到人们较大的关注。
语音压缩编码技术的发展
自从1937年A.H.Reeves提出脉冲编码调制(PCM)以来,语音编码技术已有60余年的发展历史。
尤其近20年随着计算机和微电子技术的发展语音编码技术得到飞速发展。
CCITT于1972年确定64kb/sPCM语音编码G.711建议,它已广泛的应用于数字通信、数字交换机等领域,至今,64kb/s的标准PCM系统仍占统治地位。
这种编码方法可以获得较好的语音质量但占用带宽较多,在带宽资源有限的情况下不宜采用。
CCITT于80年代初着手研究低于64kb/s的非PCM编码算法,并于1984年通过了32kb/sADPCM语音编码G.721建议,它不仅可以达到PCM相同的语音质量而且具有更优良的抗误码性能,广泛应用于卫星,海缆及数字语音插空设备以及可变速率编码器中。
随后,于1992年公布16kb/s低延迟码激励线性预测(LD-CELP)的G.728建议。
它以其较小的延迟、较低的速率、较高的性能在实际中得到广泛的应用,例如:可视电话伴音、无绳电话机、单路单载波卫星和海事卫星通信、数字插空设备、存储和转发系统、语音信息录音、数字移动无线系统、分组化语音等。
最后共轭代数码激励线性预测(CS-ACELP)的8kb/s语音编码G.729建议已在1995年11月ITU—TSG15全会上通过,并于1996年6月ITU—
TSG15末此会议上通过G.729附件A减少复杂度的8kb/sCS-ACELP语音编解码器,正式成为国际标准。
这种编码方法延迟小,节省87.5%%的带宽,可以提供与32kb/s的ADPCM相同的语音质量,其音质是同档次码速率中最优的,而且在噪声较大的环境中也会有较好多语音质量。
广泛应用于个人移动通信、低C/N数字卫星通信、高质量移动无线通信、存储/检索、分组语音和数字租用信道等领域。
其它一些国际组织或国家也积极制定自己的标准。
语音压缩技术的现状及发展方向
语音压缩编码技术的发展是十分迅速的,CELP的编码速率较低,但复杂度较高,可以在4.8kb/s左右的码速率上获得较高质量的语音,是当今中低速率语音编码技术的主流技术之一,许多国际标准化组织及机构纷纷将这一编码方案作为语音编码标准。
在对其改善质量、降低复杂度、减少编码延迟等方面都提出了不少新的方法,使CELP在实践中得到广泛应用。
随着DSP技术的发展,CELP技术还具有一定的潜力,例如将G.729扩展到6.4kb/s,用于TDMA/CDMA移动无线系统和DCME。
目前,语音压缩编码技术主要有两个努力方向:一个是中低速率的语音编码的实用化,及如何使用化过程中进一步减低编码速率和提高其抗干扰、抗噪声能力;另一个是如何进一步的降低其编码速率,目前已能在5kb/s-6kb/s的速率上获得高质量的重建语音,下一个目标则是要在4kb/s的速率上获得短延时、高质量的重建语音。
特别是对中长延时编码,人们正在研究其更低速率(如400b/s-1200b/s)的编码算法,在这个过程中当编码速率降至2.4kb/s速率以下时,CELP 算法即使应用更高效的量化技术也无法达到预期的指标,需要其它一些更符合低速率编码要求的算法,目前比较好的算法还有正弦变换编码(STC)、混合激励线性预测编码(MELPC)、时频域插值编码(TFI)、基音同步激励线性预测编码(PSELP)等,同时还要求引入新的分析技术,如非线性预测、多精度时频分析技术(包括子波变换技术)、高阶统计分析技术等,这些技术更能挖掘人耳听觉掩蔽等感知机理,更能以类似人耳的特性作语音的分析与合成,使语音编码系统更接近于人类听觉器官的处理方式工作,从而在低速率语音编码的研究上取得突破。