语音网关设备常用语音编码(Speech codec)介绍(一)

2012-12-13

    编码是一个通过一些我们制定的规则把一定的信息内容如语音、视频、数字、文本等转换成一些简单的可供另一种设备使用 或分析的过程。我们所说的语音编码就是一个对模拟的语音信号进行编码,将模拟信号转换成数字信号,从而降低传输码率再进 行数字传输的过程。常用的语音编码可被分类为波形编码、参量编码(音源编码)和混合编码。波形编码是指将时域的模拟话音 的波形信号经过取样、量化、编码后形成的数字话音信号。参量编码是一种基于人类语言的发音机理,找出表征语音的特征参量 ,对特征参量进行编码。混合编译码是一种结合波形编译码和参量编译码优点后形成的编码。

    现在市场上语音网关设备的常用编码有G.711, G.723, G.726 , G.729, ILBC,QCELP, EVRC, AMR, SMV等。

    G.7xx 是由国际电信联盟(ITU)推出的一组ITU-T标准。主要用于电话方面音频压缩和解压缩。在电话技术中,有两个主要的 算法标准,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使用)中。两者都是基于对数关系的,但 对于计算机的处理来说,后者更为简单。在国际标准中,统一使用 MOS(Mean Opinion Score)方法评价语音压缩后的质量。在 MOS方法中,电话语音质量的标准定为4分。也就是说,如果一种算法将语音压缩后,MOS 值能达到4分,即说明其语音质量和电话 质量等同,用户无法分辨出其中的区别。G.7xx中广泛应用的有:G.711,G.723, G.726, G.729. 每一种又有很多分支,如G.729 就有g.729A, g.729B and g.729AB。

分类: 技术知识 标签: