语音网关设备常用语音编码(Speech codec)介绍（一）

2012-12-13 网经科技

编码是一个通过一些我们制定的规则把一定的信息内容如语音、视频、数字、文本等转换成一些简单的可供另一种设备使用或分析的过程。我们所说的语音编码就是一个对模拟的语音信号进行编码，将模拟信号转换成数字信号，从而降低传输码率再进行数字传输的过程。常用的语音编码可被分类为波形编码、参量编码（音源编码）和混合编码。波形编码是指将时域的模拟话音的波形信号经过取样、量化、编码后形成的数字话音信号。参量编码是一种基于人类语言的发音机理，找出表征语音的特征参量，对特征参量进行编码。混合编译码是一种结合波形编译码和参量编译码优点后形成的编码。

现在市场上语音网关设备的常用编码有G.711, G.723, G.726 , G.729, ILBC，QCELP, EVRC, AMR, SMV等。

G.7xx 是由国际电信联盟(ITU)推出的一组ITU-T标准。主要用于电话方面音频压缩和解压缩。在电话技术中，有两个主要的算法标准，分别定义在 mu-law 算法（美国使用）和 a-law 算法（欧洲及世界其他国家使用）中。两者都是基于对数关系的，但对于计算机的处理来说，后者更为简单。在国际标准中，统一使用 MOS（Mean Opinion Score）方法评价语音压缩后的质量。在 MOS方法中，电话语音质量的标准定为4分。也就是说，如果一种算法将语音压缩后，MOS 值能达到4分，即说明其语音质量和电话质量等同，用户无法分辨出其中的区别。G.7xx中广泛应用的有：G.711，G.723, G.726, G.729. 每一种又有很多分支，如G.729 就有g.729A, g.729B and g.729AB。

分类: 技术知识标签:

网经科技企业博客

语音网关设备常用语音编码(Speech codec)介绍（一）

近期文章

分类目录