请选择 进入手机版| 继续访问电脑版
开启辅助访问 切换到宽版

高清语音了,你竟然还没听清?

[复制链接]
作者:chenxuan 
版块:
技术专题 移动网 发布时间:2016-5-3 16:46:05
4040
chenxuan 发表于 2016-5-3 16:46:05 | 显示全部楼层 |阅读模式
本帖最后由 chenxuan 于 2016-5-3 17:01 编辑

[题记]


虽然微信已经解决了大部分的沟通问题,但是紧急情况下,还得来通电话:

“平安保险么,我要报案啊,车牌号是京NPT…“

“您好,麻烦再重复一遍,是M还是N?”

“L…M…N…那个前一个!”

“好的,那麻烦下一位是P还是T?”

“……”



世界上最遥远的距离,不是我寻寻觅觅找不到你,而是我通过电话找到你,你却听不清?!好吧,其实运营商在“语(gao)音(qing)保(yu)真(yin)”这件事情上已经研究的够不够的了,生怕你不用移动网打电话。现在高清语音基本都是标配,但是你真的用上了吗?小编就帮你简单的技术剖析一下~



**********************************

【为什么会听不清?】
人类原始的声音不能直接在移动网络里传输,而是需要转换成话音信号,并且适配现在的网络条件,比如无线电磁波、数字网络传输条件等等。在这些条件的约束下,声音就需要经过一个重要的过程“语音编解码”。一方面,为适应当前的网络条件、减少冗余信息而用压缩、转换等技术进行编码;另一方面,尽量完整的还原声音进行解码。

既然必须要经过这个过程,那就来分析下我们距离“听清”要几步:
第一步:最优的语音编解码算法,好的算法才能有好的声音还原。
第二步:最简单的语音传输过程,过程越简单经过的转换次数越少,对声音的损耗和还原的风险越小。
这两步缺一不可,否则就会面临你说“yes”我听“no”的尴尬局面了~

**********************************



【第一步:编解码?高保真!】

移动网建立之初就一直在语音编码这件事上奋力研究,从2G 的GSM编码到3G的窄带AMR/AMR2编码,再到宽带AMR-WB编码。当然4G的VOLTE不仅仅是普通的语音编码技术范畴,VOLTE建立IMS网络从整体的角度提升语音传输质量,语音编码还沿用原来的技术AMR-WB。
简单从频率角度来说,人体发声器官的频率范围在80Hz-3400Hz之间,而听觉器官接收的频率范围约为20Hz-20kHz。原有算法(2G的GSM编码、3G的窄带AMR)频率为300-3000Hz,高清语音(AMR-WB适用于3G和VOLTE)频率范围扩展到50-7000Hz。现在的高清语音听清已经没问题了

现有的编解码方式简单介绍如下:

传统的GSM编码与AMR/AMR2编码方式处理频率范围在300Hz到3400Hz,因此某些音在这个范围内会受限,比如:

•摩擦音s、f之类的频率较高,较难识别;

•m和n,p和t的区别发音也需要较高的频率,目前没有什么好的办法;

•元音诸如o、u需要较低的频率,区分他的回声还有一定的困难;

•女声的频率也会处在高频而难以辨认;

在2/3G的时代打电话听到的声音比较呆板和刺耳,不能完全还原用户的声音,情感表达就更是略逊一筹了。

AMR/AMR2相比GSM编码的优势在于可以自适应匹配传输条件的改变而选择速率,容错率更高但语音质量没有本质的提升。AMR-WB编码方式以后采样率高了,带宽范围更宽了,算法也有一定的改进,音频质量和清晰度方面有了显著提高。目前,中国联通去年底已经在3G上全面开通了AMR-WB。但是仅有一个好算法是远远不够的……

**********************************



【第二步:次数,减少?再减少!】
     

……等等,你说我开了高清语音我也不一定能听清?这是为何!

语音业务是双方互通的业务,互通过程中会经过N个节点,因此必须双方及其中途径的节点均支持该业务,业务才可能顺畅进行。简单拿现有2/3G网络来说,语音传递的过程包括:主叫UE-主叫无线-主叫MSCS(MGW)-被叫MSCS(MGW)-被叫无线-被叫UE,一共5段过程。一旦有一个节点不支持,那么就需要变换编解码方式再传送,这样就会产生语音损失。因此为了尽量减少编解码转换就有了Trfo和TFO用来提前协商。

Oh,NO!这么麻烦?一点也不!小编带你剖析一下语音信号传递的过程,你就明白了。举个稍微简单点的例子,3G用户(小A)打给偏远的2G用户(小B),暂定网络环境2G是A接口over TDM方式,3G是Iu接口over IP方式,局间为BICC方式,网络侧开启了TrFo与TFO,端局间采用前向延迟方式建立BICC承载。




1.UE-RNC-MSCS:发起呼叫,通过Setup消息中Supported Codecs携带主叫支持的语音编解码列表,这里携带的是3G支持的编解码类型(AMR-WB、AMR2和AMR)

2.主MSCS-被MSCS:主被叫协商IAM消息中应用传送参数Application transport中BAT ASE的承载连接应用部分包含编解码及其速率,这里携带的是UE\RNC\主叫MSCS协商后均支持的编解码类型;

3.MSCS-RNC-UE被叫端局寻呼被叫,被叫响应,通过Call Confirmed消息中Supported Codecs携带被叫支持的语音编解码列表,这里携带的是2G支持的编解码类型(HR、FR、EFR以及HR_AMR、FR_AMR);

4.被MSCS-主叫MSCS:协商结果,通过APM消息Codec/Codec List回应被叫端局与主叫端局协商后支持的编解码方式,作为局间编解码方式。这里因为主被叫分别处于2.3G网络,没有都支持的编解码类型,所以必须在被叫MGW到无线侧小黄点有一个编解码转换,但是主叫UE到被叫MSCS之间还是可以都支持3G的编解码方式的;
5.MSCS-MGW:建立网络承载,确认编解码方式后,主被叫分别建立间的网络侧承载;
6.MSCS-RNC-UE:建立无线侧承载,即RAB Assignment与Assignment Request,通过rab-parameters携带支持的速率;以上为晚指配的场景,如果开启了早指配,则局间协商编解码与无线侧编解码不同的话,还需要无线侧修改承载。
RAB指配

TCH指配

7.主叫UE-被叫UE:呼叫接通,各个阶段的承载建立成功后就可以接通呼叫了。  
这个过程中因为开通了Trfo和TFO,因此只在被叫MGW侧有一次编解码变化。否则在每一个小黄点的部分都会产生一次编解码转化。所以即使主叫开通了高清语音,被叫也不是,有一部分还是处于听清和听不清之间的。

**********************************


【小结】
       语音是个追求极致的活,想传输通道更稳定,想听得更清楚都是只有更好没有最好。虽然技术研究已经在这条道路上走的很远,但是目前2/3/4G网络共存又互通又转换这么复杂,注定会影响一定的感知。最好的解决方法就是为用户提供性价比更高,更好的服务,应用更广泛,技术自然更进步。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

快速回复 返回顶部 返回列表