编者按:实时音视频服务广泛应用于社交通话、游戏娱乐语音聊天室和互动直播等领域,目前很多第三方云通讯平台都会提供实时音视频服务,那么企业应该如何挑选,需要重点关注哪些功能及服务指标,有哪些注意事项呢?以下,我们将为您展开介绍。

实时音视频服务是通过实时的“音视频处理+网络传输”来实现即时音视频通讯的一种服务,属于即时通讯服务的一种,绝大多数主流的第三方即时通讯平台均可以提供实时音视频服务。绝大多数第三方即时通讯平台均可以提供单独的实时音视频服务,企业通过API/SDK接口即可在自有的应用中接入;有些平台也提供了基于实时音视频服务的语音聊天室、视频会议、教学白板等整体解决方案。第三方平台音视频服务功能一般包括了基础的音视频服务和面向具体应用场景的相关功能,本文,我们主要聚焦基础的音视频服务展开介绍。

 

➤  实时音视频服务的核心评测指标

实时音视频服务类型大体上可分为点对点、一对多以及多对多的音视频方案。点对点的方式最为基础,实现逻辑较为简单,以类似微信的实时音视频通话应用最为常见;一对多的音视频方案多用于直播场景;多对多的方案为多人实时语音/视频聊天。一对多的直播方案和多对多的多人音视频聊天方案在产品逻辑和底层架构上差别较大,这里我们将主要讨论面向多人聊天的实时音视频方案,关于直播方案的介绍见:《企业IM即时通讯解决方案:直播类产品》。对于基础的实时音视频服务来说,音画质量是我们核心关注的问题,包括音质、画面清晰度、流畅性、音画实时性和同步性等。影响音画质量的因素一是本身可支持的音视频参数,二是网络环境,核心评测指标如下。各家在实时音视频服务方面的差异更多地体现在针对弱网条件和高并发等网络环境下分别如何进行优化处理。

▌音视频参数

音质:音质主要是受音频采样率的影响,即一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然,第三方平台音频采样率一般最高支持48KHz,一些平台也会同时支持16KHz的音频采样率。相较于视频来说,音频数据对网络资源的占比会小很多,企业一般可直接选用48KHz;

画质:视频画质由视频分辨率、帧率和码率共同影响。其中视频帧率越大,画面越流畅;分辨率越高,画质越细腻;视频码率指的是编码器每秒编出的数据大小,决定了一个视频流的数据量,分辨率和帧率受限于视频码率的大小。在限定码率条件下,分辨率或帧率过高会被压缩,直接影响清晰度。因此画质的好坏需要平衡这三者的数值,对于没有音视频编码经验的企业来说,可直接使用默认参数;还有一些平台不支持分别设置视频参数,系统会默认提供几种清晰度参数供用户选择。

视频会议本身也是实时音视频的一种典型应用,更多关于音视频质量的信息可参考:《决定网络视频会议画质的因素》

▌编解码方式:不同的音视频编解码方式下,音视频流的数据量会有所不同。编解码技术越先进,有限带宽下,能够传输的视频内容质量更高。关于不同视频编码技术的对比介绍见:《视频编码技术的发展与现状:MPEG-4、H.263、H.264和H.265》。H.264是目前最为主流的视频编解码方式,H.265在H.264基础上做了进一步的优化,能够在有限带宽下传输更高质量的网络视频。

▌音画质量优化:对于由于网络质量不佳会导致延时、卡顿、花屏、马赛克等问题,鉴于此,一些平台服务能够对接收到的音视频进行优化补救。比如通过降噪、回音消除、自动增益、人声检测、啸叫处理等进行音质优化,通过降低马赛克进行画面优化等。

▌网络传输优化:网络传输优化指的是根据实际应用场景选择合适的传输层协议,并通过信道保护纠错机制以及实时带宽估算和分配策略来匹配最优方案,从而确保在不同的网络状况下呈现最优的音视频效果。关于网络传输优化策略的详细介绍见:《实时音视频传输优化策略》

 

➤  小结

综上,我们对第三方实时音视频服务挑选的核心指标做了详细的介绍。实时音视频服务的实现流程可简单概括为编码——推流——传输——播放。音视频参数的类型一方面会影响客户端播放效果,另一方面也是为了配合不同网络环境下的码流调节;编解码方式会影响音视频数据流大小,影响带宽的占用率,进而影响播放效果;音画质量优化是后验性的,属于补救性措施;网络传输优化机制是整个服务的核心,最终会体现为低延时和高抗丢包能力。

立即注册查看完整版评测报告
马上注册         立即登录