您当前的位置是:  首页 > 新闻 > 文章精选 >
 首页 > 新闻 > 文章精选 >

RTC全球趋势回顾及解读、全栈RTC服务进化之路

2017-10-12 14:22:43   作者:   来源:CTI论坛   评论:0  点击:


  本文整理自RTC2017实时互联网大会,声网Agora.io创始人&CEO赵斌的开场主题演讲。本文对RTC过去一年的发展进行了总结和分析,并对未来的趋势做出了分析。
  这一年来,行业有很多新发展,很高兴在这里跟大家分享我们对行业的观察与思考。
  去年行业的重大事件来自苹果,它把VoIP呼叫的优先级调到跟电话通话完全一样的水平,这代表实时音视频行业在互联网和消费者使用观念里面开始慢慢进行主流,成为大家进行实时通讯的一个同样重要的层面。
  今年对行业影响更重大的事件,就是苹果发布最新的Safari 11浏览器支持WebRTC通信标准。随着苹果全面支持WebRTC,Safari 11将不止支持移动浏览器,还会同样支持支持PC浏览器。微软在过去一年里同样开始逐步兼容WebRTC。届此,相当于浏览器的各个巨头都全面支持了WebRTC。这会导致行业的重大变迁,这个标准已经打通了,哪怕它是事实标准,也已经被承认和接受了。我们可以看到,所有的终端和用户很快就不存在任何障碍,在任何一个浏览器上都能参与实时音视频交流。
  这是我们之前发布的浏览器兼容测试,右侧Safari 11是完全不支持的。
  今年在Safari11的支持能力已经进入了比较成熟的状态,至少已经不是最差的那一个了。我们充分相信在之后的一年经过快速迭代,Safari能够在API和功能支持上更加完善、全面。
  支持WebRTC浏览器的使用数量,2015年10亿,2016年大概20亿,2017年我们看到的数据至少是40亿,但是随着Safari11宣布正式支持webRTC,2017年很可能超过这个数字。在2018年和随后的时间里面,每个人的手机、PC都有浏览器,基本所有的浏览器都全面支持WebRTC,新的浏览器不支持WebRTC就不是一个好的浏览器、不入流,这是席卷性的趋势。
  目前WebRTC最大的市场仍然是在北美、欧洲以及亚太地区,这是过去市场的核心和焦点,这三个市场仍然遥遥领先于其他地区。但是在南美以及中东、非洲地区可以看到使用量的发生和成长,这与我们的实践也是非常吻合的。
  除了大事件和市场体量的观察之外,我们在这一年里经历和看到了很多新鲜的东西,正如我们过去所说,这个行业永远给人惊喜,它的使用场景创新从来没有停息。
  第一,直播行业的变化和发展。再往前一年多时间里面,直播行业非常快的成长、火热,甚至有一定泡沫化。现在这个热度肯定已经过去了,但是我们看到整体的数据变化仍然是增长的。
  这是增长速度的曲线,虽然有略微向下的趋势,但仍然是正的,这个行业依然在增长。至于成长分布在哪里,我下面替大家分析一下。
  这是典型的新技术被采用的周期曲线,很多直播应用出在最高点,泡沫发生的时候。现在泡沫退去之后,下面真实的海浪在慢慢涌上来。直播类应用处在平缓成长阶段,没有泡沫期那么快速的增长,但是今天的成长是稳定和扎实的。
  涨在哪里?很多垂直领域的成长和发展。比如,直播向教育的渗透、直播在电商行业里的应用、直播在VR方面的实践、直播在游戏行业的普及。
  这是一个非常有新意、有创新性的场景。一家来自加拿大一家做全息投影的公司,通过借助实时通讯、通过互联网的实时传输,把霍金的全息图像和声音从牛津大学送到全世界任何一个会场,参与会场的演讲与互动。
  这是一个约会相亲类的应用,美国最大的约会相亲类上市公司MeetMe,今年开始利用我们的实时直播和互动能力做音视频交流,帮助平台用户更容易的展示自己,更方便的开展和其他用户之间的交流,帮助他们达成自己在社交方面的诉求。
  在教育方面,直播或音视频互通课堂已经开始在教育行业的大范围渗透。我们看到有很多教育机构,不论是传统的巨头还是创新的企业,都在积极利用实时音视频能力和直播能力,去做在线课堂教学服务。
  这是海外非常火的新型社交应用,不是传统的约会型应用,它仍然是社交,但是是帮陌生人社交,快速匹配交流对象,极大扩展了年轻人的社交能力和使用的方便性。
  移动行业的社交规模和成长比例有点类似,这个行业引起大家巨大的关注有快速的实践之后,创新总是难的,不是一蹴而就,它进入平稳持续成长的过程。
  在整体成长上,虽然中国智能手机的持有量已经接近饱和,或者不再像三年前快速扩张的阶段。但是在固定的用户规模下,社交仍然在持续穿透,这让我想起了去年和过去我们长讲的社交这场服务和应用成长的游戏是不是已经结束了,我觉得从我们今天分享的来看,这显然不是已经gameover了。因为之前像我们去年讲的一样,很多人觉得Facebook这么大,中国还有微信和QQ,还能有谁在社交上冒出来呢?我想这些新的使用模型和成长都代表机会。从过去一年发展来看,新形态的使用模式将有无限的空间。
  这是行业领导者之一在社交上尤其在陌生人社交上,已经完全转向用视频在线上用智能机社交的基础工具或者基础功能,来进行社交活动,这也是行业标志性事件。实时音视频在社交领域的穿透是互联网全行业关注到的一个大事件。
  这是非常让人觉得大开眼界、很激动人心的一个事件,超出很多人的想象,一个社交性游戏能够在过去的半年、一年里取得这么快速的成长,它是过去全互联网行业在中国一个引人注目的爆款 ,一些巨头跳到这个游戏里参与市场的获取和经营。
  这个数据的成长非常吓人,基本穿透到了互联网行业的年轻社交游戏类的绝大多数用户。狼人杀游戏是社交和跨界的实践,跨界的实践产生了爆款。创新永远发生在让人意想不到的地方。但是在大家熟悉的游戏领域,我们也看到很多新实践把实时音视频引入进去。
  棋牌游戏在线上体验和线下体验很不一样,线下打牌或打麻将肯定是熟人或者半熟人,但在线上都是陌生人,上网打开APP不知道对面是谁。同样是打牌,乐趣和体验是不一样的。当你在线下和熟人、准熟人打牌时,更大的乐趣不光是输赢,而是输赢时的调侃和交流,社交的趣味是其中更有意思的地方。
  我们看到,过去一两年尤其过去一年来,棋牌类开始出现了熟人和准熟人使用模式的探索,很多厂商在其中加入了实时音视频的交互能力,把打牌的线上体验从纯粹陌生人对局游戏一样的体验,转变成了游戏伴随着社交,就和狼人杀的体验类似。这会不会导致下一个爆款 ?我们非常期待!
  有一些重度游戏也都在增加实时音视频交流的能力,比如说像球球大作战、竞技场做了这样一个尝试,我们充分相信类似这样的尝试会越来越多,最终进入游戏领域,成为其中一种重大的使用场景和使用模式。
  说到企业的协作,Slack在这方面的使用是一个典型的案例。过去如果做实时音视频交流和协作最好是进入一个专业工具、设备,体验类似线下进到一个会议室跟对方的人约好,大家坐在里面像面对面开会一样。但实际工作场景有大量的交流并没有把手头的工作放下,到专门的场所或者打开专用的会议工具进行交流,而是很多时候一边工作、一边交流。一边工作一边交流的效率和便利性大大的提高。
  Slack的尝试就是这方面的典型代表,把交流嵌入到工作流和工作场景里。我们相信在这方面会有更多实践,比如CRM、供应链的管理、文档协同编辑,都有很多机会。为什么不可以在一个场景下有一个按钮,按一下就可以和上下文相关的同事讨论,这是一个更便利的模式。
  这是协作的场景在行业里做得非常好的企业,V-CUBE也在利用新型的RTC服务能力,考虑加强和丰富它们的生态以及服务能力。
  人工智能是过去一年引人注目的大事件,智能音箱在过去一年里引起很多关注,也造成了全行业的浪潮。海外的大公司,比如Google这样的都在出智能音箱。思科,以我了解,都在做这样的音箱。中国也一样,我们的合作伙伴小米,在不久之前刚刚发布一款小米智能音箱小爱,得到大家很大的关注和喜爱,这将成为接下来普及RTC的机会,音箱都嵌入了实时音视频交流的能力。
  再讲一个好的案例,凡普金科是金融服务方面的上市公司,也是领导性的厂商。在金融服务的模型上,它们在尝试和增加通过音视频能力进行远程开户、远程服务交流,甚至有些基础性安全功能的保障,比如认证等使用模型的探索。我充分相信这个领域的实践会导致未来在全球甚至在其他地方,哪怕在一个偏远的村庄或者三四线城市,一样能够享受到一线城市的金融服务,这是RTC带来的行业成长和变化。
  经过一年多的新实践和探索,我们认识到这样的发展速度和发展规模下面,需要一个全栈实时通讯服务商,有这样的服务才能支持全行业在各个领域做快速的实践和有效探索,才能保证实践探索的顺利和成功的可能性或者成功的比例。
  什么叫“全栈RTC服务”?我们思考、探讨之后,和行业伙伴、同行以及客户交流,总结了一些必备的条件。以我们看来,它大致需要三方面能力或特征:
  第一,深度技术。通过深度的技术能力保证高质量的传输和实时通讯服务能力,保证用户的体验是最好、领先的。在业务实践过程中,客户不用担心技术平台的稳定性和担心用户使用的困扰,而是专注在业务实践中。专注于优化业务模型,解决用户困扰,提升用户体验,把实时通讯改进的问题留给专业服务商,这是最核心和最重要的必备条件。
  第二,专业服务。不论是刚刚开始尝试这个服务的个人开发者,还是大型上市公司,当它选择这个服务时,需要完备的文档,需要高质量快速响应的支持能力。这些都组成 了专业服务的一部分。
  第三,开放生态。开放的生态是活跃和丰富的基础必须是开放的生态。如果不是开放的,不论自己有多大体量,最终的丰富程度和活跃程度是有限的。
  这三点构成全栈RTC服务的必备因素,任缺其一,客户总会在使用时碰到困扰和挑战。
  何谓专业服务?考虑到实时音视频传输和通讯的特性,对传输保障的基础要求需要一个专用的软件定义网,解决互联网上存在的拥塞和故障。其次,编码和媒体处理方面的挑战和困扰是无法避免的。过去每天用到的音频编码和视频编码基本都是为电信业、电视和媒体业设计的,这样的设计必然不能完全适应互联网上的复杂状况。
  为了实现专用的虚拟通讯网,我们做了“软件定义实时网”,通过这个网络,加上我们在全球上百个数据中心的部署和运营,可以保证在全网的质量有大幅度优化。
  分享一个数据,我们在公网上做常态的分析和检测发现,即便你都在骨干网的机房里做分析,甚至网络状况非常好的地区,音视频在传输时出现传输质量不达标的概率仍然非常高。右边黄色的是北美机房以及北美机房间的传输质量,不达标的标准是丢包1%或者超过正常范围的延迟和抖动。一个北美机房到另外一个北美机房之间仍然有30%的概率会碰到刚才我说到的那个标准的质量问题。
  经过“软件定义实时网”,北美地区我们能做不达标传输质量概率降到2%以下,这是10多倍的改善。
  编解码方面,如果我们用传统的电信设计的音频编码器,互联网上动辄丢包20%、30%,就适应不好了。声网针对骨干网的改善做到了非常高的水平,但是还有一个Lastmile问题。比如,在很拥挤的星巴克WiFi上网,一个家用路由器本来只能支持10个连接,现在挂了30个。骨干网的传输质量无论如何改善,在最后一公里的节点上仍然有30%、40%的丢包。这时如果仍然用电信的编码器,就很痛苦了。
  我们在多年的实践里发现,这个技术领域有深度挖掘的可能性。经过我们多年的研究,我们在这方面做的新编码器是Agora SOLO,拥有对抗50%丢包的能力。使用这样的编码器,在50%丢包下,消费者仍然可以享受到高质量的音频体验,至少可以顺利没有障碍的听懂对方所讲的内容。
  浏览器现在已经基本打通了,浏览器和native的穿透以及全覆盖甚至各种native客户端的覆盖都是必要的。我们看全栈RTC服务商和WebRTC的对比,可以看到WebRTC只是其中非常小的一部分。如果想做一个商用级别的好的业务,WebRTC只能用来做参考。如果想把这个业务平顺的推到一个新高度,必须关注WebRTC以外的更全面的服务。
  RTC2017实时互联网大会,已于9月22日在北京结束。很多在上海的小伙伴纷纷表示,希望在上海也举办一次。
  在10月24日这个特殊的日子——程序员节,我们邀请上海的小伙伴到声网的新家,与RTC大会的爆场讲师亲密接触,欢度节日。
  没能来参加RTC大会的上海小伙伴,不要错过。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题