您当前的位置是:  首页 > 新闻 > 文章精选 >
 首页 > 新闻 > 文章精选 >

赵斌和声网是怎样变革实时通信的

--连接200多个国家和5.2亿用户、处理数十亿分钟音视频

2017-09-05 15:41:35   作者:   来源:CTI论坛   评论:0  点击:


  在创建声网之前,赵斌曾是YY.com的首席技术官,是WebEx(网讯)的创始工程师。从1997年进入WebEX起,他就一直沉浸在互联网实时音视频行业。始终不变的是他追寻技术的初心,三年多时间,声网已经将业务覆盖到200多个国家和地区,每年处理数十亿分钟音视频,获得2000万美元B轮融资……作为一家技术创业公司,赵斌和他的声网是怎么在实时通信领域开辟出一番新天地的?
  近日,声网Agora.io创始人兼CEO赵斌对谈硅谷科技媒体The Harbinger创始人Adam Bao,赵斌就实时通信行业在世界范围内的发展趋势和行业情况,声网的业务发展情况和战略,以及中美创业的异同等进行了分享。
  左:声网Agora.io创始人兼首席执行官 赵斌
  右:The Harbinger创始人、耶鲁大学校友Adam Bao
  关于声网:2014年1月声网Agora.io创立,是首家为 App 开发者提供全球范围实时音视频通信服务的服务商,总部位于硅谷,研发中心位于上海,在全球部署近 100 个数据中心,开发者只要使用声网SDK,就能轻松实现App里的音视频通话和互动连麦直播功能。声网经过验证的专有技术每年可处理数十亿分钟的音视频通话,能让开发人员在一次通话中支持超过2,000个用户。
  关于赵斌:声网Agora.io创始人兼CEO,创立声网之前,他是YY.com首席技术官,YY是一家价值30亿美元的纳斯达克上市的社交游戏娱乐公司,每年在中国支持4000多亿分钟的实时通信通话。在YY之前,赵斌曾是WebEx(网讯)创始工程师,WebEx于2007年被思科以32亿美元收购。
  深信实时通信将深度颠覆互联网行业
  Adam:今天我们的话题主要包括实时通信市场,声网的价值主张和战略等问题。在进入这些话题之前,你介绍下你的经历。
  赵斌:我之前的工作背景都与技术有关,自高中毕业以来我一直都是程序员。 在WebEx时,我首次开始通过互联网编程来进行音视频传输。一开始,我真的很讨厌这份工作,因为每次我开通一个音视频通话,都会有人跑来问我,“为什么通话质量不好?”十有八九我都会证明给他们看,这只是网络或设备的问题。
  那时候我觉得很沮丧,因为如果是网络的问题,那么程序员要怎么解决这个问题呢?真的很难向人们解释,也很难去解决此类问题。后来,我在YY工作的经验告诉我,玩家们真的没有时间听你解释这是一个网络问题,而不是软件的问题。我别无选择,只能专注于改进软件和运用先进的算法。后来,我们就开始构建可以通过优化改善公共互联网提高音视频通话质量的新技术。
  当然,正如你所提到的,YY最终发展成为非常大的平台。仅在2012年,它就支持了4000亿分钟的语音通话。在YY的时候,我就觉得实时通信技术,或者这种在公共互联网上通讯的方向,将会变得很有价值,将会被广泛应用在许多移动设备和垂直领域。后来,我就开始打造声网Agora.io,开发简单易用的API,以此帮助开发人员集成音频和视频的通话功能。
  创建声网的逻辑起点是什么?
  Adam:这很有趣,这听起来就像Slack的故事。 他们一开始做游戏,但最终调整方向去构建一个内部消息应用程序,结果取得了巨大的成功。 现在他们已经有了数十亿美元的身价。那实时通信市场是什么样的,有哪些关键的组成部分,你们关注的领域是哪里?
  赵斌:过去没有像我们这样的专业云服务提供商。他们都是直接提供产品,比如WebEx、Skype、Slack、Facebook或Wechat, 他们都是在自身平台的基础上打造一些面向C端的产品。 随着像我们这样的第三方专业服务提供商的出现,能够让每个开发者和公司不再需要耗时费力地构建整个技术团队来实现某个单一的功能,因为它可能不是该公司最重要的功能。 提供这种专业的服务就是我们创建声网的逻辑起点。
  实时通信的互联网应用规模化
  Adam:我们看到很多不同的服务和技术都在变得模块化,他们先是触发和解决了中小型企业的需求,然后开始逐渐转向更大规模的企业。你是否可以通过产品进一步介绍你公司的运作方式?
  赵斌:我们构建了一个非常简单的API,非常易于使用,我们的目标是帮助开发人员将实时音视频和直播功能方便快捷地集成到他们自己的应用程序中,帮助他们免去自行开发相关技术的麻烦。我们提供的价值不仅仅是帮助用户节省时间和金钱,而且还能为用户提供指数级的优势。
  实时通信算法本身已经很复杂了,除此之外,客户还可能会遇到各种各样的网络问题和不可避免的最后一英里的问题。尤其是跨洋传输,比如从中国到美国,或从印度到欧洲,很多时候这些连接就会遇到数据包丢失的问题。你如果想要自己解决这些网络问题,无疑会面临非常多的坑。我们针对这些问题在全球部署了一张SD-RTN?实时虚拟通信网,来极大优化全球范围内的实时传输。我们在全球约有100个分发中心,在这些分发中心之间,我们拥有自己的传输路由路径,可以帮助我们避开这些底层问题和避免数据包的丢失。这样一来,我们的客户就能享受来自世界各地的高品质的实时通话。
  让全球开发者都能接入实时音视频
  Adam:如你所说,有很多底层基础设施不仅需要软件,还需要数据中心和全球网络体系的支持。 那么你覆盖了多少地区和国家?
  赵斌:我们几乎涵盖了每个大陆和每一个大的人口中心。声网的服务覆盖五大洲的200多个国家和地区, 而且这一数字还在不断增长。而随着通讯量的增长,我们会针对具体地区的情况有针对性地进行算法改进和部署改进。 在部署方面,我们会对网络进行不断测试,然后选择能够更好地覆盖该地区的分发中心,以便使该地区的通讯质量能够达到我们的标准。
  技术创新走在服务最前方
  Adam:是否有其他的公司也在做类似的事情? 是否有对标的公司也在提供包括全球数据中心覆盖在内的全面服务,或者有其它公司更专注于算法?
  赵斌:类似的公司不多。 我们所做的本质上是一个软件定义的网络,一个专有的网络。 我们组织所有路由路径, 它可能不只是一个简单的数据收发,而是一个更复杂的路由架构。 对于任何一个通话,它可能不只是通过一个分发中心,而且通过两个或三个分发中心,以此确保跨越多个数据中心的通话依然具有令人满意的质量。
  我们很难控制的部分是最后一英里。 比如你在星巴克,那么数据包丢失的几率可能会非常高,并且网络非常不稳定,这样你就会不断地掉线。 丢包的问题真的很难修复,但我们确实有一整套算法来帮助用户实现顺畅通话。 例如,在网络状况很糟糕的情况下,我们可以使用低带宽低码率的方案来传输,让另一端仍然听得清楚,并且在视频方面我们也有类似的算法,使得丢包不会对整个用户体验产生明显的影响。
  另外,请记住我们专注于针对公共互联网的实时通信。 虽然说市场上有一些传统的企业高端会议系统,他们专注于提高视频的质量,但他们是在比公共互联网好很多的企业环境中运行。与之相对的是,我们的技术架构可以真正处理各种各样的网络连接问题。 例如,声网的技术已经可以保证印度2G网络状态下的通信!
  专注于移动体验
  Adam:如果看一下竞争格局,我们会发现还有一些类似的提供商,一些其他的“手机优先”玩家。 我能想到的是去年上市的Twilio,以及Plivo。 他们似乎也在为许多初创企业和越来越多的企业提供类似的SDK。 再和我们谈谈目前实时通信市场的情况。
  赵斌:Twilio已经于去年上市。他们的战略更多是放在即时消息(IM),比如短信、手机通话和其他通话API上。Twilio应用广泛,因为每个移动应用都需要通过短信注册或认证。Twilio大概在一年前也开始提供视频功能,但我认为他们提供的产品与我们的架构有很大的不同。 例如,Twilio是基于WebRTC的,而我们声网是自研的技术,有虚拟的实时通信网络,有我们自己的编解码器,我们专注于移动体验,而不是仅仅依靠WebRTC。
  Adam:假设我在一个初创企业工作,想在自己的应用程序中使用这些SDK,那么我该如何在不同选项中做出选择呢?
  赵斌:这取决于几个不同的方面。 首先要考虑的是在你产品里的音视频通话中,你重视的优先级是什么。是稳定性吗?比如说能否清楚地听到彼此的声音?还是你更重视可访问性或出色的用户体验? 对于很多开发者来说,我认为通讯质量是最重要的,其次是简单易用的集成。
  Adam:关于集成和其他的使用方式,我觉得客户支持应该是非常重要的。 在客户支持上声网能够提供什么呢?
  赵斌:客户支持绝对是非常重要的。声网的产品简单易用,因此即便在没有技术支持的情况下,大多数开发人员也能完成上线工作。而如果用户对我们有特殊的需求或具体的问题,我们则有一个支持小组可以全天候24/7地帮助他们。
  实时滤镜成社交和游戏领域标配
  Adam:我认为对于声网来说,你不仅能够提供良好的客户服务,而且还拥有一些数据中心,能够为不同的地区提供支持,这对用户来说真的很重要。
  最近我注意到你已经推出了声网实时滤镜,这基本上是另外一个全新的SDK,它允许开发人员为实时视频甚至直播添加面部跟踪和特效。你能否进一步解释一下,声网为什么要重点关注这个产品?
  赵斌:这是因为我们在社交和游戏领域看到了很多需求,比如Pokémon。我们所提供的这些功能,例如面部跟踪技术,它是深度技术栈的一部分,而不是2-3人的初创企业可以从零开始迅速构建出来的。我们将这些最好的功能和实施方案打包到产品中,以便于开发人员使用更少的代码,就能轻松地将这些功能添加到他们的社交应用或游戏体验中。
  Adam:声网到目前为止的吸引力如何?是否有很多人在使用我们的产品?
  赵斌:我们一直在快速增长。目前平台上已聚集了3万多名开发人员,而且这个数字还在持续增长。实时滤镜,共享白板,互动连麦,共享屏幕等其它一些新功能也正在吸引越来越多的用户加入进来。
  如何兼顾中美市场的差异性?
  Adam:你在中美都有丰富的工作经历。在两个不同的市场工作,你在人才、市场、管理要求等方面看到了什么差异,以及如何兼顾两个国家的不同要求?
  赵斌:区别很多。我们中国这边正在发生很多变化,工程技术团队越来越强大,技术也越来越好,网络移动端都不断提速。中国的市场也很有趣,例如在社交和游戏领域,中国的手机使用率高于美国,不过很多创新的产品仍然来自美国。比如在社交方面,像Houseparty、Monkey这样的应用程序都是在美国发明的。
  美国仍然拥有比较好的4G覆盖面,设备的平均质量也更好一些,因此很多应用都是首先来自于美国。不过考虑到中国巨大的人口基数和年轻一代对社交应用的热爱,中国还是有望涌现很多非常有吸引力和互动性的案例。两个国家的差异性实际上有助于让我们深入了解其他市场将会发生什么,这些不同的市场之间会有很多交叉和重叠。
  视频社交是不可逆的趋势
  Adam:你能给我们几个你看到的例子吗? 在过去的日子里,中国的移动支付、微信支付、以及OfO和摩拜共享单车给我们留下了深刻的印象。 我们看到中国公司的Musical.ly已经成功登陆美国。我们还看到了移动系统清理应用和猎豹移动应用。鉴于你广泛的经验和你所看到的内容,你是否有可以分享的东西,以及我们应该关注的有趣的和创新的应用?
  赵斌:在社交方面,你可能已经听说过陌陌,一个社交发现应用程序。 今年早些时候,他们开始谋划基于视频的社交平台新战略。 这基本上意味着所有人都开始要基于视频通信进行社交活动。 如果你查看陌陌的产品,就会发现里面有互动式直播,有群组视频party, 有游戏,在兴趣组中有多个视频聊天,当然还有一对一的视频聊天
  在现实世界中,人们在一些社交环境中会遇到新朋友,例如在酒吧或街上。 如果你碰到某人并开始聊天,你们就会互相加深了解,最终可能会成为朋友。 对于在线社交,以前的方式是将某人添加为朋友后,互相发送短信,图片或表情等。但是,人们在现实生活中却不是这样做的。现在通过视频通话,我们可以把以往线下社交的体验复制到线上,可以与别人面对面的聊天。 我认为这是一种趋势。
  我们也看到在美国市场上正在发生类似的事情。 对于约会类的应用,过去你只是使用移动应用程序来浏览和连接其他人。 你所能做的就是发短信,或者安排线下的见面。 但现在你可以省去这些麻烦,可以直接拨打视频电话,面对面认识对方。这正是当前市场上所发生的。
  Adam:很有意思。 我应该试一下陌陌! 我原来知道他们几乎是Tinder在中国的对标 产品,但他们现在似乎在做更多的视频直播和社交功能,这听起来很激动人心。非常感谢你的见解和分享,期待下次能够与你再次交流。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题