将关键性业务迁移至云环境前必须弄清的五个问题

　　面向云环境的迁移工作正如火如荼地进行。在去年的GartnerIT研讨博览会上，超过半数CIO表示将把云优先战略作为接下来的运营重心。Verizon公司在其《市场状态:2016年企业云》报告中提到，有84%的受访企业表示其云使用量在过去一年中迎来显著提升，而且有半数企业宣称其到2018年至少将把75%工作负载迁移至云端。更值得一提的是，亦有半数受访企业正在使用两到四家云服务供应商的产品。

　　无论大家正着眼于面向云环境的迁移、考量云产品线多样化还是仅仅在比较跨越云环境的性能与价值水平，认真审视以下五个关键性问题都能够帮助各位做出更为理性的决策：

　　大家如何监控自己的互联网基础设施?大家在对自己的内部基础设施与应用程序进行监控时，会收集到哪些负责将客户与自身业务相对接的外部互联网连接的相关信息?如果指向特定数据中心的连接发生故障，又或者某家云服务供应商无法覆盖特定市场区划，大家的系统管理员必须拥有必要工具以将流量重新路由至其它数据中心，从而保证服务的正常运转。另外，如果大家遭遇高延迟或者服务质量下降，您的IT团队也必须了解如何监控这些问题并对性能做出及时优化。

　　另一个需要认真考量的问题在于了解自己的“平均解决时间”——即能够以何种速度精确识别造成客户影响的问题根源，其具体来源可能包括应用程序、数据中心计算环境，又或者基于互联网路由、宕机乃至云/SaaS供应商。虽然云服务供应商、CDN以及加速服务方都宣称能够提供“始终在线”承诺，但这并不意味着客户总能够顺利与之相对接。

　　如果大家立足于一家全球性企业，该如何确保云环境下的全球可用性?如果大家的最终用户会立足于全球任意位置对您的互联网资产进行全天候访问，那么各位无疑需要确保自己的最终用户体验在各个位置保持对等——无论其于何时、何地访问我们的网站、应用或者内容。保障可用性意味着如果我们的服务是否可用于客户及合作伙伴。要实现这项目标，最重要的一点在于了解我们所选定之云服务供应商与CDN的网络连接性能。

　　2015年发生的谷歌云宕机事故持续近两小时，其根源在于虚拟网络流量路由机制中的一项软件问题。如果大家的业务使用单一云实例配合谷歌云客户端，而各位又没有对网络可用性进行全程监控，那么大家很可能会全面遭遇这场宕机并导致可用性受到严重影响。

　　因此，我们该如何确保自己的业务能够拥有强大的可用性，而不至于受到本地互联网状态或者世界各地区域网络条件的限制?将业务分布托管在多家云服务供应商站点中能够确保客户免受单站或者单一区域宕机的影响。作为另一项建议，大家还应当监控自己的全球网络，从而检测其当前负载水平。我们需要关注性能问题，并利用现有工具进行负载均衡，从而确保整套业务体系随时拥有理想的可用性水平。

　　使用单一云服务供应商即可，还是应当考虑选择多家供应商?虽然各家云服务供应商所能提供的方案千差万别，但同时使用多家服务是实现业务持续性与风险缓解战略的惟一途径。我们还可以利用这种有效策略管理峰值使用量、成本波动与全球负载均衡。

　　同时选择多家云服务供应商能确保我们的企业访问不同云实例(本地)，从而立足于本地市场考量客户需求并充分利用本地网络连接的性能优势。而跨地理位置使用高级DNS流量管理解决方案，则能够帮助大家确切控制由哪些实例服务哪些客户，同时通过正确工具以集中化方式对各类实例乃至供应商服务加以管理。

　　同时选择多种云方案能够帮助我们的业务拥有更出色的灵活性与价值回报，允许大家提供规模可伸缩且始终在线之业务印象。这种访问不同路径的能力还能够切实解决系统宕机或者载入速度过慢等问题——无论其源自流量路由问题还是恶意攻击。除此之外，选择多家云服务供应商还能帮助大家尽快对流量进行重新路由，从而确保将中断状况控制在最低水平。作为额外收益，选择多家云服务供应商还允许大家将应用程序与服务部署在两个(或者更多)云实例当中，这样它们就能够利用全局负载均衡或者故障转移架构实现相互备份，从而在问题发生之前建立保护措施。

　　优化互联网性能的最大风险是什么?最大的风险在于大家可能并不了解业务性能的实时状态——其中包括互联网延迟问题来源、全局可用性与可接入能力等以及最终用户的真实性能体验如何。在潜在客户访问域名与正式打开页面之间的时间段内，种种意外状况都有可能突然发生。网络内部可能出现CDN或者ISP层级的错误，大家的SaaS供应商或者客户自己的网络连接也可能遭遇故障。另外，网站响应速度也会受到多种因素的影响，而且大多数客户——乃至企业客户——往往并不清楚遭遇性能问题的原因与方式。

　　通道故障、路由异常、延迟、丢包、安全威胁(例如中间人攻击与DDoS)还仅仅是影响流畅网络运转的常见风险中的一小部分。了解自己的网络连接并对其加以监视、控制与优化，同时对互联网性能切实加以测试，只有这样才能真正掌握并应对网络中的各类薄弱环节。

　　在遭遇宕机事故时，我们该如何保证站点正常在线?宕机会给企业的正常业务造成严重影响，而且出现存在着令人惊讶的规律性——每天全球互联网会出现超过3000次宕机状况。另外，大多数企业其实很难在不涉及客户与内部资产的前提下，对互联网连接故障进行检测。

　　对面向互联网架构的不断监控是惟一能够确保企业自身免受宕机长期影响的可行手段。如果大家无法妥善检测宕机问题，那么各位的业务将无法真正对销售额损失、营收下滑乃至客户流失等风险进行响应与缓解。有鉴于此，物色一家真正有能力洞察我们基础设施的合作伙伴将帮助大家积极应对宕机风险，包括在宕机出现之前或者之中发现问题、即时做出改道决策等等。

评论排行

推荐阅读

专题