过去十多年间,凭借高性价比、高敏捷性和高灵活性等特点,云计算实现了“奇迹”般地高速增长,并成为几乎所有企业/组织的重要组成部分。
中国信息通信研究院最新发布的《云计算白皮书(2023年)》显示,2022年,全球云计算市场规模约为3.5万亿元,增速达到19%,预计在大模型、算力等需求刺激下,到2026年全球云计算市场将突破约十万亿元。
没有人会否认云计算的价值,然而,经受过疫情的洗礼和全球经济形势不稳定的预期,越来越多的企业开始重新思考——“上云”对于自身而言到底是不是必选项?“下云”会不会是一个更优的选择?
许多企业已经开始行动,并取得卓有成效的收益。就在最近,Twitte全力“下云”的故事更是把有关这个话题的讨论推向高潮。
去年,马斯克以 440 亿美元完成对 Twitter(现更名为 X 平台)的私有化,并在一年时间内进行了大刀阔斧的改革,除了裁员、重构 Twitter 2.0等一系列操作之外,其采取的“下云”实践尤为值得关注。
10 月 27 日,X 平台的工程团队发布了一篇长帖透露了相关成果:
X 平台关闭了萨克拉门托数据中心,重新配置了 5200 个机架和 14.8 万台服务器,带来了每年超过 1 亿美元的节省。
优化了 X 平台对云服务提供商的使用,并开始在本地环境运行更多的工作,这一转变使 X 平台的月度云成本降低了 60%;X 平台的工程团队所做的改变之一是将所有媒体/ blob工件移出云环境,这将其云数据存储大小降低了 60%;另外,该团队成功地将云数据处理成本降低了 75%。
因此,本文将借此来讨论一下——“下云”是否会成为未来几年的风潮?哪些企业适合“上云”?哪些企业适合“下云”?以及物联网企业应该“上云”还是“下云”?
为什么一些企业会选择下云?
在全球云化的过程中,企业经历了从“是否上云”到“如何上云”到如何更好地“使用云”,直至如今开始思考“是否下云”的迭代史。
根据Wanclouds发布的《2022年下半年云计算成本和优化展望》报告:81%的IT管理者表示,随着成本飙升和市场下行,他们的最高管理层已经指示他们要减少或不承担额外的云支出。调研结果也显示,39%的人已经决定将大量的云消耗和高性能工作负载迁移或留在本地,还有29%的人表示在2022年上半年由于价格贵而更换了公有云厂商。
为什么有的企业突然发现云“不香”了呢?笔者认为可以从以下三个方面进行分析:
第一,出于对成本的综合考量。
当初,许多企业之所以选择上云,很大程度上是出于对成本的考量。
就像许多云计算厂商宣传的那样——有了云计算,在硬件方面,用户不用搭建机房,也不需要服务器和网管维护,员工使用的计算机也不用多高配置,只要一个配置最低的笔记本或者一体机就能解决问题。软件方面,之前企业所用的所有企业管理软件都不需要自搭服务器,只需根据企业需求在云上购买相应的服务即可,再也不会出现资源浪费的情况。一句话,云计算可使企业成本大大降低。
但事实证明,并不是所有企业都会因为云计算而降低成本,确切来说,云服务的使用过程中存在不少“成本陷阱”。
首先,就像本地硬件一样,云系统的总拥有成本(TCO)不仅仅是“入场价格”。云计算的灵活性和基于消费的定价模型使得企业很难预测项目或系统的生命周期成本。增加容量或性能很容易,但也容易产生额外成本。
其次,组织虽然可以在云平台中快速启动或关闭实例,但最终还是得为未使用的容量付费。IT团队需要确保有足够的容量来处理意外的流量高峰和负载波动,但又不能过多,没有足够经验的企业很容易过度使用不必要的资源,从而增加成本。
此外,云服务存在很多隐性支出,比如云计算提供商通常会收取数据出口费用,以将数据移出其平台甚至在区域之间移动,这会导致组织数据在公共云之间来回迁移的成本可能很高。
最后,随着多云策略成为当下企业数字化转型的主流,在公有云、私有云、混合云以及边缘环境的用例不断增多,企业必然会在多个供应商之间面临选择,而这会导致复杂的多云管理以及模糊的成本估算问题。
不只是马斯克的X平台,运营项目管理平台 Basecamp 背后的 37Signals 公司首席技术官、Ruby On Rails 之父 David Heinemeier Hansson 最近发布了他主导的“下云”项目的最新信息。
今年 1 月,37 Signals 宣布把大量服务和依赖项从云端转移到内部硬件上,借此削减费用。硬件采购大约花费了 50 万美元,并且均摊在未来 5 年里,也就是说每年该项成本为 10 万美元。考虑到一些不可预见的费用,David 之前估计 37Signals 将在五年内节省大约 700 万美元的服务器开支。
现在,在 9 月 15 日最新发布的帖子中,David写道,他认为该计划可以在五年内节省 1000 万美元。
“我们在云上的支出已经减少了 60%…… 从大约每月 180,000 美元减少到不足 80,000 美元,”
第二,并不是所有的应用和业务都适合云平台来承载。
试想这样的场景,你是一家电商企业,一年中的大多数月份产品月销量都在数千,唯独618和双11搞活动的时候一次性会涌入上万甚至十万级的订单,那么这种业务模式就特别适合云平台来支撑——无需为了峰值的流量配置过多的硬件和服务器,像水龙头用水一般随取随用即可。
与之相比,很多业务场景并没有在几分钟内启动数百台强大计算机的需求,自然也就没必要付出高昂的成本来享受这种特权。
正如Ruby On Rails 之父 David 所说,云计算只在两种情况下会比较出色:
其一是当你的应用程序非常简单且流量较低时,通过使用完全托管的服务确实可以降低复杂性。Heroku 就是这样起步的,当企业还没有客户时,或者开始有一些客户时,云服务托管可以算是一个绝佳的选择。
其二是当负载非常不规则或者较大时。当你的使用量出现剧烈波动或高峰时,基线只占最大需求的一小部分,或者你不知道需要十台服务器还是一百台服务器时。在这种情况下,没有什么比上云更好的选择了。以 37Signals 旗下产品 HEY 为例,团队起初计划是 6 个月内有 3 万名用户,而实际却在 3 周内涌进了 30 万名体验用户。HEY 从一出生就运行在云端,所以才避免了流量剧烈波动所带来的的不良体验。
以此类推,对于某些增长稳定的中型企业来说,租赁基础设施资源总体上看是一笔糟糕的买卖。
第三,云服务存在稳定性和数据安全等诸多风险。
有些行业对系统运行的稳定性、可靠性和数据安全等有特殊要求,云服务不一定能够完全满足。
以医疗行业为例,据报道,某医院在几年前将分院PACS系统迁至云上后,期间使用未达预期,2020年又将数据从云上迁移下来。
据该院信息中心人员透露,当时觉得云计算是一种趋势,而分院业务量不大,于是想通过分院来探索云模式,如果效果好,就在总院复制。医院选择合作的是国内一家头部的云服务商,上云前大家的期待很高,但上云之后问题来了。
系统就像交通,刚开始很顺畅,突然前面两辆车刮擦就堵车,导致系统变慢了。这种情况经常发生,但是厂商的应急处理能力却参差不齐,导致问题得不到及时解决。
同时,“上云”后也出了很多问题,包括光纤被挖断、域名注册不合规被管理部门屏蔽等……相关负责人感慨:“‘上云’后,最大的问题是不可控,但是在医院本地是可控的。”
最后值得一提的是,企业上云意味着将一切资源与数据都要转移到“云端”上面,越来越多的企业相关敏感性信息也会存储在云数据中心。诸如医疗行业的管理者会考虑到一些安全漏洞会不会引发范围广、系统性的安全威胁,从而作出“下云”的决策。
物联网企业“上云”or“下云”?
随着物联网技术的不断发展和普及,越来越多的设备和传感器连接上网,从而产生了大量的数据。市场研究机构IoT Analytics发布的报告显示,2022年全球物联网连接数增长了18%,达到143亿。预计到2027年,全球可能会有超过290亿的物联网连接。
纵观物联网产业链,物联网平台向下连接、管理海量的联网设备并归集、存储感知数据,帮助企业和个人更好地管理资源、优化决策、提高生产效率并减少成本;向上提供应用开发的标准接口和共性工具模块,以SaaS软件的形态提供给最终用户,可以说是物联网部署过程中的中枢神经,其重要性毋庸置疑。
与成本高昂、任务艰巨的自建物联网云平台相比,很多企业选择与物联网云平台服务商合作,然而,过去几年多家巨头相继退出物联网平台的决策,给整个行业带来了不小的冲击。
物联网智库曾在《物联网平台成“弃子”?谷歌/爱立信/IBM/博世/SAP等巨头集体退出!》一文中总结了2022年对物联网平台业务进行重大调整的企业,如下图:
其中,谷歌可以说是打响了大型物联网平台退出的第一枪。作为美国第三大云服务商,谷歌云推出的IoT Core,是这家巨头针对物联网市场的主打产品。2017年,该产品以公开测试版的形式推出,2018年2月商业化的IoT Core正式推出,到2023年8月16日停止服务,这一谷歌在物联网最重要的产品仅存活了5年。
谷歌毫无征兆地扔出其停止服务的重磅炸弹,让不少客户和合作伙伴措手不及。客户开始对谷歌业务失去信心,并且业界很多认为谷歌的做法会形成不好的示范效应。
果不其然,谷歌的推出带来了“多米诺骨牌”连锁效应,爱立信、IBM、博世、SAP等巨头开始纷纷放弃物联网平台。大家退出的原因也是多种多样,包括自身经营不善、准备向垂直行业转型、无法形成规模效应、转为仅对内部提供服务、没有较好的商业模式等等……
我们知道,很多物联网应用都有长期性的特点,使得选择稳定的平台服务成为客户的一个核心关注点,频繁切换平台不利于业务连续性。对于很多应用于各行业的客户来说,物联网方案已嵌入其核心生产经营流程,对于设备的远程管理、分析已成为其安全生产的关键要素,这些工作往往是通过物联网平台实现的。
例如,谷歌云IoT Core的客户就包括了运输、石油和天然气、公用事业、医疗等大型企业,它们通过谷歌云IoT Core所提供的物联网设备数据进行车辆调度、生产监控、能源数据采集、环境监测等工作,这些工作往往是这些行业正常运转的关键,需要长期持续、稳定的平台服务来支持。这种情况下,一个物联网平台服务退出,并被迫迁往其他平台,可能给客户生产经营连续性造成影响,并给客户带来损失。
多家巨头放弃物联网平台,显然会让整个行业对公有云的信心大减,基于此,一些物联网平台商为客户部署私有物联网平台服务,保障其业务连续性。
同时,处于物联网云平台和现场设备之间的边缘计算的价值得到进一步凸显。边缘计算在用户或数据源所处的物理位置或附近进行,通过使计算服务靠近这些位置,用户能够得到更快速可靠的服务,获得更好的用户体验,公司则能够更好地支持对延迟敏感的应用、识别趋势,并提供更好的产品和服务。
报告显示,到2030年,全球边缘计算市场规模预计将达到1559亿美元,预测期内的复合年增长率(CAGR)约为38.9%。
写在最后
当然,随着企业数字化转型的日趋理性,“下云”并不意味着一定要极端地抛弃云。根据IBM商业价值研究院《混合云平台的优势》调研显示,采用全面混合多云平台技术及运营模式所实现的价值,是采用单一平台、单一云厂商所能实现价值的2.5倍。
IBM 对2023年企业云转型作出了如下预测:
越来越多企业会开始采用“主机+云”的模式,二者不再是排他的选择题,通过战略性地将云与主机结合,企业可以获得更优的创新、速度和安全优势;
企业将实施全面安全策略,构建安全的生态系统,通过全面了解混合云环境中(本地、公共云或私有云、边缘)的数据,为未来的威胁(如量子安全挑战)做好准备;
企业将更加重视合规,尤其是金融服务等高度受监管的行业,以及需要处理客户个人信息的企业,将更加专注于处理最关键的任务工作负载,确保数据受到保护;
可持续性成为一个重要课题,企业将更加关注提高整个 IT 运营的能源效率,同时又不牺牲安全性或性能。
对企业本身而言,“上云”、“下云”都不重要,重要的是采取什么样的决策,才能让效率最高、成本最低,以更足的底气迎接不确定性的未来。