1. 首页 > 热门教育

业内:阿里云宕机或与服务组件有关

财联社11月14日讯(记者 付静)日前,阿里云发生重大故障,全线服务宕机3个半小时,引发业内诸多讨论。财联社记者与多位业内人士交流获悉,此次故障或与阿里云的鉴权服务(Auth)有关,多云备份或是杜绝此类重大事故的有效方式。

底层服务组件引起阿里云故障

据了解,不仅阿里系产品全线“崩溃”,阿里云客户的用户购物、企业运营、公共服务等都受到不同程度影响。据阿里公告,从11月12日17点44分开始,阿里云多个产品出现了全球多可用区多产品的故障。通过Status Page不难发现,此次不仅是一个可用区的故障,可谓全球大故障。

据悉,阿里云此次确认的故障与某底层服务组件有关,有业内人士对记者分析称,这一服务组件或是阿里云的鉴权服务(Auth),云计算最基础的要求之一就是权限控制、资源隔离,这些是基于鉴权服务来实现的。

“通俗来讲,鉴权服务的工作原理就是给资源上一把锁,给资源使用者分配对应的钥匙。鉴权服务正常工作时,正确的钥匙可以打开对应的锁;出故障时正确的钥匙就不起作用了。”其表示。

此番并非阿里云第一次大面积故障。去年阿里云香港机房节点发生故障,多个网站、互联网应用均无法打开。“这次阿里云的崩溃,让大家真正意识到,‘一切都在云上’,云已经成为和水电一样的基础设施。而行业的危机事件,也让大家意识到多云备份已经迫在眉睫。”前述业内人士称。

多云融合成趋势

如何规避这种问题的发生?财联社记者与多位行业人士交流获悉,通过多云部署策略确保业务连续性、避免因单独一家云厂商事故而影响企业自身业务,已成为一大行业趋势。

一位云计算从业者告诉财联社记者,如果企业关键业务构建于单一云厂商之上,一旦出现重大故障,企业业务也会跟着停摆,更严重的是业务核心数据受到损坏。

其表示,如果是单云部署,即便在云内做各种各样的高可用,比如多倍冗余、跨可用区部署,但如果发生底层组件故障,那也会像阿里云这样出现多可用区的多产品故障。如果是多云部署,比如把业务部署在两个不同云厂商,两个云之间的组件不会相互依赖,就可以避免其中一个云出现问题时,整个产品都不可访问的现象。

行业人士向记者举例,作业帮、TT语音等企业已经选择了多云路线,而TiDB、OceanBase等新型数据库已支持多云部署。另据媒体报道,跨境电商SHEIN在海外市场同时使用亚马逊云、微软云等厂商服务。美国调研公司Kentik数据显示,有40%的受访企业至少使用两种云。

“国内短视频领域某大厂也在2017年开始实践多云架构方案,2021年管理的总机器数已经达到数十万规模。”前述业内人士透露。

“多云”策略是否会增加管理成本和技术成本?上述人士分析认为,“云计算相关的所有业务,说到底就是数据+计算,这其中数据的多云部署是最大的挑战,计算则相对容易一些。从实际案例来看,多云部署成本提升不算太高,这也和每个企业选择的技术方案有关:比如,如果只选择把关键模块做多云部署,那这部分产生的成本则很小。企业可以根据场景调用不同的云上产品和服务,例如用A云厂商的数据库服务,接入B云厂商的AI大模型,通过统一调度灵活调配。在完成前期的操作与数据管理后,相比稳定性提升的收益,对于大部分企业来说,这部分成本也是可以接受、并且愿意接受的。”

版权声明:本文来源于互联网,不代表本站立场与观点,迎合教育网无任何盈利行为和商业用途,如有错误或侵犯利益请联系我们。

联系我们

在线咨询:点击这里给我发消息

微信号:79111873