生活
Optus停电解释:什么是“深度网络”中断,可能是什么原因造成的?

分析

澳大利亚的Optus用户今天早上醒来发现他们无法获得社交媒体修复,他们很不高兴。澳大利亚东部时间凌晨4点左右(新西兰时间早上6点),客户开始报告无法访问移动和家庭互联网服务。

Optus表示,它正在调查这一问题,中午时分有报道称,一些服务恢复了在线。

大约中午12点30分(新西兰时间下午2点30分),Optus首席执行官凯利·拜尔·罗斯林告诉2GB电台,在停电发生近9个小时后,已经找到了恢复的途径。

这次停电是澳大利亚历史上最大的停电之一,给全国敲响了警钟。随着许多小型移动网络供应商转售Optus网络,包括Aussie Broadband, Amaysim, CatchConnect, Coles mobile, Dodo, Moose mobile等,影响深远。

随着上午的进展,影响越来越大。健康和紧急服务无法沟通,墨尔本的火车停运,全国各地的小企业无法使用Optus EFTPOS。

幸运的是,如果Optus的用户在其他电信服务提供商的覆盖范围内,他们仍然可以使用漫游拨打000。

什么是“深度网络”问题?

今天早些时候,澳大利亚通信部长米歇尔·罗兰称该事件是“深度网络”问题。

电信网络包括三个部分:核心网、中转网和接入网。您可以将核心网络视为允许客户的设备连接并访问电话和互联网服务的系统。

传输网络通过光纤电缆将核心连接到接入网。接入网包括郊区的当地基础设施,包括移动电话塔。

当设备或电缆出现故障、软件故障或发生网络攻击时,可能会发生核心网络中断。

软件故障最常见的原因是当应用了补丁或更新时,它会产生意想不到的结果,例如导致一个或多个核心网络系统失败。

是什么导致了这一切?

尽管Optus没有给出宕机的确切原因,但拜耳罗斯马林表示,宕机的原因不太可能是网络攻击:“目前没有迹象表明宕机与间谍软件有关。”

与此同时,专家们注意到移动信号塔正在工作,似乎没有对底层光纤网络造成损害。这意味着我们可以排除运输或接入网络的问题。

影响发生的规模和速度(以及一些特定的时间)表明,罪魁祸首可能是核心网络中的问题。

很有可能是软件或系统更新造成的。此类更新或更改通常发生在营业时间之外,影响最小。它们通常涉及短时间的停机时间——“计划停机”——这是客户不注意的。

正如一些报道推测的那样,Optus中断可能是计划中的系统更改(如计划中的更新或中断)的意外后果。当这些过程出错时,它们可能会出现严重的错误!

至于这种故障是如何发生的,很可能是由于人为错误(特别是因为凌晨4点是你可能期望工程师进行修补工作的时间)。但是,它也可能是其他因素的结果,例如硬件故障导致软件故障。

另一种可能是会计或用户管理系统中的错误,例如不再能够正确地确定成本或验证用户身份。

后端计费和管理系统中的问题可能会在整个网络的其余部分产生一连串的故障。在这种情况下,系统中的一个简单错误可能会影响到连接到网络的每个人。

如何解决这个问题?

Optus的工程师将积极调查故障原因。你可能会想象有人拿着电线四处奔波,试图找到没有插上的那根电线——但实际上,这将是一个漫长的过程,需要检查各种系统和软件配置才能找到罪魁祸首。

对于Optus来说,在修复到位后,艰苦的工作将继续,以确保这种情况不会再次发生。也许更困难的挑战将是让公众相信这是一个孤立的事件——它再次突出了我们的大规模连接系统对(甚至是单点)故障的脆弱性。

拜耳罗斯马林在3AW下午节目上表示:“我们正在考虑能做些什么来感谢客户的耐心。”

Optus可能会向客户支付赔偿。对于住宅用户来说,这可能是以减少账单的形式出现的。

对于企业客户,补偿将与他们的服务水平协议相关联。换句话说,对Optus的具体处罚将基于它与使用或共享其服务的各方达成的个别协议。

除此之外,今天的事件极有可能对Optus的声誉造成了巨大的打击——尤其是考虑到去年Optus的数据泄露事件。

Paul Haskell-Dowland,网络安全实践教授;Mark A Gregory,工程学院副教授,Mohiuddin Ahmed,计算机与安全高级讲师,

本文转载自The Conversation。阅读原文。

点击分享到

热门推荐