原文标题:《西南航空大瘫痪:上万航班被取消,竟因为 90 年代的 IT 系统》
史上最严重的航司瘫痪事故,竟是因为从 90 年代就没再更新过 IT 系统……
上周,超强冬季风暴“埃利奥特”(Storm Elliott) ,导致美国民航业在圣诞假期的这一周里,经历了“数十年一遇”的严重瘫痪。
航班信息追踪工具 FlightAware 的数据显示:从上周三到本周一(21-26 日)全美航班取消总数超过了 1.7 万架次。
好在,在极寒气流经过之后,临近圣诞前夕和圣诞节当天,各航司已经恢复到正常的 80% 以上水平。
唯独西南航空成了异类:其取消的航班数量越来越多,整个航空公司从圣诞节的五天前开始陷入完全崩溃,直到圣诞节的三天后,仍然处于完全瘫痪的状态。
最近几天到过圣何塞 SJC 机场的硅谷朋友们,应该对下面这样的画面并不陌生:旅行者挤满了出发大厅,队伍甚至排出了航站楼;无人认领的行李堆满了行李转盘区域,到处都是混乱的景象……
小红书上也有网友拍了视频,显示 SJC 排队的情况相当夸张,西南的队伍已经不仅已经排到了同一座航站楼的阿拉斯加门口,甚至往后还甩出了至少好几百人。更夸张的是租车公司也人山人海,“没有一辆可以租的车”(因为很多人航班被取消,改为租车出发)。
在田纳西州的纳什维尔国际机场,西南航空甚至将客服工作“外包”给了当地警察:
一条发布于 12 月 27 日晚间的视频显示,一位警察威胁那些因为航班取消无处可去的乘客,“西南打电话叫我们来,你们没有合法的机票,如果再不走,我就要逮捕你。”
各地机场的“盛况”,可以说完全是西南航空的“锅”。
根据不完全统计,从周一到周三,西南航空的单日航班取消数量都在 2500 架次,甚至更多,直到周末才能恢复。FlightAware 平台的数据显示:自圣诞周末以来,全美绝大部分的被取消航班都来自西南航空;从本周三开始,基本整个美国只有西南航空还在取消航班了……
图片截取于周二。数据来源:FlightAware 制图:CNN
这已经不是西南航空第一次因为全系统瘫痪导致航班大面积取消了。事实上就在去年 10 月,西南就经历过一次类似的情况,只是程度没有上周如此恶劣而已。
一而再、再而三地让顾客失望,而且还是在全民返乡团聚的圣诞假日…… 西南航空到底是怎么了?
我们通过多位民航业人士以及西南航空工作人员透露的情况,还原本次西南大瘫痪背后的真实原因。
毫无疑问,冬季风暴埃利奥特是这次大瘫痪的导火索。
12 月 21 日,一场历史性的温带炸弹气旋在北美上空形成,美国、加拿大多地均发布了暴风雪警告。从 12 月 23 日开始,北美多个主要城市均遭遇了暴风雪。从 21 日至 25 日圣诞节当天,总共有一万多个航班延误或取消。
然而西南航空老旧过时的机组排班平台,才是本次大瘫痪的核心原因。
多位民航业工作人员,包括在网络上匿名发帖的西南航空的工作人员都表示,西南航空一直在使用一套极其古老的后端系统。特别是其机组排班平台,系统十分古老,规则也非常“扯淡”。
具体来说,一般航空公司需要看一下自家的实时系统或者 FAA 的公开数据,就可以知道自家的飞行员和空乘的当前所在地。
这个逻辑很简单,可西南偏不这样做…… 该公司采用的是一套非常过时的“预排 + 手动记账”系统:
西南为机组人员排班之后,会自动把他们的位置,挪动到该次航班的目的地;
而如果航班发生了改道、延误和取消,西南的系统无法自动更新这些机组人员的位置,而是需要人工确认航班的具体情况,然后在排班平台上手动修改……
在各地暴风雪导致大面积延误 + 取消的情况下,西南员工需要进行大量的人工追踪 + 手动修改。最终导致人力不足,无法及时追踪航班最新情况和进行对应修改。
最后雪球越滚越大,排班平台出现了严重的信息误差,基本没有一条是准确的。整个系统,就这样完全“失灵”了。
比方说一架洛杉矶起飞的航班,票卖出去了,大批乘客的登机手续都办好了,行李都收了,西南的系统也给安排了机组了 —— 结果乘务员都还在几千英里外的纽约、达拉斯和丹佛,只有一个机长“光杆司令”在洛杉矶,这也没法飞啊……
更离谱的还在后面呢……
在昨天的一次公司内部通话中,西南航空 COO Andrew Watterson 承认了上述情况的存在,并且透露因为信息的误差实在太严重,整个系统已经完全无法使用 —— 于是公司只好紧急通知所有机组员工,要求他们手动汇报自己的当前所在地。
你以为汇报方式应该是什么样的?让他们自己登录系统提交信息?发邮件?发短信?填在线表格?
那你就太高看西南航空了……
该公司所谓的手动汇报方式,是让所有机组人员拨打同一个热线电话。
结果,西南航空不光自动排班平台垃圾,人工排班人员的接待能力也极其有限。
那边,乘客在机场排队,排到了九霄云外;这边,全国成千上万名机组员工打同一个电话,等到了天荒地老……
甚至,有的员工排队等待的时间,长达 23 小时。
排班平台的严重失灵,不仅让公司无法掌握员工的准确情况,甚至还引发了“次生灾害”:
美国监管部门 FAA 规定,民航机组人员在工作一定时间之后,必须强制休息足够长时间后才可继续执飞。通常,航司的系统可以自动统计员工的工作时间,超限之后在他们的当前所在地自动预订酒店房间。
然而:
因为西南的后台系统严重瘫痪,四散各地的机组人员不光没有办法返工,连酒店房间都没法开;
订不到房间,这些员工的强制“休息”时间就没有办法开始计算,也就没有办法返工。
据知情人士透露,这两天西南的员工已经完全放弃公司的系统了,很多机组人员自己出钱定了酒店房间,尽管不敢保证公司回头能不能及时报销……
你看,又一个雪球滚起来了。
除了系统原因之外,西南航空在崩溃发生的几天前,刚刚惹怒了大批普通员工。这种在员工面前摆出的恶劣姿态,也在一定程度上加剧了后来瘫痪的严重性。
12 月以来,美国面临一场“三重疫情” (Tripledemic):新冠、流感、RSV(呼吸道合胞病毒)同时大流行,许多人都告病在家,西南航空也未能幸免
一份内部邮件显示,在 12 月 21 日,西南航空副总裁 Chris Johnson 在丹佛机场发布了运营紧急状态令(State of Operational Emergency)。
这位高管宣称,由于太多的人请了病假和事假,导致人员短缺,公司不得不临时修改丹佛机场工作人员的请假政策:
请病假的人员,在返工后必须出具假条,而且必须是线下就诊,远程问诊不算,否则直接开除;
驳回已经批准的事假,所有请假员工自动返岗,不按时到岗的直接开除;
由于自愿加班人数凑不够,公司开启强制加班制度,不加班的员工同样开除。
这邮件不发还好,一发出去,员工直接炸锅了。
之前已经请了病假和事假的丹佛员工,后面直接不来了。而且还有坊间传闻,周三周四那几天在丹佛机场有至少 100 名西南航空地勤员工辞职……
而考虑到丹佛又是西南航空的最大集散地,惹怒地勤员工的后果,可想而知了。
目前看到最离谱的是下面这架航班:从坦帕飞往丹佛,因为丹佛地勤全罢工了,最后已经到了目的地,又不得不调头返回坦帕……
本已十分艰难的西南航空复工进程,一次又一次遭到沉重的打击。
最终,所有的努力,都不得不付之东流。
西南航空目前的计划是:完全取消所有的航班,来一次“硬重启”
因为像他们这样的后台系统,除了重启再来,也没有别的办法了。
这也是为什么从本周一开始,西南航空的航班取消越来越多,旅客和行李积压越来越严重。
—— 硅谷朋友们在 SJC 看到的“盛况”,实际上只是九牛一毛而已。毕竟在西南航空全美流量最大的机场当中,SJC 连前十都排不上呢。
本周一,在 Reddit 的西南航空子版块(非官方)里,有一位自称为员工的匿名用户发了一条“非官方”版的情况说明,让大家更清楚地了解了目前西南航空内部究竟是一番怎样的崩溃景象,以及接下来应该如何做旅行安排计划。
这条帖子目前已经删除,不过原文是这样写的:
1)这次大瘫痪,导火索确实是冬季风暴,但是能够瘫痪到如此严重的程度,完全是由西南航空自己导致的。如果西南客服还告诉你是因为风暴的原因,那就是他们在说谎(实际上是公司安排的话术)
2)瘫痪的核心原因是机组排班软件完全失灵,并且打电话排班也不管用。“如果我们有更好的技术,不用打电话的话,这个问题现在早就解决了。”
3)如果旅客被困了,并且还有另外的交通方式可选的话 —— 直接走是最好的选择,不要犹豫。
4)行李能不托运绝不托运,因为没人能保证你的行李最后会出现在哪。目前托运行李的情况完全可以用灾难来形容,如果有托运的行李遗失的话可能要至少一个月,甚至更久才能找到。
5)不要等西南恢复,不要碰运气:未来 3 天的航班一定会取消;4-7 天的“有可能”遵守计划;7 天之后的应该能恢复到正常情况。
另外,在 Reddit 上,还有网友出了主意:
“困在机场没事可做?去行李转盘,找没人认领的行李,看看上面如果有电话号码,告诉失主行李的所在位置。”
在了解这次大崩溃的内情后,许多网友表示,对民航业的技术水平不太了解,没想到一家 21 世纪的航空公司,居然还能因为排班系统如此老旧而出现全系统大瘫痪的情况。
但更令网友感到愤怒的是,西南一次又一次地因为同样的原因出问题,最后还是要普通员工私下匿名发帖的方式了解到真相。
在接受美国媒体采访时,西南航空的 COO Andrew Watterson 也不得不承认,他们的系统实在太老旧了:
“我们的飞机是足够的,但是排班调度软件出了问题。我们目前的技术水平,无法将机组人员和航班进行准确及时的匹配。”
Watterson 将西南航空的后台系统,形容为一座纸牌屋 —— 但凡任何一个小地方出现了一丁点问题,都会导致整个纸牌屋瞬间崩塌。
“在我们马上就要解决问题的时候,又出了新的问题…… 最后,我们不得不重置整个系统。”
这场大崩溃,导致全美上百万人无法在圣诞节前及时返回家人的身边,也让西南航空的高管们颜面尽失。
他们口口声声说着“要解决系统的问题”。然而在西南航空,他们的说辞已经和“狼来了”一样了。
西南航空飞行员协会主席 CaseyMurray 接受 CNN 采访时表示,“过去一年半里,我们一直在遭遇这些问题。不同规模的崩溃,在公司内部发生的越来越频繁,但实际上只要把 IT 系统,把流程搞好就完全可以解决。”
根据他的了解,西南航空的后台系统,从上世纪 90 年代开始就没怎么变过了。
本文来自微信公众号:硅星人 (ID:guixingren123),作者:光谱 杜晨,编辑:VickyXiao
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。