6月5日,唯品会发布了《关于329机房宕机故障处理的公告》。公告称,因3月29日的机房重大故障影响时间持续12个小时,导致公司业绩损失超亿元,影响客户达800多万,唯品会将对基础平台部负责人予以免职处理。
对于唯品会的处理结果,部分网友表示理解,认为系统故障需要时间修复,今后依然会在平台上持续购物,对此前平台提供的优质购物体验表示认可。
但也有行业从业者谈到:“服务器一旦宕机,消费者就无法对网站进行访问,客户下不了单,直接就会对公司经济利润造成很大的影响,甚至还可能影响到网站在搜索引擎上的收录和排名。不知道为什么(329事故)需要12小时才能解决,这说明唯品会在架构设计上肯定存在问题,对基础平台的负责人免职根本解决不了问题。”
在电商行业摸爬滚打这么多年,唯品会为什么还会出现宕机事故?为什么宕机之后12小时才解决?之后遇到类似事故应该如何处理?
判定P0级故障
基础平台负责人免职
今年3月29日凌晨,唯品会用户发现客户端和小程序均无法正常使用,包括订单页打不开、商品无法加购、购物车无法加载、商品订单无法结算等。
3月29日上午9点,唯品会在微博回应系统宕机:因系统短时故障,主站“加购”等功能或出现异常,目前平台正在紧急修复中,稍后相关功能将陆续恢复正常,敬请谅解。
该故障持续了12小时,最终在3月29日12时01分得到解决,系统各项功能恢复正常使用。
消费者纷纷表示不满:“明明凌晨就出问题了,怎么是短时故障?”“两年没在唯品会买东西了,昨天晚上买了两条裤子,早上起来就崩了。”“烦请稳住了,不想重新去找别的购物平台。”
时隔2个多月,今年6月5日,唯品会公布事故原因:线上商城停止服务的原因是温度快速升高造成的机房宕机,机房宕机是因南沙IDC冷冻系统故障导致。
在唯品会内部,329机房宕机被判定为P0级故障,即最高等级事故。据了解,核心功能不可用、服务不可用超时30分钟、造成资金损失、重点保障客户投诉、系统安全或数据安全故障等出现其中一项,即可被认定为P0故障。
有行业人士表示,唯品会在技术上投入不足:“服务器宕机很正常,几乎每个后端程序员都至少经历过一次。不知道为什么需要12小时才能解决这个问题,一般大公司会有一套很完善的避免和处理宕机事故的流程。少做点营销广告,多把钱花在技术基建上比啥都重要。”
不止唯品会
微信、淘宝都崩过
派代了解到,3月29日当天,出现网络故障的企业不只有唯品会,微信、QQ等社交软件也出现功能异常,账号登录、文件传输、朋友圈、微信支付等多个功能无法正常使用。
腾讯微信团队在 3 月 29 日上午发布信息称:" 今天凌晨部分用户使用微信、微信支付相关功能出现异常,经工程师抢修,系统正在逐步恢复,很抱歉给大家带来不便。"
淘宝也曾在2017年、2022年出现过类似的系统故障。
2017 年双十一凌晨,数百万消费者涌入天猫之际,大量手机淘宝、手机天猫的用户发现,无法付款和修改地址,订单、足迹、收藏夹、红包卡券等也出现异常。直到当日 12 时 30 分,淘宝天猫的服务器才恢复正常。2022年,淘宝客户端、手机页面也出现瘫痪,用户登陆失败、搜索物品出现网络连接失败,遭到不少消费者吐槽。
对平台型企业来说,随着用户数的增多,系统出现故障的概率也会增大。近年来,不少热门 APP 的服务器,都经历过卡顿、崩溃乃至宕机的事故。
既然329事件不是行业首例,为何唯品会要重罚?而且部分网友依然不“买账”
首先,唯品会329事故宕机时间长。以2022年淘宝系统故障为例,从11时30分左右出现系统故障,到12时38分系统修复,手淘服务恢复,资金和交易数据未受任何影响,仅用时1小时左右,影响面更小,损失能控制在一定范围内。
但唯品会这次故障长达12小时,影响用户数达800万。在公告中,唯品会要求每一位员工以329事件为戒,反思自己的日常工作,检视交付上的漏洞,梳理设计上的短板等。
其次,唯品会应急和容灾能力不足。容灾是指企业对于可能发生的系统故障的防范性准备:建立两套或多套功能相同的IT系统,当一处系统停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作、
在329事故发生后,唯品会并没有应急方案,才造成了重大损失
宕机事件敲响警钟
回顾唯品会过去几年的经营成果,派代发现:尽管其净利润显著增长,但营收、用户数、商品交易总额等均出现了不同程度的下滑。
其中,2022年唯品会总营收为1032亿元,较上年同期下滑11.89%,净利润为63亿元,同比增长34.6%;2022年活跃客户数量为8480万,而上一年为9390万,相当于一年流失了910万活跃客户。
围绕唯品会今年来的业务核心关键词是“降本增效”、“提高利润率”。
唯品会CEO沈亚曾说,“相信我们仍然可以进一步扩大利润率。在成本和开支方面也继续非常严格,非常仔细地计算在哪里花钱,我们希望确保我们花的每一美元都得到了回报。”
降本之后,这两年唯品会确实也取得了一定的成果(主要体现在利润上),但是也导致了一些别的问题。
2022年,唯品会的履约费用为22亿元,与上一年基本持平;营销支出同比大幅下降了17.6%,从上年的11亿元降至9.441亿元;技术和内容支出费用同比下降7.8%至4.085亿元。大量缩减技术费用,可能是导致这次事故的内在原因。
对比来看,阿里、京东每年都在技术安全上投入大笔费用。2022年阿里技术投入超过1200亿元,约占总营收的14.07%;2022年京东全年研发开支达169亿元,占总营收的1.61%;唯品会2022年的技术和内容支出费用为4.085亿元,仅占总营收的0.39%。唯品或低于其他两大平台。
缩减成本、提高盈利,不应以牺牲用户体验为代价。
电商平台成功与否,与用户体验是息息相关的。通过优化用户体验,电商平台可以提高品牌忠诚度,并增加交易的完成率。
329宕机事件给唯品会和其他电商平台的启示是,不重视用户体验带来的损失极其严重,做好容灾应急预案和风险防范措施的成本投入,要远比事故产生后带来的损失更小。只有做好了技术基建,用户才能在平台上放心买,成为平台的忠实用户,要继续拓展SVIP的唯品会,在这方面不可掉以轻心。
