本次事故起源自因磁盘静默错误导致的单副本数据错误,再由于数据迁移过程中的不规范操作,导致异常数据扩散至三副本,进而导致客户数据完整性受损。
关于改进措施,腾讯云承诺,将全面审视所有的数据流程,涉及数据安全的流程自动化闭环,进一步提升我们常规运维自动化和流程化,降低人工干预。同时把全流程的数据安全校验作为系统的常开功能,不允许被关闭。
其次,针对物理硬盘静默数据错误,在当前用户访问路径数据校验自愈的基础上,我们优化现有巡检机制,通过优先巡检主副本数据块、跳过近期用户访问过的正确数据块等方法,加速发现该类错误,进行数据修复。
最后,腾讯云提到了“提供的免费快照功能”,腾讯云呼吁客户开启这一功能,进一步提升自身数据的安全性。
事件回顾:
8月5日,前沿数控在微博上发表长文《腾讯云给一家创业公司带来的灾难》,文章中表示,“2018年7月20日,我们近千万元级的平台数据全部丢失,包括经过长期推广导流积累起来的精准注册用户以及内容数据,这瞬间将一家创业公司摧毁”。
8月6日9时许,腾讯云在微博发表了《关于用户“前沿数控”数据完整性受损及腾讯云补偿措施的说明》,文章中指出前沿数控所遇情况是因受所在物理硬盘固件版本bug导致的静默错误(写入数据和读取出来的不一致)影响,文件系统元数据损坏。
随后,腾讯云向“前沿数控”接口人说明情况,表达歉意,并制定“赔偿+补偿”方案。腾讯云认为“前沿数控”在平台上产生的实际消耗共计3569元,将按照赔偿条款中的上限以现金形式全额返还这笔费用;同时,腾讯云承诺为“前沿数控”提供132900元现金或云资源的额外补偿。
前沿数控随后文章回应,称对腾讯云的多处回应表示不满意,并表示不能接受13万元的赔偿。
详情:
《“前沿数控”称腾讯云上价值千万元数据丢失,腾讯云官方回应》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。