透明度报告:数据恢复进度更新【翻译】

一句话概括:你的数据是安全的!

你可能知道,上周五我们遇到了一次严重的事故,导致了一个文章存储节点(包括两台服务器)数据的丢失。由于操作失误,导致了一个完整的备份和归档挂掉了。这是一次由我们引起的巨大的操作错误,我们保证再也不会出现这种严重失误了。

这个节点存储着从2015年到现在的所有的文章数据。这个节点中两台服务器共拥有6TB的数据。在意识到这个失误后,我们立即关闭了应用(Inoreader)以防止更严重的数据损坏(轮询服务器在使用这些节点来检查这些旧文章,以避免复制它们),关闭服务器让「数据覆盖」这个问题的影响降到最低。

与此同时,我们立即派出了精锐技术人员,用USB设备来启动服务器,同时也把文件系统设置为了「只读」状态。接着,我们从数据库的事务日志中打捞出3天的文章数据,然后使用了一个新的临时数据库来装载,来开启临时服务。这也是为什么星期五的时候,你在Inoreader中只能看到3天的文章历史。

但不幸的是,我们也同时停止了部分订阅源的更新,因为这些订阅源的文章都没有日期标记,我们无法确保这些文章是否会出现在崩溃的数据库中。如果允许这些文章被插入,意味着服务器需要进行超大量级的复制行为,而且当我们恢复数据后,用户将会重复看到同一篇文章,在我们彻底恢复完整数据库前,此限制措施将会被强制执行。

在数据恢复后,我们从文件系统中开始提取原始数据。这是一个漫长的过程,因为这些数据在文件系统中处于一个比较低的层面,但在几个小时前我们终于完成了这个过程。从这些文件中我们终于提取到了一些表格数据,它们可以被输入到数据库中,这也是我们正在做的事情。根据提取数据的速度,我们依然保留之前预估的恢复时间:6月4日,有可能会提前到6月3日。

重要的事说三遍:

  • 数据保证100%被恢复!
  • 数据保证100%被恢复!
  • 数据保证100%被恢复!

我们将会在这篇文章中,不断更新恢复过程:

  • 第一期(提取原始数据到文件中):已完成100%…..
  • 第二期(从文件中生成可读的数据):已完成100%…..预计完成时间:6.3
  • 第三期(读取数据到数据库中):已完成100%…..预计完成时间:6.6
  • 进度最近更新时间:6.6  1:00pm

第三期工程比预计中缓慢,预计完全恢复时间延至6月6日。

但是,我们已经恢复了足够的数据,所以我们可以开始轮询所有的订阅源,甚至包括那些没有发布日期的。

你可以在几小时后再回来看你所有订阅源的更新。

6.6 1:00pm更新

数据完全恢复!

 

现在我们内部对这件事极其重视,已经进行了内部程序优化,并订购了新的硬件来保证这种事情不再发生。

另外之前也提过,我们已经给所有用户提供了截止8月1日的两个月专业版套餐作为补偿:

  • 对于现在的月付用户,你们将会收到一封包含两个月时长的专业版套餐优惠码的邮件,你可以自由激活使用;
  • 对于现有的年付用户(入门、高级、专业、团队),你们的套餐期限将会在明天的时候,自动延长两个月。

Inoreader团队,Yordan Yordanov撰写,阡陌翻译

阅读原文


原创文章,欢迎转载,转载请保留:透明度报告:数据恢复进度更新【翻译】

5 thoughts on “透明度报告:数据恢复进度更新【翻译】

发表评论

电子邮件地址不会被公开。 必填项已用*标注