跳转至

当前 rocksdb 中,默认情况下在写操作中任何一个错误(写 WAL,Memtable 落盘)都会导致 db 实例进入只读模式,之后的用户写操作都不会被接受。变量 ErrorHandler::bg_error 会被设置到对应的失败 Status。DBOptions::paranoid_checks 选项控制 Rocksdb 在检查和确认错误的强度。默认值为 true。下面的表展示不同场景的错误以及对 db 的潜在影响。

错误原因 BG_ERROR_ 被设置的时机
同步 WAL (BackgroundErrorReason::kWriteCallback) 总是
Memtable 插入失败 (BackgroundErrorReason::kMemTable) 总是
Memtable 落盘 (BackgroundErrorReason::kFlush) DBOptions::paranoid_checks 为 true
SstFileManager::IsMaxAllowedSpaceReached() 报告 memtable 落盘的时候已经达到最大空间 (BackgroundErrorReason::kFlush) 总是
SstFileManager::IsMaxAllowedSpaceReached() 报告压缩期间到达最大空间 (BackgroundErrorReason::kCompaction) 总是
DB::CompactFiles (BackgroundErrorReason::kCompaction) DBOptions::paranoid_checks 为 true
后台压缩 (BackgroundErrorReason:::kCompaction) DBOptions::paranoid_checks 为 true
写 (BackgroundErrorReason::kWriteCallback) DBOptions::paranoid_checks 为 true

探测

一旦数据库实例进入只读模式,下面的前端操作在所有后续调用中都会返回错误:

  • DB::Write, DB::Put, DB::Delete, DB::SingleDelete, DB::DeleteRange, DB::Merge
  • DB::IngestExternalFile
  • DB::CompactFiles
  • DB::CompactRange
  • DB::Flush

返回的 Status 会包含具体的错误码,子码以及严重性。错误的严重性可以通过调用 Status::severity() 得到。有四个严重性等级:

  • Status::Severity::kSoftError——这个严重性等级的错误,不会阻止 DB 的写入,但是他意味着 db 在一个降级模式。后台压缩可能没有按时执行。
  • Status::Severity::kHardError——DB 已经处于只读模式,但是一旦错误被修复,就可以恢复成读写模式
  • Status::Severity::kFatalError——DB 在只读模式。只有关闭 DB,修复错误的根源,然后重新打开 db,才有可能回复。
  • Status::Severity::kUnrecoverableError——这是最高等级的严重性,并且意味着数据库将无法工作。可能可以关闭然后重新打开 db,但是数据库的数据将不能保证正确。

除了上面提到的,在发生后台错误的时候,一个通知回调 Status::Severity::kUnrecoverableError 会被尽可能快地调用。

恢复

有两种办法从后台错误中恢复而不需要关闭数据库:

  • EventListener::OnBackgroundError 回调如果认为当前的错误不是那么严重,不需要停止后续的写错做,那么他可以修改错误状态。可以通过设置 bg_error 参数来完成这个工作。这么做可能会有风险,因为 rocksdb 可能无法保证 DB 的一致性。修改之前,检查 BackgorundErrorReason 以及错误的严重性。
  • 调用 DB::Resume() 来恢复 DB 并且使之进入读写模式。这个方法会清理错误,清理所有废弃的文件,然后重启后台落盘以及压缩任务。目前,他只支持从压缩过程中产生的后台错误。未来,我们会加入更多的场景