doris集群断电修复后be有张表查了会报错

Viewed 43

Doris使用环境: 测试

Doris版本: 2.0.8

操作系统: Redhat 7.9

问题描述:

我的doris集群之前被断了电,重启服务后发现fe节点一直滚动wait catalog to be ready. FE type UNKNOWN这样的报错,在按官方文档中元数据运维下故障恢复部分恢复fe之后发现有一张表查不了了,报错如下

mysql> select * from FDM_DIMENSION_ACTIVITY;
ERROR 1105 (HY000): errCode = 2, detailMessage = (192.168.16.159)[CANCELLED][E-230]missed_versions is empty, spec_version 705, max_version 707, tablet_id 4562086

	0#  doris::Tablet::capture_consistent_versions(doris::Version const&, std::vector<doris::Version, std::allocator<doris::Version> >*, bool) const at /home/zcp/repo_center/doris_release/doris/be/src/common/status.h:357
	1#  doris::Tablet::capture_rs_readers(doris::Version const&, std::vector<doris::RowSetSplits, std::allocator<doris::RowSetSplits> >*) const at /home/

想问一下各位大佬,遇到这种情况应该怎么处理,这个表的数据还有恢复的可能吗?谢谢了

集群配置: 2FE 2BE

机器配置: 8C8G

1 Answers

恢复不了,出现这种情况主要是因为FE的元数据跟BE的元数据信息有出入,根本归因是你恢复使用的image中的元数据不是最新且全部元数据信息,有些元数据保存在内存或者journal中。
具体就是实际数据写到BE,但是元数据还在FE内存中或者journal路径下,但是你只使用image去做FE恢复,这就会遗漏一部分已经写到BE数据的元数据。