副本修复任务一直timeout

Viewed 16

使用doris-manager缩容, tabletNum一直无法下降.
dropp backend之后, 发现部分tablet一直处于异常状态, 只有单副本
ADMIN SET REPLICA STATUS PROPERTIES("tablet_id" = "xxx", "backend_id" = "xxx", "status" = "bad");之后手动执行
ADMIN REPAIR TABLE tbl PARTITION (pxxx);
通过SHOW PROC '/cluster_balance/history_tablets';
查看ErrMsg永远是timeout
请问这种问题怎么解决呢
下图是异常日志
企业微信截图_04d8186f-3d83-4c03-a31b-06de1f92bba7.png

1 Answers

单副本环境下,直接 dropp backend 节点本身就是错误的,这会导致数据丢失。
就算设置为bad也无用了。tablet也无法进行空副本填充,因为所在的BE节点已经不在了。
这种情况,如果涉及到的表比较多的话,可能需要考虑表重建包括迁移成本如何了。

首先遇到下线卡住的问题,可以联系社区同学进行处理,除非是多副本环境,否则禁止执行 drop backend 操作。