1.1.5,fe升级报错

Viewed 11

Doris版本1.1.5
fe节点数有3个(角色都是follower)

问题描述

Doris版本从1.0.0升级到1.1.5时,fe升级报错,导致该节点fe(非master)读取另外两个fe节点状态报错。

尝试使用故障恢复进行元数据恢复:具体操作,
1.停用该节点的fe;
2.fe.conf添加metadata_failure_recovery=true;
3.清除文件夹doris_meta下的文件;
4.使用./bin/start_fe.sh --metadata_failure_recovery --daemon。(报无法识别参数metadata_failure_recovery)

操作后fe无法正常启动。

然后进行如下操作:
1.删除fe.conf中的配置metadata_failure_recovery=true,
2.删除doris_meta文件夹下的文件,
3.使用--helper从master节点进行恢复。
4.重新添加该节点到fe集群。

fe到此时,已经可以正常访问,但是后台一直报错,如下:
image.png

2 Answers
  1. 这个报错是正常告警,正常的 close 或者 ctrl c都不会导致这个报错,只有比如查询过程中强制关闭客户端程序,并且关闭前不进行任何的 close 处理才会导致异常,建议自行排查下客户端程序。

  2. 集群元数据恢复流程,看着正常,但是不建议走元数据恢复模式,有可能会导致数据丢失。

现在数据还在自动恢复中,可以继续滚动升级吗?

滚动升级需要关闭副本修复与均衡功能,这个对升级会不会有影响?