doris 集群 执行不了sql

Viewed 42

doris版本:2.0.7
集群配置:128C+256G,5台,3FE+5BE,混部
现象:通过mysql 客户端能提交sql,但是不返回执行结果,整个集群没反应,通过观察集群的,cpu,内存,io的使用率,都很低,不超过20%,通过查询审计表查询,同一个时间点提交的sql只有40个左右。
从be的warn,日志中发现很多如下的信息,
Couldn't open transport for XXX:9021 (socket open() error: Connection reset by peer)
Query c5f01e5dba34bca-9209f1f45ed12a4a instance c5f01e5dba34bca-9209f1f45ed139dc report error status to coor XXXX:9021, error status: 1
针对以上现象有两个问题:
1.这个问题怎么产生的,需要修改fe和be的哪些配置能改善这个情况
2.在be上执行的query 的instance,在向fe汇报失败的情况下,be中这个instance会在查询超时的时候,被be清除吗?

1 Answers

【问题状态】跟进中
【问题处理】处理中,已经私信,有进展更新到论坛