[V2.0.9] BE集群其中一个节点与fe master节点连接中断

Viewed 31

想请教一下这个问题的排查方向

部署架构: 3fe + 6be

机器规格: 统一80C/125G

排查步骤:

  1. 20241120-11:40我们系统执行insert select时, doris be节点报错如下
    image.png

  2. 查询doris监控可以看到239这个节点此有收到流量, 但cpu基于没动
    image.png

  3. 排查日志发现从20241120-0点就一直处于和fe master节点224连接超时状态的日志, 但telnet是通的
    image.png

  4. 但排查fe master节点日志发现还在正常与该be节点进行任务派发, 但没有异常日志

image.png

1 Answers

这个问题在小群跟进中了,根据报错来看,怀疑还是网络的问题。但是还没有实锤,需要进一步排查。

后续结论会及时同步到帖子上。