[V2.0.9] BE集群其中一个节点与fe master节点连接中断

Viewed 15

想请教一下这个问题的排查方向

部署架构: 3fe + 6be

机器规格: 统一80C/125G

排查步骤:

  1. 20241120-11:40我们系统执行insert select时, doris be节点报错如下
    image.png

  2. 查询doris监控可以看到239这个节点此有收到流量, 但cpu基于没动
    image.png

  3. 排查日志发现从20241120-0点就一直处于和fe master节点224连接超时状态的日志, 但telnet是通的
    image.png

  4. 但排查fe master节点日志发现还在正常与该be节点进行任务派发, 但没有异常日志

image.png

0 Answers