doris be节点跑了一段时间后出现异常内存飙高,最后被系统杀死。

Viewed 80

出现异常时间为2024-11-03 06:28image.png
fe当天的fe.log、fe.audit.log、fe.warn日志文件如下
http://att.minicreate.com:9010/test/cangzhou/fe.log.20241103-1
http://att.minicreate.com:9010/test/cangzhou/fe.audit.log.20241103-1
http://att.minicreate.com:9010/test/cangzhou/fe.warn.log.20241103-1
be(10.101.26.23)节点当天的be.info日志文件如下
http://att.minicreate.com:9010/test/cangzhou/be-10.101.26.23.INFO
be(10.101.26.62)节点当天的be.info日志文件如下
http://att.minicreate.com:9010/test/cangzhou/be-10.101.26.62.INFO.log
be(10.101.26.26)节点当天的be.info日志文件如下
http://att.minicreate.com:9010/test/cangzhou/be-10.101.26.26.INFO.log

3 Answers

看dmesg 日志是因为oom导致be宕机,因为你的机器上部署了其他服务,所以会占用一部分内存,部署的话最好是be单独一个机器,或者可以调整be.conf来降低oom的概率

mem_limit=60%
#配置该项到be的be.conf中并重启BE后生效

image.png

看看宕机be节点的be.out,然后dmesg -T > dmesg.txt日志也贴一下的,宕机节点有部署其他服务吗,doris具体是什么版本呢?

be节点除了部署一个金山的杀毒软件和kafka、zookeeper外,没有部署其他程序了。

10.101.26.23节点
dmesg日志文件下载地址:
http://att.minicreate.com:9010/test/cangzhou/log/dmesg-10.101.26.23.txt
be.out日志文件下载地址:
http://att.minicreate.com:9010/test/cangzhou/log/be-10.101.26.23.out
image.png

10.101.26.62节点
dmesg日志文件下载地址:
http://att.minicreate.com:9010/test/cangzhou/log/dmesg-10.101.26.62.txt
be.out日志文件下载地址:
http://att.minicreate.com:9010/test/cangzhou/log/be-10.101.26.62.out
image.png

10.101.26.26节点
dmesg日志文件下载地址:
http://att.minicreate.com:9010/test/cangzhou/log/dmesg-10.101.26.26.txt
be.out日志文件下载地址:
http://att.minicreate.com:9010/test/cangzhou/log/be-10.101.26.26.out
image.png