Doris FE短时间内堆内存打满,如何排查诱因

Viewed 44

版本:2.0.3

环境:3FE节点 FE机器为16核、64G,FE堆内存设置46G

时间:2024-10-17 13:07-2024-10-17 13:08 【UTC】

现象:FE在短时间内【2-3分钟】,FE堆内存由20G使用飙升至46G,且GC不释放内存,导致FE master节点和一个从FE节点失联,只存活一个FE节点。
image.png

问题:
1、如何定位短时间内jvm快速增长的诱因?
2、重启2问题FE的时候,一直无法启动
日志一直打印[Env.waitForReady():938] wait catalog to be ready. FE type: UNKNOWN. is ready: false信息
当把3FE都关闭,然后再重启时恢复,这个是因为什么导致?

2 Answers

补充说明一下,该问题时间段FE的CPU会有打满的情况,BE机器资源使用正常,其他磁盘、网络IO均正常
image.png
image.png