doris2.0.4版本,有1个BE的CPU负载利用率远高于其他BE,长时间达到90%以上

Viewed 101

环境信息:

doris2.0.4版本,3台be,3台fe,be配置sync_tablet_meta已经改为false。多个任务做streamload写入,另外有高并发点查业务,其中一台BE的负载远高于其他BE,长时间达到90%以上。具体见监控:
异常43节点的cpu idle为1%左右,则cpu busy接近99%
image.png
数据倾斜使用命令查看,基本看BE的tabletnum是均衡的:
image.png

使用top -H -p dorisPID查看(每1秒刷新截图):

-----异常43节点<<<<<<<<<<:

abbe663dfee19cfb45d4eacda5a3ea83.png
6d3b29c9a0538ba7169cf91e3718cca3.png
37dc7262a666f8f1b9490495cfc3b39c.png
5d7f8b3425ca2ebad2fe74317d390454.png
5d7f8b3425ca2ebad2fe74317d390454.png
826a948a1c455b78c80442e47a00c7a3.png
e96e50bb410b82b716e3477360b44209.png


---------正常44节点<<<<<<<<<<:

419a492cd701b6e5eebea21541259d02.png
4757b0507b3b55a24e2f5e3b4354619d.png
4757b0507b3b55a24e2f5e3b4354619d.png
0dd0f1b882accd5e09410c0c4bf561e2.png
d1e6748a9b8448206e66a722cc1b1778.png
6ae64e304c7435d9a7344b6e6f9ee30e.png
0db06c08305e97be239da06444cb3a5e.png

这个是什么原因导致的呢?或者需要什么其他信息继续定位呢?谢谢

3 Answers

看着也有比较多的cc/bc
image.png

  1. 几个机器对比的看 top -H 呀,你这单机配置多少
  2. 可以抓下火焰图的