数据分片不均衡(Tablet)

Viewed 64

我目前是3个BE节点,使用StreamLoader工具加载了数据进集群,FE和BE都用Nginx做了负载均衡。
现在数据分布情况如下图:
数据分布情况需要说明的是,我的建表语句的副本数都是1,分桶使用自动(查询得知表的分桶为10),分桶字段已经尽量选择了重复度较低的字段。BE节点信息如下:image.png,第一个节点使用磁盘过多是因为放了本地的数据文件。

Doris版本:2.1.6(ARM)

问题1:为什么会出现这种情况?虽然副本数是1,但是根据hash算法的分桶,不应该分布三个节点吗?即便是有一点倾斜可以理解,但是这种数据完全集中在节点2上的情况,太不正常了,为什么?
问题2:这种情况如何解决?(社区中自行排查的文章我尝试过了,没有效果)

1 Answers

你的副本数是1,所以tablet只能选择一个存放。你有个盘已经使用了百分40左右的存储,其他很少,根据均衡原则,会选择少的节点