我目前是3个BE节点,使用StreamLoader工具加载了数据进集群,FE和BE都用Nginx做了负载均衡。
现在数据分布情况如下图:
需要说明的是,我的建表语句的副本数都是1,分桶使用自动(查询得知表的分桶为10),分桶字段已经尽量选择了重复度较低的字段。BE节点信息如下:,第一个节点使用磁盘过多是因为放了本地的数据文件。
Doris版本:2.1.6(ARM)
问题1:为什么会出现这种情况?虽然副本数是1,但是根据hash算法的分桶,不应该分布三个节点吗?即便是有一点倾斜可以理解,但是这种数据完全集中在节点2上的情况,太不正常了,为什么?
问题2:这种情况如何解决?(社区中自行排查的文章我尝试过了,没有效果)