doris2.0.13版本中如何为每个分区指定分桶

Viewed 19
create table test001
(
   PK_ID                varchar(100) not null comment '主键',
   duration             varchar(10),
   CREATE_DATE          datetime  comment '创建日期',
)
UNIQUE KEY(PK_ID)
PARTITION BY RANGE(`duration`)
(
    PARTITION `p2016` VALUES LESS THAN ('20170101') DISTRIBUTED BY HASH(duration) BUCKETS 2,
    PARTITION `other` VALUES LESS THAN (MAXVALUE) DISTRIBUTED BY HASH(duration) BUCKETS 1
)
PROPERTIES
(
    "replication_num" = "1",
    "storage_medium" = "HDD"
);

以上脚本执行出错,提示ountered: DISTRIBUTED
Expected: COMMA
*/

https://doris.incubator.apache.org/zh-CN/docs/2.0/table-design/data-partition
这里提到【每个分区可以单独指定分桶数量】,具体的建表语法是什么?
解决数据倾斜问题:【每个分区可以单独指定分桶数量】。如按天分区,当每天的数据量差异很大时,可以通过指定分区的分桶数,合理划分不同分区的数据,分桶列建议选择区分度大的列。

1 Answers

可以手动alter,不过不建议这么设计建模,不太稳健。