create table test001
(
PK_ID varchar(100) not null comment '主键',
duration varchar(10),
CREATE_DATE datetime comment '创建日期',
)
UNIQUE KEY(PK_ID)
PARTITION BY RANGE(`duration`)
(
PARTITION `p2016` VALUES LESS THAN ('20170101') DISTRIBUTED BY HASH(duration) BUCKETS 2,
PARTITION `other` VALUES LESS THAN (MAXVALUE) DISTRIBUTED BY HASH(duration) BUCKETS 1
)
PROPERTIES
(
"replication_num" = "1",
"storage_medium" = "HDD"
);
以上脚本执行出错,提示ountered: DISTRIBUTED
Expected: COMMA
*/
https://doris.incubator.apache.org/zh-CN/docs/2.0/table-design/data-partition
这里提到【每个分区可以单独指定分桶数量】,具体的建表语法是什么?
解决数据倾斜问题:【每个分区可以单独指定分桶数量】。如按天分区,当每天的数据量差异很大时,可以通过指定分区的分桶数,合理划分不同分区的数据,分桶列建议选择区分度大的列。