【已解决】关于doris低基数列的一些问题

Viewed 48

1、doris怎么判断低基数列?
2、低基数列作为key(比如unique模型)对查询性能有影响吗?
3、doris是怎么对低基数列进行优化的,有文档可以参考吗?

1 Answers
  1. 低基数列在数据库中,就是指的表中的一个字段包含大量的重复值,比如性别,Doris 中也是一样的。
  2. 在选择表模型时候需要根据场景来判断是否合适,是想存明细,还是唯一,或者是聚合等,Unique模型能够保证Key的唯一性,当用户更新一条数据时,新写入的数据会覆盖具有相同key的旧数据。所以如果使用低基数的话,要考虑是否需要被替换,保证Key的唯一。查询性能的话,Unique模型目前默认是MOR,如果需要更好的查询效率可以使用MOW
  3. Doris 内部本身就做了低基数列的优化,比如低基数词典编码优化等。

建议可以case by case的来看下,如果在查询过程中有性能不符合预期的地方可以提帖子,我们一起分析和优化。