低基数列在数据库中,就是指的表中的一个字段包含大量的重复值,比如性别,Doris 中也是一样的。 在选择表模型时候需要根据场景来判断是否合适,是想存明细,还是唯一,或者是聚合等,Unique模型能够保证Key的唯一性,当用户更新一条数据时,新写入的数据会覆盖具有相同key的旧数据。所以如果使用低基数的话,要考虑是否需要被替换,保证Key的唯一。查询性能的话,Unique模型目前默认是MOR,如果需要更好的查询效率可以使用MOW Doris 内部本身就做了低基数列的优化,比如低基数词典编码优化等。 建议可以case by case的来看下,如果在查询过程中有性能不符合预期的地方可以提帖子,我们一起分析和优化。