请问 doris 的 N-GRAM 索引的创建性能以及对数据写入的影响如何?

Viewed 11

DORIS 2.1.6:
我在一个约有10多亿条数据,30个字段,单副本的表上的某个字段上创建N-GRAM索引,感觉创建时间非常漫长,大概需要几个小时,在这期间,该表的schema 状态为非normal,不能再进行任何schema操作。

硬盘为RAID5的机械硬盘(5x2.4T),RAID卡配了2GB的电容缓存;

请问:
1、就以上数据量和存储配置,N-GRAM索引创建需要这么长时间,且锁定表SCHEMA不能修改是正常的么?
2、除了新建索引时比较耗费时间,N-GRAM索引对表的数据的写入是否会有较大的性能影响?

1 Answers
  1. 建议使用倒排索引来加速查询
  2. 直接挂单盘,不需要组raid5
  3. 建了索引之后对数据导入速度也有一定影响