在测试Doris的正则匹配时,发现两个问题。
问题1
Doris的语法规范,需要加转义。'\d+'不行,要'\\d+'才行。是所有的特殊符号都需要加转义吗?
问题2
中文匹配的问题。
官方提供了一个中文匹配的正则表达式 '\p{Han}'是符合要求的,但这是Doris自定义的正则表达式吗?
用常用的中文匹配正则 '[\u4e00-\u9fa5]' 时,发现全中文的命中不了,前后有非中文字符时才能命中。
而且,为什么'[\u4e00-\u9fa5]' 中不需要加转义,加了转义反而报错:无效的正则表达式。
关于正则表达式有相关规范的文档吗?