版本:2.0.3
背景:业务通过stream load对Doris unique表进行数据导入,更新数据条数约3700条,导入开启攒批模式
问题描述:有个导入事务,在分发版本时候一直失败,且一直重试,导致分发版本动作重复16W+次,从而导致同表的导入事务延迟
影响时间:9:14-9:50
事务飙升截图:
版本分发失败截图:
事务执行信息截图:
提问:
1、publish version一直失败有没有相关针对性的告警指标?
2、publish version失败的通常原因主要有哪些?磁盘IO?网络IO?机器负载?
3、除了手动取消该事务操作外,还有没有其他优雅的方法来处理该类问题?