【用户案例】从湖仓分离到湖仓一体,四川航空基于 SelectDB 的多源数据联邦分析实践

Viewed 50

随着川航大规模数据导入需求增长,数据响应频繁出现卡顿,原 Hadoop + Apache Doris 的数据架构存在着涉及组件多、并发性不足、数据导入受限的痛点。经过综合选型对比,川航选择引入 SelectDB 建设湖仓一体大数据分析引擎,取得了数据导入效率提升 3-6 倍,查询分析性能提升 10-18 倍、实时性提升至 5 秒内等收益。

欢迎阅读原文了解详情:从湖仓分离到湖仓一体,四川航空基于 SelectDB 的多源数据联邦分析实践

1 Answers

原文节选:

SelectDB 凭借湖仓一体特性、丰富导入方式、卓越性能表现及广泛生态支持,有效解决了川航的多项痛点,全面满足其业务需求:

  • 湖仓一体:SelectDB 湖仓一体特性帮助川航简化多组件与多数据源对接,加速数据导入和集成,统一查询网关和入口,优化数据湖仓查询效率。
  • 导入方式丰富:SelectDB 支持 HDFS、Kafka、Spark、Flink、Routine Load、Broker Load 以及 Stream Load 等多种数据导入方式 ,满足川航不同场景需求,且导入性能优异;
  • 高并发性能卓越:面对大数据量与高并发时,SelectDB 能够展现出出色的性能,有效替换 Hive、Spark 提供高效数据查询服务;
  • Join 能力出色:SelectDB 大表 Join 处理表现出色,支持 Broadcast Join、Shuffle Join、Hash Join 等多种分布式 Join 方式,满足了川航广泛存在的跨业务大表数据关联分析需求;
  • 丰富数据生态集成:SelectDB 兼容 Spark、Flink、DataX、SeaTunnel 等计算框架,官方文档提供代码示例,易于工程师使用。