Ambari湖仓集成怎么选？Hudi，Iceberg，Paimon

🚧 我的 Ambari 构建之路：打造一体化大数据平台，迈向湖仓时代

过去一年里，我一直在探索如何构建一套真正适配当前数据需求的一体化大数据平台。在这条路上，我选择了 Ambari + Bigtop 作为基础，逐步集成了存储、计算、调度、分析、监控等能力，最终形成了较为完整的大数据生态体系。

然而，当平台初具规模，我也意识到：“数据湖仓一体化”这一块仍是一块关键短板。尤其是在实时场景日益增多、批流融合需求变强的背景下，湖仓格式的选型和落地变得尤为重要。

本文，我将分享目前在 Ambari 上构建了哪些组件，面临什么样的架构瓶颈，以及我为什么开始认真考虑湖仓格式的引入与选型。

借助 Ambari 强大的集群管理与组件运维能力，我目前完成了以下组件集成，覆盖了从数据采集、处理、存储、分析到可视化的完整链路：