Apache Druid架构原理与应用场景

最新推荐文章于 2025-06-15 21:59:14 发布

Allen716

最新推荐文章于 2025-06-15 21:59:14 发布

阅读量3.8k

点赞数

CC 4.0 BY-SA版权

分类专栏：架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wshl1234567/article/details/95592250

Druid是一个分布式时序数据库，适用于交互式聚合查询和实时分析。它由Realtime Node、Historical Node、Broker Node和Coordinator Node组成，依赖于元数据库、分布式协调服务和数据文件存储。数据摄入过程中，Realtime Node生成Segment并上传，Historical Node加载Segment。关键配置如segmentGranularity、queryGranularity、intermediatePersistPeriod和windowPeriod影响数据处理和查询效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Druid本质是一个分布式时序数据库，其设计恰好满足这个场景：

Historical数据存储使用HDFS等成熟的分布式文件系统方案，高可用、水平扩容
Lambda架构，Realtime部分使用LSM-Tree实现，满足流数据的即时查询需求

下面从2方面，整理一下Druid的关键技术点：

Druid架构设计
数据摄入
几个重要配置

当业务中出现以下情况时，Druid 是一个很好的技术方案选择：

需要交互式聚合和快速探究大量数据时；
需要实时查询分析时；
具有大量数据时，如每天数亿事件的新增、每天数 10T 数据的增加；
对数据尤其是大数据进行实时分析时；
需要一个高可用、高容错、高性能数据库时。

一、Druid架构设计

Druid自身包含下面4类节点：

Realtime Node：即时摄入实时数据，生成Segment（LSM-Tree实现与Hbase基本一致，不再赘述）文件。
Historical Node：加载已生成好的数据文件，以供数据查询。
Broker Node：对外提供数据查询服务，并同时从Realtime Node和Historical Node查询数据，合并后返回给调用方。
Coordinator Node：负责Historical Node的数据负载均衡，以及通过Rule管理数据生命周期。

最低0.47元/天解锁文章

新学期VIP享超值加赠

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。