【消费多实例Kafka千万级数据的案例分析】

最新推荐文章于 2025-08-18 19:47:05 发布

贺公子之数据科学与艺术

最新推荐文章于 2025-08-18 19:47:05 发布

阅读量160

点赞数 9

CC 4.0 BY-SA版权

分类专栏：人工智能文章标签： kafka linq 分布式

贺公子之数据科学与艺术，欢迎关注与点赞、留言，本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/qq_31532979/article/details/150335659

人工智能专栏收录该内容

157 篇文章

订阅专栏

消费多实例Kafka千万级数据的案例分析

高吞吐量场景下消费Kafka消息需要解决分区分配、负载均衡、并行处理等问题。典型案例如电商秒杀系统：10个消费者实例处理100个分区的订单消息，日均处理量超过2000万条，峰值QPS达5万+。关键点在于动态调整消费者数量与分区数的关系，避免分区闲置或消费者争抢。

核心实现方案

消费者组协同机制

Properties props = new Properties();
props.put("bootstrap.servers", "kafka1:9092,kafka2:9092");
props.put("group.id", "high-throughput-group");
props.put("enable.auto.commit", "false");
props.put("max.poll.records", 1000);  // 单次拉取最大消息数
props.put("fetch.max.bytes", 52428800);  // 50MB单次拉取上限

分区再平衡监听器

consumer.subscribe(Collections.singletonList("massive-data-topic"), 
    new ConsumerRebalanceListener() {
        @Override
        public void onPartitionsRevoked(Collection<TopicPartition> partitions) {
            // 提交已处理偏移量
            consumer.commitSync();
        }
        
        @Override
        public void onPartitionsAssigned(Collection<TopicPartition> partitions) {
            // 初始化分区处理状态
            partitions.forEach(tp -> 
                consumer.seek(tp, getStoredOffset(tp)));
        }
    });

并行处理优化

批量消费+异步提交

while (running) {
    ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
    List<CompletableFuture<Void>> futures = new ArrayList<>();
    
    for (ConsumerRecord<String, String> record : records) {
        futures.add(CompletableFuture.runAsync(() -> 
            processRecord(record), processingExecutor));
    }
    
    CompletableFuture.allOf(futures.toArray(new CompletableFuture[0]))
        .thenRun(() -> consumer.commitAsync());
}

背压控制配置

max.poll.interval.ms=300000  // 处理超时阈值
heartbeat.interval.ms=3000   // 心跳检测频率
session.timeout.ms=10000     // 会话超时时间

异常处理机制

消费位移存储

// 使用外部存储记录位移
class OffsetManager {
    public static long getStoredOffset(TopicPartition tp) {
        // 从Redis/DB查询已保存的offset
    }
    
    public static void storeOffset(TopicPartition tp, long offset) {
        // 异步持久化到外部存储
    }
}

死信队列处理

try {
    processRecord(record);
} catch (BusinessException e) {
    deadLetterProducer.send(new ProducerRecord<>(
        "dead-letter-topic",
        record.key(),
        record.value()
    ));
    OffsetManager.storeOffset(
        new TopicPartition(record.topic(), record.partition()),
        record.offset() + 1
    );
}