自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

csdn问鼎

大数据初学者

  • 博客(411)
  • 资源 (14)
  • 问答 (1)
  • 收藏
  • 关注

原创 clickhouse 物化视图数据查询不稳定分析

分析物化view可能失效的原因

2025-12-19 23:07:05 444

原创 Flink 使用 RocksDB 作为状态后端存储的原因详解

RocksDB 作为 Flink 的状态后端,凭借其大容量支持、增量检查点、堆外存储、高性能 I/O等优势,成为生产环境中处理大状态流作业的首选方案。尽管其访问延迟略高于纯内存方案,但在状态规模、容错能力和资源效率方面具有不可替代的优势。合理配置 RocksDB(内存、磁盘、增量检查点)可显著提升 Flink 作业的稳定性与性能。

2025-10-23 22:41:01 1102

原创 Flink 水印(Watermark)最佳实践指南

Watermark= 当前已处理数据最大事件时间 - 允许的延迟时间作用:告诉Flink "从这个时间点之后的数据都已到达,可以安全触发窗口计算"核心公式"分流先行,水印后置"text源数据↓ 无水印分流(filter)↓ 独立水印窗口计算。

2025-10-23 21:36:41 749

原创 如何正确理解flink 消费kafka时的watermark

摘要:文章分析了Flink中watermark生成的三种场景:1)在source层全量数据生成watermark会导致不同业务流互相污染(如order和click事件);2)通过先filter分流再独立生成watermark可解决污染问题;3)rebalance操作会破坏per-partition watermark的单调递增性,导致watermark不准确。核心结论:watermark生成应尽量靠近数据源且保持分区特性,针对不同业务流需独立处理。(149字)

2025-10-22 22:53:41 415

原创 千字长文分析离奇metaspace oom问题

如何一步步分析离奇Metaspace OOM问题

2025-08-12 23:18:02 396

原创 es 里的Filesystem Cache 理解

主要理解filesystem cache 在es中的应用

2025-05-08 23:30:54 961

原创 记录seatunnel排查重复数据的案例分析

排查kafka 端到端一致性问题

2025-04-21 23:23:30 592

原创 flink jobmanager离奇的heap oom

通过层层分析找出导致flink jobmanager heap oom 内存的记录

2025-04-17 00:51:55 872

原创 flink 增量快照同步文件引用关系和恢复分析

主要介绍flink 理解增量快照 中的一些问题

2025-04-07 23:10:55 1097 1

原创 记录clickhouse记录一次性能优化,从60s到1s

以实例例子演示clickhouse 常用优化手段

2025-04-06 22:35:41 556

原创 clickhouse 查询优化思路

介绍clickhouse 优化方案

2024-12-16 22:14:40 795

原创 clickhouse 使用global in 优化 in查询

理解global in 实现原理

2024-11-26 21:24:45 745

原创 理解clickhouse 里的分区和分片键区别

分区和分片键区别

2024-11-25 23:27:58 584

原创 clickhouse 分片键的重要性

理解分片键在CK表的重要性

2024-11-24 22:50:37 358

原创 理解mybatis 里的mapper 实现原理

理解mapper 实现原理

2024-11-16 22:45:21 440

原创 flink StreamGraph 构造flink任务

手工生成flink 作业有向无环图

2024-11-13 22:42:09 640

原创 geohash 函数缩放导致坐标点漂移问题

GIS 地图聚合相关

2024-11-09 20:46:38 464

原创 大数据计算里的-Runtime Filter

解释运行时过滤的原理

2024-11-03 18:03:29 395 1

原创 大数据计算里的Broadcast Hash Join/Shuffle Hash Join/Sort Merge Join

大数据计算里三种JOIN实现

2024-10-31 23:33:51 399 1

原创 理解UUID 无序性对数据存储的影响

主要讲了会影响页分裂

2024-10-28 22:29:56 286

原创 flink cdc 原理解读

flink cdc 深入理解

2024-10-27 11:30:46 1005

原创 理解JVM里的栈信息

深入理解jvm里的栈

2024-10-16 22:44:39 1212

原创 理解calcite 里的Java CC

JAVA CC 在calcite 的应用

2024-10-11 21:54:56 532

原创 三层b+树估算存储多少行数据

估算三层b+tree 存储数据量

2024-10-10 22:17:44 441

原创 mysql 前缀索引

详细介绍前缀索引的使用场景

2024-10-08 22:23:41 362

原创 常见限流算法总结

总结限流算法

2024-10-08 21:29:46 490

原创 jvm里的metaspace oom 排查问题思路-使用MAT

分析metaspace oom 总量

2024-10-01 21:20:40 739

原创 一文理解mysql 联合索引和各种SQL语句分析

联合索引有两个rule要记一下,1.左到右,中间不能有skip,2.中间是range,后面不能用索引了联合索引的顺序非常重要,即使上面走了索引,也可能效果不好,正确的顺序是根据业务场景把最能区分的列放在前面,按照这样的顺序从左到右。

2024-09-28 22:18:47 494

原创 Flink 结合kafka 实现端到端的一致性原理

实战分析flink 和kafka 实现端到端一致性的各种case

2024-09-25 23:18:49 577

原创 一图快速看懂flink source的设计实现

整体来说多个处理流程是解偶的,这样可以在面对多数据源情况下,能更加的灵活。下面只展示了,主要的一些流程。

2024-09-21 21:50:35 333

原创 flink 为啥使用MemorySegment 来管理内存

flink 内存管理总量

2024-09-21 11:13:48 695

原创 一文速通calcite结合flink理解SQL从文本变成执行计划详细过程

一文速通calcite结合flink理解SQL从文本变成执行计划详细过程

2024-09-15 22:17:33 960 1

原创 redis lua 介绍

介绍了redis lua 脚本语法,和使用场景。还有和spring 结合使用

2024-09-07 11:29:02 854

原创 flink窗口分组数据错乱

flink 窗口,大量迟到元素导致窗口错乱

2024-09-03 22:19:37 607

原创 Elasticsearch 里的父子文档插入和查询

实战es父子文档的使用

2024-09-02 22:56:42 590

原创 flink 实战理解watermark,maxOutOfOrderness,allowedLateness

【代码】flink 实战理解watermark,maxOutOfOrderness,allowedLateness。

2024-08-29 22:33:29 620

原创 大数据计算-SQL优化手段(CBO)-以Flink为例

展示CBO规则是如何在flink SQL里运行的

2024-08-26 22:40:15 706

原创 设计模式-visit模式-在语法树的实践

visit模式在解析语法树场景下的实践

2024-08-21 23:08:52 735

原创 场景分析-库存扣减

库存 扣减多种实现方案分析

2024-08-20 23:16:53 952

原创 大模型在chat bi 场景下的优化思路

通过提示词优化text 转SQL的能力

2024-08-17 21:21:45 658

酒店管理系统源码,课程设计

酒店管理系统的完整代码。涉及到大量的java基础知识.特别适合java课程设计结课作业。

2016-05-02

kafka-manager-2.0.0.2.zip

最新版本kafka-manger源码编译,

2019-06-23

支付宝支付宝即时到账接口

支付宝即时到账,支持java php.

2016-07-04

第三方平台实现个人相册

借用第三方平台实现个人相册

2016-10-25

Hibernate 核心类库

hibernate-release-5.1.0.Final 的核心文件

2016-05-07

json包

使用json必须包

2016-12-28

javax.mail.jar

2016-06-25

spring+mybatis增删改查

spring+mybatis增删改查

2017-04-23

spring mvc jar包

spring mvc 开发jar包

2017-03-09

二维码jar包

快速生成二维码

2016-10-05

junit-4.8.1

Junit 测试jar包

2016-05-07

酒店管理系统

酒店管理系统的完整代码。涉及到大量的java基础知识.特别适合java课程设计结课作业。

2016-05-02

Hibernate 项目图片资料

Hibernate 项目图片资料

2016-05-07

commons-email-1.3.jar_mail.jar_activation.jar

commons-email-1.3.jar_mail.jar_activation.jar

2016-06-22

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除