面经整理汇总

最新推荐文章于 2024-10-25 11:56:34 发布

coding-day

最新推荐文章于 2024-10-25 11:56:34 发布

阅读量249

点赞数

CC 4.0 BY-SA版权

分类专栏：个人总结

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_29423387/article/details/118297917

个人总结专栏收录该内容

42 篇文章

订阅专栏

2021.6.28
大数据开发提前岗位
字节
一面
1、自我介绍

2、谈一下项目中有什么难点

3、维度建模如何建确认主题确认粒度确认度量确认事实表确认维度表

4、Hive shuffle 和 spark shuffle的区别

5、Spark 为什么快

6、Spark任务是怎么执行的

7、转化率如何计算

8、缓慢变化维怎么处理

9、Flink 的四大基石都有哪些？

10、Flink状态

11、Flink窗口

12、Flink广播流

13、watermark 的作用是啥？如何保证数据不丢失？
算法：

14.1、两个升序链表合并后仍然升序

14.2、给你两个单词 word1 和 word2，请你计算出将 word1 转换成 word2 所使用的最少操作数。

你可以对一个单词进行如下三种操作：插入一个字符、删除一个字符、替换一个字符

Sql题

15、一个lag解决的问题

16、你有什么要问我的？
二面
1、自我介绍

2、介绍一下你简历中做的第一个项目

3、Hive count(distinct)有几个reduce 海量数据会有什么问题

4、Spark 有什么优化

5、Flink 精确一致怎么保证

6、Flink 实时topN

7、Flink 写入redis怎么保证精确一致

8、Flink流批处理介绍一下

9、事实表分类

10、Spark hive 用过的解决数据倾斜的方案

11、事实表分类

12、累积型快照事实表做法

13、Hdfs读数据流程源码级别（要回答出来 rpc）

14、Hdfs写数据流程源码级别（要回答出来rpc）

15、Mapreduce shffule原理源码级别（要回答出来锁多线程以及缓存写磁盘交换）

16、数仓为什么要分层

17、实时比起来离线要注意啥

18、特征挖掘是怎么做的怎么管理的

算法：

19、给一个字符串检测是否能重新排布字符串让相邻不同

如bba 能改成bab 返回true

aaaac 返回false

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。