
大数据
文章平均质量分 91
大数据学习路程
请提交用户昵称
上一世我学java技术,毕业后从事java开发,在公司勤勤恳恳如牛耕作十余年,为公司立下了汗马功劳,可此等牛马终究是迈不过35岁的天殃,我被裁了,我的小美见势离我而去,我因身背各种贷款穷困潦倒,沦落上了街头,最终饿死在桥洞里,而死前我嘴里还呢喃着,“如果能从来,我定要学好大数据”,一睁眼,我重生了,这一世我对天发誓定要学好大数据,把属于我的一切美好生活都夺回来!关注我,看我此世扭转乾坤。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Scala重点(基础、面向对象、高阶函数、集合、模式匹配)
语法格式因为函数是对象,所以函数有类型:(函数参数类型1, 函数参数类型2,...) => 函数返回值类型val 函数名: (函数参数类型1, 函数参数类型2,...) => 函数返回值类型 = (参数名:参数类型, 参数名:参数类型, ...) => {函数体函数的本质就是引用类型,相当于 Java 中 new 出来的实例,所以函数是在堆内存中开辟空间;函数的定义不需要使用 def 关键字,但定义的函数一定要有输入和返回值,没有返回值相当于返回的是 Unit;原创 2025-08-13 17:09:22 · 1000 阅读 · 0 评论 -
Spark运行架构
如果在 Worker 上提交应用,那么Driver 就在 Worker,如果直接在自己的 PC 上提交应用,比如在 IDEA 中使用 val sc = new SparkContext("spark://node01:7077","AppName") 去连接 Master 的话,Driver 就在自己的 PC 上,但是不推荐这样的方式,因为 PC 和 Workers 可能不在一个局域网,Driver 和 Executor 之间的通信会很慢。Spark不具有存储的能力,存储是在HDFS中。原创 2025-08-13 14:20:34 · 680 阅读 · 0 评论 -
Scala模式匹配
需求:定义列表 List(("张三", 18), ("李四", 19), 5, "Scala", (1 to 5).toList) ,根据不同的元素类型。已知一个 List 列表,存储元素为:1, 2, 3, 4, 5, 6, 7, 8, 9, 10。Array(5, x, y) :以 5 开头的数组,长度为 3。Array(x, y, 5) :以 5 结尾的数组,长度为 3。List(5, x, y) :以 5 开头的列表,长度为 3。List(x, y, 5) :以 5 结尾的列表,长度为 3。原创 2025-08-07 17:53:06 · 657 阅读 · 0 评论 -
Scala集合
Scala 同时支持和,因为,所以它也是。:集合内的元素、长度一旦初始化完成就不可再进行更改,任何对集合的改变都将生成一个新的集合。不可变集合都在 scala.collection.immutable 这个包下,使用时无需手动导包。:指的是这个集合本身可以动态改变,且可变集合提供了改变集合内元素的方法。可变集合都在scala.collection.mutable 这个包下,使用时需要手动导包。原创 2025-08-07 10:32:50 · 336 阅读 · 0 评论 -
Scala高级函数
;。分类。原创 2025-08-06 16:13:32 · 407 阅读 · 0 评论 -
重生之我要学HadoopHDFS和HadoopMapReduce
1、客户端将1T的全国百家姓的数据传输到HDFS集群中,这个集群会将原来的数据划分块,2、这些块又会被split切片,切片会产生计算任务MapTask,切片的数量和MapTask的工作区的数量一致。3、KeyValue方式再将Split中的文件进行kv值对应,k表示偏移量,V表示一行数据,用的是map方法的键值对思想。原创 2025-07-24 16:22:25 · 675 阅读 · 0 评论 -
重生之我要学Zookeeper
如今的大型互联网场景,数据量庞大,服务器分散部署,,节点会越来越多,节点故障和网络风险会是常态,那么分区容错是一种解决办法,同时分区容错需要保持数据的一致性,可用性,这就是cap原则。Consistency(一致性)、 Availability(可用性、及时响应)、Partition tolerance(分区容错性),三者不可得兼,就说明一定会舍弃其中的一种特性,因为同时满足两个的时候就会出现互斥情况。原创 2025-07-23 10:00:00 · 836 阅读 · 0 评论 -
重生之我要学Shell
基于linux内核的一个应用程序,类似qq微信等软件,shell可以开机自启,呈现再用户前,可以通过Shell操作linux。在计算机科学中,Shell 俗称壳(用来区别于核),是指“为使用者提供操作界面”的软件,类似于 DOS的 cmd.exe。它接收用户命令,然后调用相应的应用程序我们可以使用Shell进行代码编程。变量、数组、字符串、注释、加减乘除、逻辑运算等概念;if...else 选择结构,case...in 开关语句,for、while、until 循环;原创 2025-07-21 14:22:15 · 630 阅读 · 0 评论 -
重生之我要学Hive
构建在hadoop之上的数据分析工具,没有数据存储能力,只有使用数据的能力,操作数据交互采用sql,元数据存放在Derby或者Mysql上,数据存储在HDFS中,分析数据库底层实现的是MapReduce,执行程序实在Yarn上。原创 2025-08-03 20:52:00 · 1278 阅读 · 0 评论 -
Scala面向对象
在同一个scala文件中,class和object名字一样时,object称为伴生对象,class称为伴生类。他们可以互相访问彼此的private私有属性。原创 2025-08-05 20:37:52 · 763 阅读 · 0 评论 -
重生之我要学linux
将整个项目功能拆分多个独立的服务进行开发,给不同的服务器资源以及ip每个服务都是独立管理开发的面向服务架构和微服务架构作用:将命令放入后台执行,让当前终端可以继续执行其他命令。对比:无:命令在前台运行,占用终端(需手动中断)。有:命令在后台运行,可立即继续使用终端。原创 2025-07-19 11:59:51 · 590 阅读 · 0 评论 -
重生之我要学HBase
Minor Compaction:快速让小文件合并成大文件Major Compaction:清理大文件不必要的数据,释放空间。原创 2025-08-02 17:22:35 · 1151 阅读 · 0 评论 -
Scala基础
语法格式// 因为函数是对象,所以函数有类型:(函数参数类型1, 函数参数类型2,...) => 函数返回值类型val 函数名: (函数参数类型1, 函数参数类型2,...) => 函数返回值类型 = (参数名:参数类型, 参数名:参数类型, ...) => {函数体函数的本质就是引用类型,相当于 Java 中 new 出来的实例,所以函数是在堆内存中开辟空间;函数的定义不需要使用 def 关键字,但定义的函数一定要有输入和返回值,没有返回值相当于返回的是 Unit;原创 2025-08-05 14:37:19 · 998 阅读 · 0 评论