
MR笔记
A阿尔
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
MapReduce练习之二次排序
MapReduce练习之二次排序(所有文章均做为本人笔记使用,可以指点,但是不要喷我,谢谢。) 本次练习的数据为历年世界气候数据,其数据格式为:0010999999999991992010100004-24000-045700FM-13+9999KNFG V02099999999999999999N9999999N9+99999+99999999999ADDAG1200000169999...原创 2018-12-22 22:20:50 · 553 阅读 · 0 评论 -
MapReduce练习之数据的连接
MapReduce练习之数据的连接(所有文章均作为本人笔记使用,可以指点,但是不要喷我,谢谢。)MapReduce的连接分为两种情况:1.Map端连接:数据在进入Map端之前就已经做好了连接;对于Map端连接的多个数据集需要符合以下两个条件: 1.要连接的多个数据集不能再分片;需要被压缩处理; 2.要连接的多个数据集的文件个数要相同;需要对要连接的多个数据集进行预处理,在预处理的过程...原创 2018-12-23 17:42:10 · 469 阅读 · 0 评论