HIVE中,cluster by有什么意义

1. cluster by 是什么?

      如果想彻底了解:HIVE中,order by、sort by、 distribute by和 cluster by的区别,请查看HIVE中,order by、sort by、 distribute by和 cluster by的区别。网址:https://blog.csdn.net/weixin_42845682/article/details/104953351

2. cluster by有什么意义?

      你应该已经知道了:当distribute by 和 sort by 所指定的字段相同时,即可以使用cluster by。但是,有人禁不住就要问:那cluster by有什么存在意义吗?按照XX字段分区又按照XX字段排序。
      答案是:当分区数量小于字段种类时,就有意义。
       举个例子:
       有一张学生表,全校共有100个专业,但是因为性能问题,分区只能指定5个。这时候,按照专业分区,再按照专业排序就有存在的意义了。
      

后记

       经过和热心网友的讨论,发现对于cluster by的说明确实不怎么清除。于是又写了一篇,专门来解释。
    &

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值