hive分区——静态分区和动态分区
一、 Hive以及分区简介
- hive
hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载。hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。 - hive分区
hive 为了避免全表查询,从而引进分区,将数据进行划分,减少不必要的查询,从而提高效率。
eg:
二、静态分区
建表语句:
create table users(
userid string,
username string,
sex string
)
partitioned by (year int,month int)
row format delimited fields terminated by ','
location '......';
表结构,字段增加分区字段
ps:静态分区需要手动添加
-- 单个分区创建
alter