HBase与Hive集成

本文介绍了如何配置Hive与Zookeeper的连接,并通过Hive将数据加载到中间表,然后使用MapReduce将数据导入到与HBase关联的Hive表中,最后检查Hive和HBase表的数据同步情况。操作步骤包括修改hive-site.xml,创建Hive表,加载数据,以及数据导入和验证。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在 hive-site.xml 中添加 zookeeper 的属性,如下

  <property>     
	<name>hive.zookeeper.quorum</name>     
	<value>hadoop100,hadoop101,hadoop102</value> 
  </property> 
  <property>     
	<name>hive.zookeeper.client.port</name>     
	<value>2181</value> 
  </property> 

进入hive
bin/hive

创建表

CREATE TABLE hive_hbase_emp_table(
empno int,ename string, job string, mgr int, hiredate string, sal double,     comm double, deptno int 
) STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,info:ename,info:job,info:mgr,info:hiredate,info:sal,info:co mm,info:deptno") TBLPROPERTIES ("hbase.table.name" = "hbase_emp_table"); 

在 Hive 中创建临时中间表,用于 load 文件中的数据

CREATE TABLE emp(     empno int,     ename string,     job string,     mgr int,     hiredate string,     sal double,     comm double,     deptno int ) row format delimited fields terminated by '\t'; 

向 Hive 中间表中 load 数据 (只是上传)

hive> load data local inpath '/software/emp.txt' into table emp; 

查看表信息

select * from emp; 

可以看到如下就是所上传的数据
在这里插入图片描述
将中间表中的数据导入到 Hive 关联 Hbase 的那张表中(走MR)

hive> insert into table hive_hbase_emp_table select * from emp;

查看 Hive 以及关联的 HBase 表中是否已经成功的同步插入了数据

Hive:

hive> select * from hive_hbase_emp_table; 

HBase:

Hbase> scan 'hbase_emp_table' 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值