个人大数据总结之hive(二)--------表类型简介

本文介绍了Hive中的表类型,包括内部表和外部表的区别,以及分区表和分桶表的概念与优势。内部表在删除时数据会一同删除,而外部表则不会。分区有助于提升查询效率,分桶进一步优化数据分布。最后,文章提及了数据的加载和导出方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前面两篇文章我已经对hive的基本定义、安装以及简单实用做了一个详细的介绍,今天我就对hive中表的类型在做一个简单介绍,希望各位看官满意~

一、hive中表的分类

      hive中的表可以分为外部表和内部表。

(1)内部表(MANAGED_TABLE,又被称为管理表、受控表)

  它指的是表中数据受到了表定义的影响,在删除表的定义时,表中的数据也会随之被删除。  

  创建内部表(就是普通的建表语句):

    hive> create table fz
    > (id int,name string,age int,tel string)
    > ROW FORMAT DELIMITED
    > FIELDS TERMINATED BY ',';

(2)外部表(EXTERNAL_TABLE)

  它指的是表中数据不受表定义的影响,当删除表结构时,表中的数据并不会被删除。它其实相当于java中的引用。

  外部表相对于内部表来说,有两大好处:

  ①可以提高数据安全,在删除表时,并不会对数据造成影响。

  ②操作共享数据。

  创建外部表(使用关键字external ):

create external table t8_external_1 (id int)  location '/input/hive';

在创建表的时候,要指定数据所在的目录,注意:此处是目录,而不是文件

或者直接使用:alter table t8_external set location '/inp
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值