Hive面试问题

最新推荐文章于 2024-06-09 08:07:05 发布

原创最新推荐文章于 2024-06-09 08:07:05 发布 · 960 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#hive

hive 专栏收录该内容

1 篇文章

订阅专栏

本文总结了Hadoop面试中关于Hive的常见问题，包括内部表和外部表的区别，以及如何处理数据库导入Hive时遇到的blob或text字段错误。Hive内部表在删除时会一并删除数据，而外部表只删除元数据，提供了一种更安全的数据管理方式。在数据导入时，Hive遵循读时模式，不会在load时验证数据，只在读取时检查数据字段。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

LD is tigger forever，CG are not brothers forever， throw the pot and shine forever.
Modesty is not false, solid is not naive, treacherous but not deceitful, stay with good people, and stay away from poor people.
talk is cheap, show others the code and KPI， Keep progress，make a better result.
Survive during the day and develop at night。

3.2.你们数据库怎么导入hive 的,有没有出现问题
在导入hive的时候，如果数据库中有blob或者text字段，会报错，解决方案在sqoop笔记中：
外部表和内部表的区别：
Hive创建内部表时，会将数据移动到数据仓库指向的路径。创建外部表时，仅记录数据所在的路径，不对数据的位置做任何改变，在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。这样外部表相对来说更加安全些，数据组织也更加灵活，方便共享源数据。
需要注意的是传统数据库对表数据验证是写时模式，而Hive在load时是不检查数据是否符合schema的，Hive遵循的是读时模式，只有在读的时候Hive才检查解析具体的数据字段。