ZeroTeam_麒麟

积少成多　聚沙成塔

apache hive

关注

文章平均质量分 75

关注数：文章数：12 文章阅读量：26896 文章收藏量：12

作者: ZeroTeam_麒麟

谢谢你的瞧不起

展开

专栏收录文章

二.Hive的常用命令

Hive的几种常见的数据导入方式这里介绍四种：（1）、从本地文件系统中导入数据到Hive表；（2）、从HDFS上导入数据到Hive表；（3）、从别的表中查询出相应的数据并导入到Hive表中；（4）、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。一、从本地文件系统中导入数据到Hive表先在Hive里面创建好表，如下：

转载 2016-04-22 11:28:02 · 619 阅读 · 0 评论
hive-1.1.0-cdh5.6.0手册(一）

Hive新手配置环境系统版本下载地址 CentOS 6.5 64x 下载地址 hadoop 2.6.0 下载地址 Hive 1.1.0 下载地址Hive是什么Hive 是基于 Hadoop 构建的一套数据仓库分析系统，它提供了丰富的 SQL 查询方式来分析存储在 Hadoop 分布式文件系统中的数据可以将结构化的数据文件映射为一张数据库

原创 2017-02-23 16:41:42 · 5429 阅读 · 0 评论
Hive 1.1.0 集群安装配置

Hive使用系统CentOS 6.5集群环境组件 version Hadoop 2.6.0 Zookeeper 3.4.6 Hive 1.1.0Hive配置解压这里就不讲解了进入Hive根目录cd /home/hadoop/development/src/hive-1.1.0-cdh5.6.0/ 这里主要需要配置 hive-site.xml

原创 2016-05-23 16:31:05 · 3244 阅读 · 0 评论
Hive本地模式安装及遇到的问题和解决方案

Apache Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的SQL查询功能，可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。Hive有三种运行模式： 1.内嵌模式：将元数据保存在

转载 2016-05-09 18:12:24 · 683 阅读 · 0 评论
sqoop导入导出表/数据到Hive

笔记:将关系型数据库表及表中的数据复制到hive中sqoop import : RMDBS——>hive语法：sqoop import --connect jdbc:mysql://IP:PORT/database --username root --password PWD --table tablename --hive-import --hive-table hivetabl

原创 2016-04-22 15:26:19 · 6145 阅读 · 0 评论
Hive连接MYSQL数据OK,查询出现in thread "Thread-18" java.lang.IllegalArgumentException:Does not contain a vali

Hive连接MYSQL数据OK,查询出现in thread "Thread-18" java.lang.IllegalArgumentException:Does not contain a vali...

原创 2016-04-22 14:37:04 · 906 阅读 · 0 评论
Hive日期格式转换用法

1.日期函数UNIX时间戳转日期函数: from_unixtime语法:from_unixtime(bigint unixtime[, stringformat]) 返回值: string说明: 转化UNIX时间戳（从1970-01-0100:00:00 UTC到指定时间的秒数）到当前时区的时间格式举例：hive> select from_unixtime(1323308943,'

转载 2016-05-03 17:05:05 · 771 阅读 · 0 评论
Sqoop 数据导入到Hive中报错 HIVE_CONF_DIR

解决方法：export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HIVE_HOME/lib/*

原创 2016-05-25 15:36:57 · 3934 阅读 · 0 评论
一.Hive的安装部署

系统Centos　6.5hadoop 2.5.0zookeeper 3.4.5Hive 0.9.0下载解压就不说了①:createDatabaseIfNotExist=true 表示如果该mysql数据库中没有名为"hive"的数据库则创建;进入 hive/conf 目录cd ./hive-0.9.0/conf配置hive-site.xmlcp hiv

原创 2016-04-22 10:37:41 · 557 阅读 · 0 评论
三.Hive数据分析与存储

使用到的数据url：https://yunpan.cn/cPHQjv2zPtreC （提取码：fc50）1.创建测试使用到的数据库，数据字段太多只统计iphive> create table blog(ip STRING) > ROW FORMAT DELIMITED > FIELDS TERMINATED BY '\t' > STORED AS TEXTFI

原创 2016-04-25 16:52:05 · 1474 阅读 · 0 评论
Hive 操作笔记

一.Hive的安装部署http://blog.csdn.net/qq_26840065/article/details/51217956二.Hive的常用命令http://blog.csdn.net/qq_26840065/article/details/51218637三.hive的计算使用到的数据url：https://yunpan.cn/cPHQjv2zPtre

原创 2016-04-25 16:30:32 · 552 阅读 · 0 评论
Hive优化

要点：优化时，把hive sql当做map reduce程序来读，会有意想不到的惊喜。理解hadoop的核心能力，是hive优化的根本。长期观察hadoop处理数据的过程，有几个显著的特征:1.不怕数据多，就怕数据倾斜。2．对jobs数比较多的作业运行效率相对比较低，比如即使有几百行的表，如果多次关联多次汇总，产生十几个jobs，没半小时是跑不完的。map reduce作业初

原创 2017-02-23 16:55:53 · 2589 阅读 · 0 评论