
apache hive
文章平均质量分 75
ZeroTeam_麒麟
谢谢你的瞧不起
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
二.Hive的常用命令
Hive的几种常见的数据导入方式这里介绍四种:(1)、从本地文件系统中导入数据到Hive表;(2)、从HDFS上导入数据到Hive表;(3)、从别的表中查询出相应的数据并导入到Hive表中;(4)、在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中。一、从本地文件系统中导入数据到Hive表先在Hive里面创建好表,如下:转载 2016-04-22 11:28:02 · 619 阅读 · 0 评论 -
hive-1.1.0-cdh5.6.0手册(一)
Hive新手配置环境 系统 版本 下载地址 CentOS 6.5 64x 下载地址 hadoop 2.6.0 下载地址 Hive 1.1.0 下载地址Hive是什么Hive 是基于 Hadoop 构建的一套数据仓库分析系统,它提供了丰富的 SQL 查询方式来分析存储在 Hadoop 分布式文件系统中的数据 可以将结构化的数据文件映射为一张数据库原创 2017-02-23 16:41:42 · 5429 阅读 · 0 评论 -
Hive 1.1.0 集群安装配置
Hive使用系统CentOS 6.5集群环境 组件 version Hadoop 2.6.0 Zookeeper 3.4.6 Hive 1.1.0Hive配置 解压这里就不讲解了 进入Hive根目录cd /home/hadoop/development/src/hive-1.1.0-cdh5.6.0/ 这里主要需要配置 hive-site.xml原创 2016-05-23 16:31:05 · 3244 阅读 · 0 评论 -
Hive本地模式安装及遇到的问题和解决方案
Apache Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。Hive有三种运行模式: 1.内嵌模式:将元数据保存在转载 2016-05-09 18:12:24 · 683 阅读 · 0 评论 -
sqoop导入导出表/数据到Hive
笔记:将关系型数据库表及表中的数据复制到hive中sqoop import : RMDBS——>hive语法:sqoop import --connect jdbc:mysql://IP:PORT/database --username root --password PWD --table tablename --hive-import --hive-table hivetabl原创 2016-04-22 15:26:19 · 6145 阅读 · 0 评论 -
Hive连接MYSQL数据OK,查询出现in thread "Thread-18" java.lang.IllegalArgumentException:Does not contain a vali
Hive连接MYSQL数据OK,查询出现in thread "Thread-18" java.lang.IllegalArgumentException:Does not contain a vali...原创 2016-04-22 14:37:04 · 906 阅读 · 0 评论 -
Hive日期格式转换用法
1.日期函数UNIX时间戳转日期函数: from_unixtime语法:from_unixtime(bigint unixtime[, stringformat]) 返回值: string说明: 转化UNIX时间戳(从1970-01-0100:00:00 UTC到指定时间的秒数)到当前时区的时间格式举例:hive> select from_unixtime(1323308943,'转载 2016-05-03 17:05:05 · 771 阅读 · 0 评论 -
Sqoop 数据导入到Hive中报错 HIVE_CONF_DIR
解决方法:export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HIVE_HOME/lib/*原创 2016-05-25 15:36:57 · 3934 阅读 · 0 评论 -
一.Hive的安装部署
系统Centos 6.5hadoop 2.5.0zookeeper 3.4.5Hive 0.9.0下载 解压就不说了①:createDatabaseIfNotExist=true 表示如果该mysql数据库中没有名为"hive"的数据库则创建;进入 hive/conf 目录cd ./hive-0.9.0/conf配置hive-site.xmlcp hiv原创 2016-04-22 10:37:41 · 557 阅读 · 0 评论 -
三.Hive数据分析与存储
使用到的数据url:https://yunpan.cn/cPHQjv2zPtreC (提取码:fc50)1.创建测试使用到的数据库,数据字段太多只统计iphive> create table blog(ip STRING) > ROW FORMAT DELIMITED > FIELDS TERMINATED BY '\t' > STORED AS TEXTFI原创 2016-04-25 16:52:05 · 1474 阅读 · 0 评论 -
Hive 操作笔记
一.Hive的安装部署http://blog.csdn.net/qq_26840065/article/details/51217956二.Hive的常用命令http://blog.csdn.net/qq_26840065/article/details/51218637三.hive的计算 使用到的数据url:https://yunpan.cn/cPHQjv2zPtre原创 2016-04-25 16:30:32 · 552 阅读 · 0 评论 -
Hive优化
要点:优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜。理解hadoop的核心能力,是hive优化的根本。 长期观察hadoop处理数据的过程,有几个显著的特征:1.不怕数据多,就怕数据倾斜。2.对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,没半小时是跑不完的。map reduce作业初原创 2017-02-23 16:55:53 · 2589 阅读 · 0 评论