自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

hj0303的博客

大数据从业者随手笔记

  • 博客(4)
  • 收藏
  • 关注

转载 Centos双版本MYsql安装步骤

Centos双版本MYsql mysql安装包下载 安装mysql之前需要做的准备工作详情看这个地址: http://blog.sina.com.cn/s/blog_13128368e0102x537.html 准备:下载cmake安装 1,安装make-3.82.tar.gz(如果系统中没有需要安装) # tar zxvf make-3.82.tar.gz ​ #cd cmake-3.82 # ./configure # make # make install 也可用:yum install mak

2021-02-07 15:44:02 354

原创 迁移mysql源数据路径

迁移mysql源数据 查看当前源数据存放位置 show variables like 'datadir' 返回:/usr/local/mysql/data/ 停止mysql服务 使用命令 # service mysqld status 或者 # service mysql status 命令来查看mysql 的启动状态 如果是 mysqld is stopped 那就说明mysql服务是停止状态, 如果是 mysqld is running 那就说明mysql服务是启动状态 停止mysql服务:

2021-02-07 15:41:33 146

原创 常用数据抽取工具Kettle、Datax、Sqoop、StreamSets

Kettle(传统的ETL工具) 特性:纯Java编写,通过建立资源库可多端访问,直接在windows上进行作业开发,同步资源库,在linux上执行定时任务 优点:可在Windows、linux、Unix上执行;数据抽取高效稳定;子组件spoon有丰富的Steps可以开发复杂业务逻辑场景,方便实现全量、增量同步;可视化界面 缺点:通过定时运行,实时性较差; 组成部分: Spoon:允许使用图形...

2020-03-10 14:18:58 8821 3

原创 Kettle数据同步导出链接hive2几种方法

Kettle A. 优缺点 kettle的优点: 1.可视化界面。一个可视化界面足以成为选择kettle的首要原因。毕竟,可视化意味着更方便人的使用。 2.元数据库。元 数据库 用来保存kettle任务的元信息,方便管理任务,通常叫做资源库( repository )。 3.自带工作流并且支持增量抽取。 4.可以配置成一套逻辑。例如:抽取数据时,目标表不存在则插入,存在则更新,而目标表中存在...

2020-03-10 14:10:35 1135

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除