Apache Kyuubi 快速入门指南

白秦朔Beneficient

于 2025-06-25 09:19:05 发布

阅读量351

点赞数 5

CC 4.0 BY-SA版权

Apache Kyuubi 是一个分布式 SQL 网关，为用户提供统一的 JDBC 接口来访问多种计算引擎（如 Spark、Flink、Trino 等）。本文将详细介绍如何快速搭建 Kyuubi 环境并进行基本操作。

在开始之前，请确保您的系统满足以下基本要求：

下载 Kyuubi 二进制包后，解压缩到目标目录：

tar zxf apache-kyuubi-<version>-bin.tgz

解压后的目录结构包含以下重要部分：

下载并解压 Spark 发行版：

tar zxf spark-<version>-bin-hadoop3.tgz

注意：Kyuubi 目前主要支持 Spark 3.x 系列和 Scala 2.12 版本。

在 conf/ 目录下有两个重要配置文件：

# 设置 Java 路径
echo 'export JAVA_HOME=/path/to/java' >> conf/kyuubi-env.sh

# 设置 Spark 路径
echo 'export SPARK_HOME=/path/to/spark' >> conf/kyuubi-env.sh

使用以下命令启动 Kyuubi 服务：

bin/kyuubi start

启动成功后，可以在日志文件中找到 JDBC 连接 URL，格式如下：

jdbc:kyuubi://localhost:10009/

如需在前台运行（方便调试），可以使用：

bin/kyuubi run

Kyuubi 提供了类似 Hive Beeline 的客户端工具。

bin/kyuubi-beeline -u 'jdbc:kyuubi://localhost:10009/' -n <username>

连接成功后，可以执行各种 SQL 语句：

-- 查看数据库
SHOW DATABASES;

-- 创建表
CREATE TABLE test (id INT, name STRING);

-- 查询数据
SELECT * FROM test;

!quit

Kyuubi 采用智能的引擎管理策略：

bin/kyuubi stop

注意：停止服务后，已启动的引擎可能还会运行一段时间，具体取决于配置的生命周期参数。

通过本指南，您应该已经掌握了 Kyuubi 的基本使用方法。如需了解更多高级功能和配置选项，可以参考官方文档或社区资源。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考