环境
- idea2024版本
- mysql8.0以上
- mysql-connect8.0以上
- scala2.12.8
- spark3.4
首先,执行下面命令在Linux中启动MySQL数据库,并完成数据库和表的创建,以及样例数据的录入:
service mysql start
sudo mysql -u root -p
其次创建spark数据库
输入密码后,你就可以进入“mysql>”命令提示符状态,然后就可以输入下面的SQL语句完成数据库和表的创建:
mysql> create database spark;
mysql> use spark;
mysql> create table student (id int(4), name char(20), gender char(4), age int(4));
mysql> insert into student values(1,'Xueqian','F',23);
mysql> insert into student values(2,'Weiliang','M',24);
mysql> select * from student;
上面已经创建好了我们所需要的MySQL数据库和表,下面我们在idea里面编写Spark应用程序连接MySQL数据库并且读写数据。
- 首先,创建maven项目
- 编写pom.xml文件
<?xml version="1.0" encoding="UTF-8"?>
<project>
<groupId>dblab</groupId>
<artifactId>WordCount</artifactId>
<modelVersion>4.0.0</modelVersion>
<name>WordCount</name>
<packaging>jar</packaging>
<version>1.0</version>
<repositories>
<repository>