需求
将带有“合并单元格”的 Excel 进行解析,Excel 示例如下:
方案
Java 生态中 Excel 解析库比较多,下面介绍两种比较常用的库
- Apache POI:POI 是用于读写 Microsoft Office 格式文件(如 Excel、Word 和 PowerPoint)的 Java 库。它提供了一组丰富的功能和 API,可用于读取和写入 Excel 文件的各种格式,如 XLS、XLSX 和 CSV 等。
- EasyExcel是阿里巴巴开源的一个基于 Java 的简单、省内存的读写 Excel 的开源项目。EasyExcel 在尽可能节约内存的情况下支持读写百 M 级的 Excel 。EasyExcel 能大大减少占用内存的主要原因是在解析Excel时没有将文件数据一次性全部加载到内存中,而是从磁盘上一行行读取数据,逐个解析。EasyExcel 采用一行一行的解析模式,并将一行的解析结果以观察者的模式通知处理(AnalysisEventListener)。
在本示例中,将使用 POI 来解析 Excel 。需要注意的是 ,POI 对 xls
和 xlsx
格式的 Excel 采用不同的 API ,分别是 org.apache.poi.hssf.usermodel.HSSFWorkbook
和 org.apache.poi.xssf.usermodel.XSSFWorkbook
。
依赖引入
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>4.1.0</version>
</dependency>
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>4.1.0</version>
</dependency>
代码示例
以下示例展示了解析 xls
格式的 Excel 。
package com.xzbd.util;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.List;
import java.util.Objects;
import org.apache.commons.lang.StringUtils;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.ss.usermodel.Cell;
import org