一、概述
在项目开发中往往需要使用到Excel的导入和导出,导入就是从Excel中导入到DB中,而导出就是从DB中查询数据然后使用POI写到Excel上。
操作Excel目前比较流行的就是Apache POI
和阿里巴巴的easyExcel
!
Excel文件处理的主流技术包括: Apache POI 、 JXL 、 Alibaba EasyExcel 等
POI官网:https://poi.apache.org/
POI官网API:POI-HSSF and POI-XSSF/SXSSF - Java API To Access Microsoft Excel Format Files
POI的Javadocs文档:Apache POI - Javadocs
二、Apache POI
Apache POI 是用 Java 编写的免费开源的跨平台的 Java API , Apache POI 提供 给 Java 程序对 Microsoft Office 格式档案进行读写功能的 API 开源类库。
分别提供对不同格式文件的解析:
- HSSF- 提供读写Microsoft Excel XLS格式档案的功能。
- XSSF- 提供读写Microsoft Excel OOXML XLSX格式档案的功能。
- HWPF- 提供读写Word(97-2003) 的 Java 组件,XWPF是 POI 支持 Word 2007+ 的 Java组件,提供简单文件的读写功能;
- HSLF- 提供读写Microsoft PowerPoint格式档案的功能。
- HDGF - 提供读Microsoft Visio格式档案的功能。
- HPBF - 提供读Microsoft Publisher格式档案的功能。
- HSMF- 提供读Microsoft Outlook格式档案的功能。
截止目前最新的Apache POI 版本是5.2.3
三、解析Excel文件
Excel有两个版本:
- 2003版本和2007版本存在兼容性的问题!03最多只有65536行!07版本最多有1048576行!
- 2003版本的文件名后缀是.xls
- 2007版本的文件后缀名是.xlsx
而解析excel主要有2种方法:HSSF和XSSF
HSSF 用于解析旧版本(*.xls)Excel文件,由于旧版本的Excel文件只能存在65535行数据,所以目前已经不常用。 目前主要采用 XSSF 进行新版本(*.xlsx)Exce文件的解析。
相关对象:工作簿、工作表、行、列 对应的POI当中的对象是Workbook、Sheet、Row、Cell
HSSFWorkbook: 这个实现类是我们早期使用最多的对象,它可以操作Excel2003以前(包含2003)的所有Excel版本。在2003以前Excel的版本后缀还是.xls
缺点: 最多只能导出 65535行,也就是导出的数据函数超过这个数据就会报错;
优点: 一般不会报内存溢出。(因为数据量还不到7w所以内存一般都够用,首先你得明确知道这种方式是将数据先读取到内存中,然后再操作)
XSSFWorkbook: 这个实现类现在在很多公司都可以发现还在使用,它是操作的Excel2003–Excel2007之间的版本,Excel的扩展名是.xlsx
优点: 这种形式的出现是为了突破HSSFWorkbook的65535行局限,是为了