1.基本介绍
日常工作中我们常常会使用到Excel来做一些事情,也常常需要使用代码程序来解析Excel文件,目前来说对于poi、easypoi、easyexcel、jxls的使用已经非常多了,它们都在一些特定情况下很好的去处理Excel文件,但有些时候我们要解析的Excel不是标准的xls、xlsx格式的文件,但是可以使用Excel或WPS正常打开,特别是WPS兼容的特别好,对于一些html、xml的源文件,只要后缀为xls、xlsx格式,它总是直接打开了,在Office Excel中打开时还会有非标准Excel文件打开时的确认提示框。对于那些非标准格式的Excel文件(可能是业余选手用代码生成的,也有可能是使用Excel另存为html、xml等格式,又手工修改为xls的情况),以前我坚决的对这部分文件选择了不处理。
上次在编写一个大范围解析Excel文件的功能时,这种不规范的Excel文件实在是多,所以不得不面对这种问题,经过一番尝试发现自己解析html的方式太复杂了,变化多样,而且还不支持另存为xml的格式的文件,于是也在旁边少年的提醒下尝试着使用了`aspose.cells`的试用版本,它在格式转换、生成Excel时会生成多余的一个Sheet页《Evaluation Warning》,参考如下图所示:
所以最终采用的实现就是用它来转换一下格式,实际上它的格式转换代码使用比较简单,功能强大,支持的文件格式有很多中,常见的有:html、xml、csv等多种,参考如下代码将一段html表格页面表格转换为Excel文件,返回Workbook对象:
public static void main(String[] args) throws Exception {
String html =
"<html>" +
"<head>" +
"<title>https://www.chendd.cn</title>" +
"</head>" +
"<body>" +
"<table>" +
"<tr><td>1</td><td>2</td><td>3</td><td>4</td><td>5</td></tr>" +
"<tr><td>6</td><td>7</td><td>8</td><td>9</td><td>10</td></tr>" +
"</table>" +
"</bod>" +
"</html>";
System.out.println("aspose.cells version:" + CellsHelper.getVersion());
Workbook workbook = new Workbook(new ByteArrayInputStream(html.getBytes()));
//格式另存
workbook.save("output.csv", SaveFormat.CSV);
workbook.save("output.xls", SaveFormat.EXCEL_97_TO_2003);
workbook.save("output.xlsx", SaveFormat.XLSX);
workbook.save("output.pdf", SaveFormat.PDF);
}
格式转换后返回的是`Workbook`对象,它不是poi的API中的`Workbook`,实际上save函数可以传递OutputStream流对象,所以后续的解析可以使用poi的Workbook对象来解析OutputStream流即可。
2.其它说明
(1)`aspose.cells`不是开源免费的使用,有试用版本,试用的结果就是生成了一些《Evaluation Warning》警告;
(2)maven中央仓库 https://mvnrepository.com 中只有8.2.1版本的aspose.cells版本,是2015年的版本;
(3)aspose旗下有许多的产品,都是商业付费版本,常见的还有操作word的,与cells一样不开源,需要商业授权使用,单说cells组件支持不同的开发语言,有Java、C++、.NET等等,除了核心组件外也提供了一个web版本,貌似是用作于浏览器在线版本的Excel处理组件,官方地址:Aspose.Cells | Excel Spreadsheet Processing Java Library;
(4)截至今日2023年10月24,该组件最新 Release 版本为`aspose-cells-23.10.jar`是2023年10月14日发布;
3.旧版使用
(1)最新版本才发布俩礼拜,,网络上也没有找到一些激(破)活(解)版,针对于反编译混淆代码的阅读,难度非常大,期待有大佬的出现;
(2)从gitee上找到了一位大佬的学习实践教程,作者研究了aspose.cells的 20.7 的版本,距离最新版本发布相距 3 年多近 40 个Release版本,可参考:https://gitee.com/evilrule/crack-aspose,有需要旧版的可以移步查阅和实践,确实可以把《Evaluation Warning》警告去除;
(3)仅供学习,不可用于商业用途,给个gitee上项目的
截图说明,防止找不到了,尝试了一下setLicense只触发一次即可,通常可以写一个工具类,把调用逻辑放置在static静态块中即可;
4.新版学习
学习有许多种,除了可以学习组件的API使用外,也可以学习一下 20.7 版本激活大佬的钻研精神,所以在一系列的失败尝试后,最终终于激活 aspose-cells-23.10.jar 成功,以下是学习过程:
(1)参考 20.7 版本大佬使用的 javassist 字节码框架,本站有相关的文章示例,曾经略微学习过该框架;
(2)按照 20.7 版本大佬提供的方向重点关注 `com.aspose.cells.License` 类,里面的方法 isLicenseSet 可以理解为是否设置 License,将其修改为 true;方法 getSubscriptionExpireDate 可以理解为获取过期时间,将其修改为 2099 年;方法 a 可以看到是在转换日期格式,将其修改为当前日期;
(3)由于使用的是`Workbook`对象的工具类,将其中的对象方法 isLicensed 修改为 true;
(4)以上的几种尝试均失败,不过最终的结果是成功的,精简后的改动非常非常的小,完全可以不需要调整 License 类,对于这种最新版本的API尝试只是验证了本篇文章所述的示例,即将 html 代码转换为 csv、xls、xlsx、pdf 四种格式;
(5)本篇文章主要是简单科普一下`aspose.cells`组件的介绍,相关内容请勿用于商业用途,如有带来任何问题,均与本篇文章作者无关(请勿用于商业用途、请勿用于商业用途、请勿用于商业用途);
(6)欢迎在本站留言交流,最后附上代码运行效果图,参考如下:
(激活版精简图)
(原始版精简图)
不开源项目aspose.cells的一些科普欢迎来到陈冬冬的个人经验分享平台https://www.chendd.cn/blog/article/1716713331426598913.html如有任何问题请在上述原文里留言。