【Apache POI】Java解析Excel文件并处理合并单元格-粘贴即用

同为牛马,点个赞吧!

一、Excel文件样例

image-20240716153916656

二、工具类源码

import org.apache.poi.ss.usermodel.*;
import org.apache.poi.ss.util.CellRangeAddress;
import org.apache.poi.xssf.usermodel.XSSFWorkbookFactory;
import org.springframework.web.multipart.MultipartFile;

import java.io.IOException;
import java.io.InputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * 读取Excel并解析合并单元格,将结果转为Map集合
 */
public class ReadMergeCellExcelUtil {

    /**
     * 读取Excel数据
     *
     * @param file 上传的Excel文件
     * @return 解析后的数据列表
     */
    public static List<Map<String, String>> readExcelToObj(MultipartFile file) {
        List<Map<String, String>> result = new ArrayList<>();
        try (InputStream inputStream = file.getInputStream()) {
            Workbook workbook = XSSFWorkbookFactory.create(inputStream);
            result = readExcel(workbook, 0, 0, 0);
        } catch (IOException e) {
            e.printStackTrace();
        }
        return result;
    }

    /**
     * 读取Excel文件
     *
     * @param workbook      工作簿
     * @param sheetIndex    sheet页下标:从0开始
     * @param startReadLine 开始读取的行:从0开始
     * @param tailLine      去除最后读取的行
     * @return 解析后的数据列表
     */
    private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {
        Sheet sheet = workbook.getSheetAt(sheetIndex);
        FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();
        List<Map<String, String>> result = new ArrayList<>();
        for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {
            Row row = sheet.getRow(i);
            Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);
            result.add(rowData);
        }
        return result;
    }

    /**
     * 解析一行数据
     *
     * @param sheet           工作表
     * @param row             行对象
     * @param formulaEvaluator 公式评估器
     * @return 解析后的行数据
     */
    private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {
        Map<String, String> rowData = new HashMap<>();
        if (row != null) {
            int cellIndex = 0;
            for (Cell cell : row) {
                String cellValue = getCellValue(sheet, cell, formulaEvaluator);
                rowData.put("field" + cellIndex, cellValue);
                cellIndex++;
            }
        }
        return rowData;
    }

    /**
     * 获取单元格的值
     *
     * @param sheet           工作表
     * @param cell            单元格
     * @param formulaEvaluator 公式评估器
     * @return 单元格值
     */
    private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {
        if (cell == null) return "";
        return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())
                ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)
                : getCellStringValue(cell, formulaEvaluator);
    }

    /**
     * 获取合并单元格的值
     *
     * @param sheet           工作表
     * @param row             行号
     * @param column          列号
     * @param formulaEvaluator 公式评估器
     * @return 合并单元格值
     */
    private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {
        for (CellRangeAddress range : sheet.getMergedRegions()) {
            if (range.isInRange(row, column)) {
                Row firstRow = sheet.getRow(range.getFirstRow());
                Cell firstCell = firstRow.getCell(range.getFirstColumn());
                return getCellStringValue(firstCell, formulaEvaluator);
            }
        }
        return "";
    }

    /**
     * 判断单元格是否是合并单元格
     *
     * @param sheet  工作表
     * @param row    行下标
     * @param column 列下标
     * @return 是否是合并单元格
     */
    private static boolean isMergedRegion(Sheet sheet, int row, int column) {
        for (CellRangeAddress range : sheet.getMergedRegions()) {
            if (range.isInRange(row, column)) {
                return true;
            }
        }
        return false;
    }

    /**
     * 获取单元格的字符串值
     *
     * @param cell            单元格
     * @param formulaEvaluator 公式评估器
     * @return 单元格字符串值
     */
    private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {
        switch (cell.getCellType()) {
            case STRING:
                return cell.getStringCellValue();
            case BOOLEAN:
                return String.valueOf(cell.getBooleanCellValue());
            case FORMULA:
                return formulaEvaluator.evaluate(cell).formatAsString();
            case NUMERIC:
                return String.valueOf(cell.getNumericCellValue());
            default:
                return "";
        }
    }

}

三、解析结果

image-20240716154343627

以下内容基本为废话,大可直接忽略!

四、工具类详解及使用方法

在日常牛马中,处理Excel文件是一项常见且重要的任务。Excel文件通常包含丰富的结构化数据,其中合并单元格的处理尤为复杂。本文将介绍一个名为ReadMergeCellExcelUtil的Java工具,帮助您轻松读取并解析Excel文件,处理合并单元格,并将结果转化为易于操作的Map集合。通过本文,您将学会如何使用该工具,以及理解其背后的实现原理。


准备工作

在开始之前,我们需要确保项目中添加了必要的依赖。这里我们主要使用Apache POI库来处理Excel文件。

Maven依赖:

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>5.0.0</version>
</dependency>

工具功能概述

ReadMergeCellExcelUtil工具的核心功能是解析Excel文件并处理合并单元格。它可以读取Excel文件,将每个单元格的内容存储到Map集合中,并正确处理合并单元格的值。典型的应用场景包括从Excel中读取配置数据、解析报表数据等。


代码详细解读
1. 读取Excel数据

方法:readExcelToObj

该方法用于读取上传的Excel文件,并将其内容解析为一个包含多个Map的列表。每个Map表示Excel文件中的一行数据。

public static List<Map<String, String>> readExcelToObj(MultipartFile file) {
    List<Map<String, String>> result = new ArrayList<>();
    try (InputStream inputStream = file.getInputStream()) {
        Workbook workbook = XSSFWorkbookFactory.create(inputStream);
        result = readExcel(workbook, 0, 0, 0);
    } catch (IOException e) {
        e.printStackTrace();
    }
    return result;
}

使用try-with-resources确保输入流在使用后正确关闭。

2. 解析Excel文件

方法:readExcel

该方法从工作簿中获取特定工作表,初始化公式评估器,并循环遍历行以解析每一行的数据。

private static List<Map<String, String>> readExcel(Workbook workbook, int sheetIndex, int startReadLine, int tailLine) {
    Sheet sheet = workbook.getSheetAt(sheetIndex);
    FormulaEvaluator formulaEvaluator = workbook.getCreationHelper().createFormulaEvaluator();
    List<Map<String, String>> result = new ArrayList<>();
    for (int i = startReadLine; i <= sheet.getLastRowNum() - tailLine; i++) {
        Row row = sheet.getRow(i);
        Map<String, String> rowData = parseRow(sheet, row, formulaEvaluator);
        result.add(rowData);
    }
    return result;
}
3. 解析一行数据

方法:parseRow

该方法遍历行中的单元格,并将其值存储到Map中。

private static Map<String, String> parseRow(Sheet sheet, Row row, FormulaEvaluator formulaEvaluator) {
    Map<String, String> rowData = new HashMap<>();
    if (row != null) {
        int cellIndex = 0;
        for (Cell cell : row) {
            String cellValue = getCellValue(sheet, cell, formulaEvaluator);
            rowData.put("field" + cellIndex, cellValue);
            cellIndex++;
        }
    }
    return rowData;
}
4. 获取单元格值

方法:getCellValue

该方法根据单元格类型获取其值,并处理合并单元格。

private static String getCellValue(Sheet sheet, Cell cell, FormulaEvaluator formulaEvaluator) {
    if (cell == null) return "";
    return isMergedRegion(sheet, cell.getRowIndex(), cell.getColumnIndex())
            ? getMergedRegionValue(sheet, cell.getRowIndex(), cell.getColumnIndex(), formulaEvaluator)
            : getCellStringValue(cell, formulaEvaluator);
}
5. 获取合并单元格值

方法:getMergedRegionValue

该方法查找并获取合并单元格的值。

private static String getMergedRegionValue(Sheet sheet, int row, int column, FormulaEvaluator formulaEvaluator) {
    for (CellRangeAddress range : sheet.getMergedRegions()) {
        if (range.isInRange(row, column)) {
            Row firstRow = sheet.getRow(range.getFirstRow());
            Cell firstCell = firstRow.getCell(range.getFirstColumn());
            return getCellStringValue(firstCell, formulaEvaluator);
        }
    }
    return "";
}
6. 判断单元格是否是合并单元格

方法:isMergedRegion

该方法检查指定单元格是否属于合并区域。

private static boolean isMergedRegion(Sheet sheet, int row, int column) {
    for (CellRangeAddress range : sheet.getMergedRegions()) {
        if (range.isInRange(row, column)) {
            return true;
        }
    }
    return false;
}
7. 获取单元格的字符串值

方法:getCellStringValue

该方法根据单元格类型获取字符串值,并评估公式单元格。

private static String getCellStringValue(Cell cell, FormulaEvaluator formulaEvaluator) {
    switch (cell.getCellType()) {
        case STRING:
            return cell.getStringCellValue();
        case BOOLEAN:
            return String.valueOf(cell.getBooleanCellValue());
        case FORMULA:
            return formulaEvaluator.evaluate(cell).formatAsString();
        case NUMERIC:
            return String.valueOf(cell.getNumericCellValue());
        default:
            return "";
    }
}

示例代码

以下是一个完整的示例,展示如何使用ReadMergeCellExcelUtil工具读取并解析Excel文件:

import org.springframework.web.multipart.MultipartFile;
import java.util.List;
import java.util.Map;

public class ExcelParserExample {

    public static void main(String[] args) {
        // 假设有一个MultipartFile类型的Excel文件对象file
        MultipartFile file = ...;

        // 使用工具类解析Excel文件
        List<Map<String, String>> parsedData = ReadMergeCellExcelUtil.readExcelToObj(file);

        // 打印解析结果
        for (Map<String, String> rowData : parsedData) {
            System.out.println(rowData);
        }
    }
}

运行结果将是Excel文件的解析数据,每一行数据以Map的形式存储。


常见问题与解决方案
  1. 空单元格处理:确保在解析单元格时处理空单元格,避免空指针异常。
  2. 大型Excel文件处理:对于大型Excel文件,可以考虑使用流式读取方法,以减少内存消耗。

结论

ReadMergeCellExcelUtil工具提供了一种简单而有效的方式来解析Excel文件并处理合并单元格。通过使用Apache POI库,我们可以轻松处理各种复杂的Excel文件格式。未来,可以考虑进一步优化性能,并添加更多功能,如支持多种文件格式和自定义数据解析规则。

Over!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/802740.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Linux】进程信号 --- 信号产生

&#x1f466;个人主页&#xff1a;Weraphael ✍&#x1f3fb;作者简介&#xff1a;目前正在学习c和算法 ✈️专栏&#xff1a;Linux &#x1f40b; 希望大家多多支持&#xff0c;咱一起进步&#xff01;&#x1f601; 如果文章有啥瑕疵&#xff0c;希望大佬指点一二 如果文章对…

【Android】活动的生命周期与启动模式

【Android】活动的生命周期与启动模式 活动的生命周期 返回栈 返回栈&#xff08;Back Stack&#xff09;是Android操作系统中用于管理用户在应用中导航历史的一种数据结构。它允许用户通过按下硬件返回键或调用系统返回功能来回到之前的操作步骤。以下是返回栈的一些关键特…

R与机器学习系列|15.可解释的机器学习算法(Interpretable Machine Learning)(中)

在上次推文中我们介绍了几种可解释机器学习算法的常见方法&#xff0c;包括置换特征重要性、偏依赖图和个体条件期望及其实现。本次我们将继续介绍其他的用来解释机器学习算法的方法。 1.特征交互&#xff08;Feature interactions&#xff09; 1.1介绍 在机器学习中&#xff0…

SpringCache介绍

SpringCache是Spring提供的缓存框架。提供了基于注解的缓存功能。 SpringCache提供了一层抽象&#xff0c;底层可以切换不同的缓存实现&#xff08;只需要导入不同的Jar包即可&#xff09;&#xff0c;如EHCache&#xff0c;Caffeine&#xff0c;Redis。 2个重要依赖已经导入&a…

肿瘤微生态研究利器——5R 16S rDNA测序

肿瘤微生物组&#xff08;Tumor Microbiome&#xff09;是肿瘤微环境中不可或缺的成员&#xff0c;肿瘤内微生物群通过多种机制影响肿瘤发展&#xff0c;在不同类型的肿瘤中&#xff0c;肿瘤内微生物群的组成和丰度具有高度异质性。由于它们的低生物量和其他障碍&#xff0c;全…

Web常见漏洞之po解

暴力破解 概述应用场景实验工具实训准备实训开始四种模式 验证码绕过前端验证码验证码有存活周期 概述 暴力破解是Web漏洞里常见的一种渗透方式&#xff0c;攻击者会试图通过尝试各种可能的用户名和密码组合来猜测密码或密钥&#xff0c;直到猜对为止123。攻击者会经常使用自动…

使用base64通用文件上传

编写一个上传文件的组件 tuku,点击图片上传后使用FileReader异步读取文件的内容&#xff0c;读取完成后获得文件名和base64码&#xff0c;调用后端uploadApi,传入姓名和base64文件信息&#xff0c;后端存入nginx中&#xff0c;用于访问 tuku.ts组件代码&#xff1a; <templa…

win10删除鼠标右键选项

鼠标右键菜单时&#xff0c;发现里面的选项特别多&#xff0c;找一下属性&#xff0c;半天找不到。删除一些不常用的选项&#xff0c;让右键菜单变得干净整洁。 1、按下键盘上的“winR”组合按键&#xff0c;调出“运行”对话框&#xff0c;输入“regedit”命令&#xff0c;点击…

mybatisPlus和mybatis的版本冲突问题、若依换成MP、解决git无法推送、使用若依框架的swagger、以后再遇到团队项目应该怎么做。

20240716 一. mybatisPlus和mybatis的版本冲突问题1. 使用前的准备2. 我遇到了一个很严重的问题。3. 解决问题&#xff0c;好吧也没解决&#xff0c;发现问题&#xff01;&#xff01; 二、该死的git&#xff01;&#xff01;&#xff01;&#xff01;1. 解决无法在idea中使用g…

2.RabbitMQ相关概念

介绍 RabbitMQ是一个消息中间件&#xff0c;接受并转发消息。它接收、存储和转发消息数据。 四大核心概念&#xff1a; 1.生产者 产生数据发送消息的程序是生产者。 2.消费者 3.队列 每一个队列对应一个消费者。 如果两个消费者对应同一个队列&#xff0c;那么队列中的…

R绘制Venn图及其变换

我自己在用R做各种分析时有不少需要反复用到的基础功能&#xff0c;比如一些简单的统计呀&#xff0c;画一些简单的图等等&#xff0c;虽说具体实现的代码也不麻烦&#xff0c;但还是不太想每次用的时候去找之前的代码。 索性将常用的各种函数整成了一个包&#xff1a;pcutils…

深度刨析程序中的指针

前面我们已经学习过了指针的一下性质&#xff1a; 指针就是个变量&#xff0c;用来存放地址&#xff0c;地址唯一标识的一块内存空间指针的大小是固定的4/8个字节&#xff08;32位平台/64位平台&#xff09;指针是有类型&#xff0c;指针的类型决定了指针的加减整数的步长&…

Pr 2024下载安装,Adobe Premiere pro2024剪辑软件下载合集获取

Premiere Pro 2023中文版简称Pr&#xff0c;pr2023是一款视频编辑软件。 pr 2023不仅可以帮助用户对各种视频进行剪辑、旋转、分割、合并、字幕添加、背景音乐等基础的处理&#xff0c;还能帮助用户进行视频颜色校正、颜色分级、稳定镜头、调整层、更改片段的持续时间和速度、效…

进程通信(3): System V IPC

System IPC包括System V消息队列&#xff0c;System V信号量&#xff0c;System V共享内存区。 System V IPC使用一个key&#xff08;key_t&#xff09;作为他们名字&#xff0c;这个值由ftok函数通过路径名和一个id生成。 客户和服务器通过在路径名和id达成一致&#xff0c;双…

SpringCloud教程 | 第十篇: 读取Nacos的配置(失败情况2)

参考&#xff1a;SpringCloud搭建Nacos配置中心_springcloud nacos maven-CSDN博客 解决了pom.xml的依赖冲突后&#xff0c;在启动服务时&#xff0c;报错了&#xff0c;并且自动停止了。 2024-07-17 11:13:03.597 ERROR [com.alibaba.nacos.client.remote.worker] com.alibab…

在 Windows 平台搭建 MQTT 服务

一、引言 出于稳定性、可靠性、成本等多方面的考虑&#xff0c;众多 MQTT 服务实现更倾向于选择拥有丰富开源生态系统的 Linux 环境&#xff0c;Windows 平台上可选的 MQTT 服务相对有限。NanoMQ 是用于物联网边缘的超轻量级 MQTT 消息服务器&#xff0c;有着强大的跨平台和可…

超详细信息收集篇

1 域名信息收集 1.1 域名是什么 域名&#xff08;英语&#xff1a;Domain Name&#xff09;&#xff0c;又称网域&#xff0c;是由一串用点分隔的名字组成的 Internet 上某一台 计算机 或计算机组的名称&#xff0c;用于在数据传输时对计算机的定位标识&#xff08;有时也指地…

监控系统怎样做?

监控类型自底向上分为资源监控、服务监控和业务监控。希望打造公司级的监控系统最好的时机是系统规划时&#xff0c;如果把监控设计往后放&#xff0c;将会面临一个巨大的难题&#xff1a;推行和现有不兼容的规范。 三种监控类型 资源监控 这个相对简单&#xff0c;随着k8s的兴…

【深度学习】BeautyGAN: 美妆,化妆,人脸美妆

https://www.sysu-hcp.net/userfiles/files/2021/03/01/3327b564380f20c9.pdf 【深度学习】BeautyGAN: Instance-level Facial Makeup Transfer with Deep Generative Adversarial Network BeautyGAN: Instance-level Facial Makeup Transfer with Deep Generative Adversaria…

嵌入式物联网在教育行业的应用——案例分析

作者主页: 知孤云出岫 嵌入式物联网在教育行业的应用——案例分析 目录 作者主页:嵌入式物联网在教育行业的应用——案例分析一、引言二、智能教室&#xff1a;环境监测系统1. 硬件需求2. 电路连接3. 代码实现 三、个性化学习&#xff1a;智能学习平台1. 数据处理与分析2. 代…