本地读取Excel文件并进行数据压缩传递到服务器

        在项目开发过程中,读取excel文件,可能存在几百或几百万条数据内容,那么对于大型文件来说,我们应该如何思考对于大型文件的读取操作以及性能的注意事项。

 类库:Papa Parse - Powerful CSV Parser for JavaScript

第一步:安装

npm install papaparse

第二步:内容的引入

import Papa from 'papaparse';
import { useState } from "react";

export default function App() {
    const [results,setResults] = useState([]); //保留解析后的数据
    const handleFile = (e) => {
        const file = e.target.files[0];

        Papa.parse(file,{
            header:true, //指定第一行为标题行
            skipEmptyLines:true, //跳过空行
            complete:(parsedResult) => {
                const data = parsedResult.data;
                console.log(data) // 在控制台打印解析后的数据
            }
        })
    };
  return (
    <div>
        <h1>本地读取Excel文件并进行数据压缩传递到服务器</h1>
        <input type="file" onChange={handleFile} accept='.csv' />
    </div>
  )
}

当我们上传的数据为百万条数据的时候,数据量是非常的庞大的,那么如果将数据传输到服务器上,将会对http的请求资源产生极大的浪费。所以我们考虑使用第三方类库pako进行数据的压缩。

对于pako,可以查看以下文章进行一个了解:https://github.com/nodeca/pako

pako是什么以及它的的使用_如何使用pako库-CSDN博客文章浏览阅读62次。ws推送的gzip压缩能减少大量的传输数据,减少传输数据消耗,但是需要在收到数据之后解压。解压就可以用到pako了。_如何使用pako库https://blog.csdn.net/mantou_riji/article/details/135001065

第三步:pako安装

npm install pako

第四步:在组件中进行pako引入且对数据进行gzip的压缩

import pako from "pako";

引入之后,将我们获取到的数据进行gzip的压缩

// gzip压缩
const gzip = pako.gzip(JSON.stringify(data),{to:"string"});
console.log(JSON.stringify(data).length,gzip.length); //打印的则是压缩后的数据信息
//原先的长度为41万,压缩后的长度为4万

且发送到后端(以下是改事件的全部代码,gzip的压缩数据也在其内)

 const handleFile = (e) => {
        const file = e.target.files[0];

        Papa.parse(file,{
            header:true, //指定第一行为标题行
            skipEmptyLines:true, //跳过空行
            complete:async (parsedResult) => {
                const data = parsedResult.data;
                console.log(data) // 在控制台打印解析后的数据
                // gzip压缩
                const gzip = pako.gzip(JSON.stringify(data),{to:"string"});
                console.log(JSON.stringify(data).length,gzip.length); //打印的则是压缩后的数据信息
                const response = await fetch("http://localhost:3000",{
                    method:"POST",
                    body:gzip,
                    headers:{
                        "Content-Type":"application/octet-stream", //数据流的方式进行上传处理
                    }
                });
                console.log(response)
            }
        })
    };

第五步:后端,后端也需要下载pako进行解压缩处理

const express = require("express");
const bodyParser = require("body-parser");
const cors = require("cors");
const pako = require("pako");

const app = express();

// 使用 cors 中间件处理跨域请求
app.use(cors());

// 使用 bodyParser 中间件解析请求体
app.use(bodyParser.raw({ type: "application/octet-stream", limit: "100mb" }));

// 处理 POST 请求
app.post("/", (req, res) => {
  // 获取压缩后的数据
  const compressedData = req.body;

  // 解压缩数据
  const uncompressedData = pako.ungzip(compressedData, { to: "string" });

  // 将解压缩后的数据解析为 JSON 对象
  const jsonData = JSON.parse(uncompressedData);

  // 打印压缩前数据长度,解压缩后数据长度和 JSON 对象长度
  console.log(
    compressedData.length,
    uncompressedData.length,
    jsonData.length
  );

  // 构造响应消息
  const msg =
    compressedData.length +
    " " +
    uncompressedData.length +
    " " +
    jsonData.length;

  // 发送响应
  res.status(200).send(msg);
});

// 启动服务器,监听端口 3000
app.listen(3000, () => {
  console.log("Server started on port 3000");
});

执行以上操作后,我们运行项目选择文件,后端返回三条数据

已压缩的长度   未压缩的长度   最终记录的条数

前端也已经返回了response的一个相应数据

第六步:对打印的response进行进一步的处理 

console.log(response)
const result = {
    success:response.ok.toString(),
    status:response.status,
    message:response.statusText,
};
setResults(result)

第七步:展示到页面上

<h2>结果显示</h2>
<ul>
    {results && 
        Object.keys(results).map((key) => {
            <li key={key}>
                {key}:{results[key]}
            </li>
        })
    }
</ul>

第八步:添加一个点击按钮事件切换背景颜色

const toggleBodyBackground = () => {
    if(document.body.style.background === "red"){
        document.body.style.background = "white";
    }else{
        document.body.style.background = "red"
    }
}

<button onClick={toggleBodyBackground}>change body background</button>

 当我进行大文件读取的时候会造成主线程的阻塞,那么后续我们可以进行功能的强化,在强化过程中,我们可以去考虑,是不是可以对现有的数据进行拆分,如果是一百多万条数据的时候,我们可以将一百多万条数据进行五万条,五万条的切片处理,然后不断的在后端进行压缩后数据的请求处理,最终可以在服务器端进行对数据的操作,减轻服务器的压力。

第九步:是否可以减轻服务器的压力,以下操作可以进行一个测试

使用console.time('test')开始时间设置console.timeEnd("test")结束时间设置

const handleFile = (e) => {
    console.time('test') //开始时间
    const file = e.target.files[0];

    Papa.parse(file,{
           ...............
            };
            setResults(result)
            console.timeEnd("test"); //结束时间
        }
    })
};

当前的测试时间为18秒左右,耗费时常比较久,那么随后我们会对其进行功能优化处理。

此内容已结束,希望对您有所帮助。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/339881.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

漏洞复现-SpringBlade export-user SQL 注入漏洞(附漏洞检测脚本)

免责声明 文章中涉及的漏洞均已修复&#xff0c;敏感信息均已做打码处理&#xff0c;文章仅做经验分享用途&#xff0c;切勿当真&#xff0c;未授权的攻击属于非法行为&#xff01;文章中敏感信息均已做多层打马处理。传播、利用本文章所提供的信息而造成的任何直接或者间接的…

什么是ORM?

ORM&#xff08;Object-Relational Mapping&#xff0c;对象关系映射&#xff09;是一种编程技术&#xff0c;它的目标是实现面向对象编程语言与关系型数据库之间的数据映射和转换。ORM系统允许开发人员使用面向对象的方式来操作数据库&#xff0c;而无需直接编写复杂的SQL查询…

Cesium叠加超图二维服务、三维场景模型

前言 Cesium作为开源的库要加超图的服务则需要适配层去桥接超图与Cesium的数据格式。这个工作iClient系列已经做好&#xff0c;相比用过超图二维的道友们可以理解&#xff1a;要用Openlayer加载超图二维&#xff0c;那就用iClient for Openlayer库去加载&#xff1b;同样的要用…

mac自带录屏

1、打开 快捷键&#xff1a;Shift Command5 可以在指定存储位置 2、结束 快捷键&#xff1a; CommandControlEsc&#xff08;也可以点击顶部工具栏的结束按钮&#xff09;

图像数据增广

目录 一、常用的图像增广方法 1、随机翻转 2、随机裁剪 3、随机颜色变换 二、图像代码实现 1、定义图像显示辅助函数 2、随机翻转 3、随机裁剪 4、随机颜色变换 5、结合多种图像增广方法 三、使用图像增广进行训练 1、下载数据集 2、读取图像并增广 3、多GPU训练 …

麦芯(MachCore)应用开发教程2 --- 时序

黄国强 2024/01/22 正如计算机的本质是状态机一样&#xff0c;设备也是一个状态机。笔者之前文章“什么是时序”用 switch/case 实现了状态机。在麦芯中&#xff0c;我们用Lambda实现了状态机。相对于switch/case&#xff0c;Lambda更优雅&#xff0c;更符合面向对象。先上代码…

单元化(Set)架构设计详解:异地多活、突破扩展上限的优选方案

文章目录 一、单元化架构基础1、扩展性&#xff08;Scalability&#xff09;概述2、扩展性 - 横向扩展&#xff08;Horizontal Scale&#xff09;3、扩展性 - 纵向扩展&#xff08;Vertical Scale&#xff09;4、扩展性 - 扩展魔方5、一致性 - 数据库事务一致性&#xff08;ACI…

【中文版ChatGPT4.0!国内可直接用】

中文版ChatGPT4.0&#xff01;国内可直接用 文心一言微软Copilot迅捷AI写作 在国内使用ChatGPT 4.0可能需要支付每月20美元的费用&#xff0c;约合人民币145元。如果不愿意付费&#xff0c;也可以考虑使用其他免费的AI工具。 目前有许多公司在研发出色的AI大模型&#xff0c;这…

Python进阶-Anaconda使用总结

本文是 Anaconda 的使用总结&#xff0c;旨在帮助用户快速搭建 Python 环境、进行数据科学和机器学习工作。首先&#xff0c;介绍了在 Windows 系统上安装 Anaconda 的步骤&#xff0c;包括下载安装程序、配置环境变量以及验证安装。随后&#xff0c;详细列举了 Anaconda 的常用…

新版AndroidStudio dependencyResolutionManagement出错

在新版AndroidStudio中想像使用4.2版本或者4.3版本的AndroidStudio来构造项目&#xff1f;那下面这些坑我们就需要来避免了&#xff0c;否则会出各种各样的问题。 一.我们先来看看新旧两个版本的不同。 1.jdk版本的不同 新版默认是jdk17 旧版默认是jdk8 所以在新版AndroidSt…

processing集训day03

编程英语 load 加载 image 图像 hawthorn 山楂 true 真 false 假 if 如果 distance 距离 collision 碰 图片显示 显示图片步骤&#xff1a; 1、准备好图片 2、定义图片变量 3、载入图片至变量 4、进行图片显示 Processing 所支持的图片格式有很多&#xff0c;常见的有…

全栈没有那么难!15 分钟搞明白 Express.js

Express 是老牌的 Node.js 框架&#xff0c;以简单和轻量著称&#xff0c;几行代码就可以启动一个 HTTP 服务器。市面上主流的 Node.js 框架&#xff0c;如 Egg.js、Nest.js 等都与 Express 息息相关。 Express 框架使用标准 Node.js 语法&#xff0c;主要由以下 3 个核心部分…

Elasticsearch8使用统一的CA为HTTP层更新证书

官方文档参考&#xff1a; Update certificates with the same CA | Elasticsearch Guide [8.10] | Elastic 使用统一的CA为HTTP层更新证书&#xff0c;包括3部分&#xff1a;在ES集群内某个节点上生成证书&#xff1b;将生成的证书拷贝给集群内其他节点&#xff1b;更新kiban…

大模型相关学习资料整理

1. 核心2框架 1. semantic-kernel【微软】 https://learn.microsoft.com/en-us/semantic-kernel/overview/ 2. LangChain https://www.langchain.asia/ https://python.langchain.com/docs/get_started/introduction 2. 技术点 1. Function Call https://platform.opena…

Dell戴尔XPS 8930笔记本电脑原装Win10系统 恢复出厂预装OEM系统

链接&#xff1a;https://pan.baidu.com/s/1eaTQeX-LnPJwWt3fBJD8lg?pwdajy2 提取码&#xff1a;ajy2 原厂系统自带所有驱动、出厂主题壁纸、系统属性联机支持标志、系统属性专属LOGO标志、Office办公软件、MyDell等预装程序 文件格式&#xff1a;esd/wim/swm 安装方式&am…

11- OpenCV:自定义线性滤波(卷积,卷积边缘)

目录 一、卷积 1、卷积概念 2、卷积如何工作 3、常见算子&#xff08;卷积核 Kenel&#xff09; 4、自定义卷积模糊 5、代码演示 二、卷积边缘 1、卷积边缘问题 2、处理边缘 3、相关的API说明 4、代码演示 一、卷积 1、卷积概念 &#xff08;1&#xff09;在OpenC…

Recommender Systems with Generative Retrieval

TLDR: 本文提出一种新的生成式检索推荐系统范式TIGER。当前基于大规模检索模型的现代推荐系统&#xff0c;一般由两个阶段的流程实现&#xff1a;训练双编码器模型得到在同一空间中query和候选item的embedding&#xff0c;然后通过近似最近邻搜索来检索出给定query的embedding的…

DBA技术栈MongoDB: 数据增改删除

该博文主要介绍mongoDB对文档数据的增加、更新、删除操作。 1.插入数据 以下案例演示了插入单个文档、多个文档、指定_id、指定多个索引以及插入大量文档的情况。在实际使用中&#xff0c;根据需求选择适合的插入方式。 案例1&#xff1a;插入单个文档 db.visitor.insert({…

zxz-uni-data-select插件,表单回显时,无法显示数据,原因是后端返回的数据是字符串,要把这个字符串转成number类型,就能显示了

zxz-uni-data-select插件&#xff0c;uniapp项目&#xff0c;vue3 表单回显时&#xff0c;这个下拉框不能显示数据 解决方法 用Number()方法把字符串转成number string转成number 回显就能显示了

CAM软件行业调研:广泛应用取得越来越大的市场份额

经过多年的推广&#xff0c;CAM技术已经广泛地应用在机械、电子、航天、化工、建筑等行业。近年来&#xff0c;我国CAM技术的开发和应用取得了长足的发展&#xff0c;除对许多国外软件进行了汉化和二次开发以外&#xff0c;还诞生了不少具有自主版权的CAM系统&#xff0c;由于这…