庖丁解牛:NIO核心概念与机制详解 07 _ 字符集

文章目录

  • Pre
  • 概述
  • 编码/解码
  • 处理文本的正确方式
  • 示例程序
  • Code

在这里插入图片描述


Pre

庖丁解牛:NIO核心概念与机制详解 01

庖丁解牛:NIO核心概念与机制详解 02 _ 缓冲区的细节实现

庖丁解牛:NIO核心概念与机制详解 03 _ 缓冲区分配、包装和分片

庖丁解牛:NIO核心概念与机制详解 04 _ 分散和聚集

庖丁解牛:NIO核心概念与机制详解 05 _ 文件锁定

庖丁解牛:NIO核心概念与机制详解 06 _ 连网和异步 I/O


概述

我们将看一下如何使用 Charsets 处理文本数据

  • 为给定的字符编码创建 Charset
  • 使用该 Charset 解码和编码文本数据

编码/解码

要读和写文本,我们要分别使用 CharsetDecoder 和 CharsetEncoder。将它们称为 编码器 和 解码器


处理文本的正确方式

从一个文件中读取一些文本,并将该文本写入另一个文件。但是它把该数据当作文本数据,并使用 CharBuffer 来将该数句读入一个 CharsetDecoder 中。同样,它使用 CharsetEncoder 来写回该数据。

假设字符以 ISO-8859-1(Latin1) 字符集(这是 ASCII 的标准扩展)的形式储存在磁盘上。尽管我们必须为使用 Unicode 做好准备,但是也必须认识到不同的文件是以不同的格式储存的,而 ASCII 无疑是非常普遍的一种格式

事实上,每种 Java 实现都要求对以下字符编码提供完全的支持:

  • US-ASCII
  • ISO-8859-1
  • UTF-8
  • UTF-16BE
  • UTF-16LE
  • UTF-16

示例程序

在打开相应的文件、将输入数据读入名为 inputDataByteBuffer 之后,我们的程序必须创建 ISO-8859-1 (Latin1) 字符集的一个实例:

Charset latin1 = Charset.forName( "ISO-8859-1" );

然后,创建一个解码器(用于读取)和一个编码器 (用于写入):

CharsetDecoder decoder = latin1.newDecoder();
CharsetEncoder encoder = latin1.newEncoder();

为了将字节数据解码为一组字符,我们把 ByteBuffer 传递给 CharsetDecoder,结果得到一个 CharBuffer

CharBuffer cb = decoder.decode( inputData );

如果想要处理字符,我们可以在程序的此处进行。但是我们只想无改变地将它写回,所以没有什么要做的。

要写回数据,我们必须使用 CharsetEncoder 将它转换回字节:

ByteBuffer outputData = encoder.encode( cb );

在转换完成之后,我们就可以将数据写到文件中了。


Code

import java.io.*;  
import java.nio.*;  
import java.nio.channels.*;  
import java.nio.charset.*;

public class UseCharsets  
{
 public  static void main( String args[] ) throws Exception {  
   // 指定输入文件和输出文件名称  
   String inputFile = "samplein.txt";  
   String outputFile = "sampleout.txt";

   // 创建 RandomAccessFile 对象,用于读取和写入文件  
   RandomAccessFile inf = new RandomAccessFile( inputFile, "r" );  
   RandomAccessFile outf = new RandomAccessFile( outputFile, "rw" );  
   long inputLength = new File( inputFile ).length();

   // 获取 FileChannel 对象  
   FileChannel inc = inf.getChannel();  
   FileChannel outc = outf.getChannel();

   // 将文件内容映射到内存缓冲区  
   MappedByteBuffer inputData =  
     inc.map( FileChannel.MapMode.READ_ONLY, 0, inputLength );

   // 获取 Latin-1 编码解码器  
   Charset latin1 = Charset.forName( "ISO-8859-1" );  
   CharsetDecoder decoder = latin1.newDecoder();  
   CharsetEncoder encoder = latin1.newEncoder();

   // 解码内存缓冲区中的数据  
   CharBuffer cb = decoder.decode( inputData );

   // 在此处处理字符数据

   // 编码处理后的字符缓冲区数据  
   ByteBuffer outputData = encoder.encode( cb );

   // 将编码后的数据写入文件  
   outc.write( outputData );

   // 关闭资源  
   inf.close();  
   outf.close();  
 }  
}

这个程序使用 Java NIO 和字符集处理文件。它将一个文件的内容从拉丁编码(ISO-8859-1)转换为 UTF-8 编码,并将转换后的数据写入另一个文件。
主要步骤如下:

  1. 指定输入文件和输出文件名称。
  2. 创建 RandomAccessFile 对象,用于读取和写入文件。
  3. 将文件内容映射到内存缓冲区。
  4. 获取拉丁 -1 编码解码器。
  5. 解码内存缓冲区中的数据。
  6. 在此处处理字符数据(例如,打印解码后的字符串)。
  7. 编码处理后的字符缓冲区数据。
  8. 将编码后的数据写入文件。
  9. 关闭资源。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/173831.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

点击这里,获取数据治理加速器!

数据管理员:又双叒叕…盘一遍数据,这种工作究竟还要重复多少次?! • 上上个月,发现数据有些问题,我把数据盘了一遍,梳理完数据的关联表才定位到问题; • 上个月,进行数据…

Linux 系列之 在一个文本中查找指定的数据

我 | 在这里 🕵️ 读书 | 长沙 ⭐软件工程 ⭐ 本科 🏠 工作 | 广州 ⭐ Java 全栈开发(软件工程师) 🎃 爱好 | 研究技术、旅游、阅读、运动、喜欢流行歌曲 🏷️ 标签 | 男 自律狂人 目标明确 责任心强 ✈️公…

SO3 与so3 SE3与se3 SIM3

文章目录 1 旋转*叉乘1.1 旋转矩阵的导数1.2 物理意义1.3 实例1.4 角轴与反对称矩阵 2 SO3 与so32.1 so3 2 SO32.2 SO3 2 so3 3 SE3 与se33.1 se3 2 SE3:3.2 SE3 2 se3 4 SIM3 与sim35 Adjoint Map 1 旋转*叉乘 1.1 旋转矩阵的导数 根据旋转矩阵的性质: R R T I …

Python实现WOA智能鲸鱼优化算法优化Catboost分类模型(CatBoostClassifier算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 鲸鱼优化算法 (whale optimization algorithm,WOA)是 2016 年由澳大利亚格里菲斯大学的Mirjalili 等提…

windows11系统如何设置锁屏壁纸

1. 在开始页面里面找到设置 2. 在设置里面找到个性化 3. 按照红色圈出部分操作 个性化锁屏界面 选择 图片 浏览照片 选择一张你觉得好看的图片作为锁屏壁纸 注:如果需要在锁屏后的登录页面显示壁纸 请勾选第三个红圈部分

opencv-图像平滑

高斯平滑 高斯平滑即采用高斯卷积核对图像矩阵进行卷积操作。高斯卷积核是一个近似服从高斯分布的矩阵,随着距离中心点的距离增加,其值变小。这样进行平滑处理时,图像矩阵中锚点处像素值权重大,边缘处像素值权重小。 import cv2 …

工业领域的设备“监测”和“检测”有何区别?

在工业领域中,设备的监测和检测是关键的运维活动,它们在保障设备可靠性和生产效率方面发挥着重要作用。尽管这两个术语经常被人们混为一谈,但它们在含义和应用上存在一些关键区别。 "监测"与"检测"的概念 1. 监测&#…

【每日一题】设计循环队列(C语言)

循环队列是我们可以对队列有更深一步的理解的题目,而且可以进一步加强其他方面的知识(例如对循环数组的取模运算,指针的解引用),是个蛮不错的巩固习题,话不多说,进入正题。 链接在此&#xff1…

【漏洞复现】IP-guard WebServer 存在远程命令执行漏洞

漏洞描述 IP-guard是由溢信科技股份有限公司开发的一款终端安全管理软件,旨在帮助企业保护终端设备安全、数据安全、管理网络使用和简化IT系统管理。 免责声明 技术文章仅供参考,任何个人和组织使用网络应当遵守宪法法律,遵守公共秩序,尊重社会公德,不得利用网络从事危…

Fiddle抓包工具的安装

Fiddle抓包工具的安装 首先进入官网:https://www.telerik.com/download/fiddler/fiddler-everywhere-windows 然后Fiddle为我们提供了很多个版本,其中只有一个版本是免费的,如下图: 成功下载如下图:

requests解决HAR支持问题:引入第三方库提升开发效率

关于HAR支持的问题已关闭。HAR(HTTP Archive)是一种用于存储HTTP请求和响应的标准格式,广泛应用于网络调试和性能优化中。然而,HAR支持的缺失可能会给开发者带来不便,影响其工作效率。 解决方案 为了解决这个问题&…

【图数据库实战】图数据库基本概念

1、图数据库的概念 维基百科图书库的概念: 在计算机科学中,图数据库(英语:graph database,GDB)是一个使用图结构进行语义查询的数据库,它使用节点、边和属性来表示和存储数据。该系统的关键概念…

【vue】ant-design-vue的树结构实现节点增删改查

根据业务需要,实现树结构的节点新增编辑删除功能,主要逻辑是利用树节点的scopedSlots属性对其进行自定义改造,监听悬停事件在节点右侧出现增删改对应图标,点击图标出现弹窗表单对内容进行修改,具体代码如下&#xff1a…

prometheus基本介绍 prometheus和zabbix的区别 grafana可视化工具

一、 promethues概念prometheus介绍promethues的特点prometheus的工作原理prometheus的架构 二、promethues和zabbix的区别三、prometheus安装部署prometheus下载安装prometheus启动浏览器访问查看暴露指标将Prometheus配置为systemd管理 配置node_exporter监控项node_promethe…

GNSS位移监测站系统是什么

WX-WY4G 一、GNSS位移监测站系统的工作原理GNSS位移监测站系统是一种基于导航卫星系统(GNSS)的高精度位移监测技术。它通过接收和处理来自卫星的信号,对地表物体的位置进行精度的实时监测。这个系统具有可靠性的特点,被广泛应用于…

Postgresql常用命令函数

1、string_agg()函数 1.1用法: string_agg(expression, delimiter),参数类型(text, text) or (bytea, bytea),返回类型和参数类型一致,第一个参数是字段名,第二个参数是样式,比如,或者#分隔。 1.2实战: SELECT * FR…

干货|数据资产评估的基本方法和选择方法

作为一项资产,数据应当拥有可计量的实际价值。所谓数据价值评估,即是指通过专业化的数据质量评价和价值评估,对数据进行客观评估,使其成为可计量的资产,并确定其具体的价值。这可以借助各种评估方法和指标,…

股票扩展功能(十)

A-扩展功能 文章目录 A-扩展功能一. 展示最近10天的斋戒信息, 以 PDF进行预览二. 展示最近10天的斋戒信息, 以 data list 进行响应 一. 展示最近10天的斋戒信息, 以 PDF进行预览 接口描述: 接口地址:/StockApi/extFasting/show 请求方式:GET consumes: produce…

2023年中国AI大模型行业发展趋势分析:未来发展将走向通用化和专用化并行[图]

AI大模型是AI预训练大模型的简称,通过在大规模数据上进行预训练,无需大量微调即可支持各种应用,具备多层神经网络结构、高级优化算法和强大计算资源,显著提升了AI的通用性和实用性。 AI大模型特点及意义 资料来源:共研…

动态规划十大经典问题

动态规划十大经典问题 动态规划十大经典问题 数塔取数问题、矩阵取数问题、最大连续子段和、最长递增子序列、最长公共子序列、最长公共子串、最短编辑距离、背包问题、正整数分组、股票买卖问题。 1、数塔取数问题 // 数塔取数问题 public static int dataTowerAccess(int[]…