日撸 Java 三百行day28-30

文章目录

  • 说明
  • day28-30 Huffman 编码 (节点定义与文件读取)
    • 1.建树过程(以图为例)
    • 2.哈夫曼树特点
    • 3.分析代码过程
      • 3.1 抽象成员变量
      • 3.2结合文章梳理思路
        • 1.读文本
        • 2.解析文本内容:
        • 3.建树
        • 4.生成哈夫曼编码
        • 5.编码
        • 6.解码
    • 4.其他
      • 4.1 java 类型强转
      • 4.2 java异常处理

说明

闵老师的文章链接: 日撸 Java 三百行(总述)_minfanphd的博客-CSDN博客
自己也把手敲的代码放在了github上维护:https://github.com/fulisha-ok/sampledata

day28-30 Huffman 编码 (节点定义与文件读取)

1.建树过程(以图为例)

step1: 权重1,2,3,4 ;选取权重最小的两个节点1,2 作为左右节点,已建一棵树(也可以看作一个大节点),

step2: 权重1,2,3,4,(3),选取权重最小的两个节点3,3 建树

step3:权重 1,2,3,4,(3),(6) 选取权重最小的两个节点4,6 建树 当节点已经完了,建树完毕。在这里插入图片描述

2.哈夫曼树特点

  • n个叶子结点的哈夫曼树共有2n-1个结点
  • 每一个字符都对应的是叶子节点
  • 左右子树交换后仍是哈夫曼树
  • 结点的度只有0或2

3.分析代码过程

3.1 抽象成员变量

结合上面手动建树过程,抽象哈夫曼树节点的成员变量:节点字符,权重,左右孩子节点,双亲节点。
正如闵老师在文章所说,可以将起抽象为一个结点类,在这个Huffman类中引入结点类即可使用。

    /**
     * An inner class for Huffman nodes.
     */
    class HuffmanNode {
        /**
         * The char. Only valid for leaf nodes.
         */
        char character;

        /**
         * Weight. It can also be double.
         */
        int weight;

        /**
         * The left child.
         */
        HuffmanNode leftChild;

        /**
         * The right child.
         */
        HuffmanNode rightChild;

        /**
         * The parent. It helps constructing the Huffman code of each character.
         */
        HuffmanNode parent;

        /**
         * The first constructor
         */
        public HuffmanNode(char paraCharacter, int paraWeight, HuffmanNode paraLeftChild,
                           HuffmanNode paraRightChild, HuffmanNode paraParent) {
            character = paraCharacter;
            weight = paraWeight;
            leftChild = paraLeftChild;
            rightChild = paraRightChild;
            parent = paraParent;
        }

    }

3.2结合文章梳理思路

以前仅限于在课本上手动构造哈夫曼树,现在要把他转换为代码,刚开始还是有难度,但是仔细去读代码,分析,对自己的思维有很大的提升

1.读文本

给一串文本(文本内容仅只含ASCII码上的),读文本内容返回字符串内容。

 /**
     * Read text
     * @param paraFilename  The text filename.
     */
    public void readText(String paraFilename){
        try {
            inputText = Files.newBufferedReader(Paths.get(paraFilename), StandardCharsets.UTF_8)
                    .lines().collect(Collectors.joining("\n"));
        } catch (Exception ee) {
            System.out.println(ee);
            System.exit(0);
        }

        System.out.println("The text is:\r\n" + inputText);
    }

2.解析文本内容:

  • 分析
    获取字符串内容,解析字符串并利用数组来存储,即包括字符存储,字符对应的权重(字符出现的个数),而要存储这两类值,借助了一个辅助数组(长度是ASCII码总个数,因为ASCII码十进制是从0开始的,所以就可以一一对应字符即强转)遍历数组,将对应的字符出现的个数存储到这个辅助数组下,这样即可以知道有那些字符(索引值),又可以知道字符的权重(数组本身值)。结合这个辅助数组即可对字符存储和字符对应权重的数组赋值了。(这里借助了一个辅助数组来解析文本,在思考是否可以用Map键值对来实现。键可以存放字符也可以存放字符的ASCII码值,而值存放相应字符出现的次数)我认为对哈夫曼树中最关键的就是这一步,解析文本内容。如tempCharCounts这个辅助数组,如果他的值没有弄好就会导致后面一系列的操作会出现问题。

  • 代码

 public void constructAlphabet(){
        //initialize
        Arrays.fill(charMapping, -1);

        // The count for each char. At most NUM_CHARS chars.
        int[] tempCharCounts = new int[NUM_CHARS];

        //The index of the char in the ASCII charset
        int tempCharIndex;

        char tempChar;
        for (int i = 0; i < inputText.length(); i++){
            tempChar = inputText.charAt(i);
            tempCharIndex = (int)tempChar;

            System.out.print("" + tempCharIndex + " ");
            tempCharCounts[tempCharIndex]++;
        }

        // Step 2. Scan to determine the size of the alphabet
        alphabetLength = 0;
        for (int i = 0; i < 255; i++){
            if (tempCharCounts[i] > 0){
                alphabetLength++;
            }
        }

        //step3. Compress to the alphabet
        alphabet = new char[alphabetLength];
        charCounts = new int[2 * alphabetLength - 1];

        int tempCounter = 0;
        for (int i = 0; i < NUM_CHARS; i++) {
            if (tempCharCounts[i] > 0) {
                alphabet[tempCounter] = (char) i;
                charCounts[tempCounter] = tempCharCounts[i];
                charMapping[i] = tempCounter;
                tempCounter++;
            }
        }

        System.out.println("The alphabet is: " + Arrays.toString(alphabet));
        System.out.println("Their counts are: " + Arrays.toString(charCounts));
        System.out.println("The char mappings are: " + Arrays.toString(charMapping));

    }

在这里插入图片描述

3.建树

在解析文本内容后我们得到的以下两个数组是就建树的关键。其中通过两组循环来找最数组中权重最小的左右两个结点,自底向上建哈夫曼树。这里借助了boolean类型的tempProcessed数组来标记结点是否已经被选过。循环的开始和结束位置需要留意以下。通过我们手动建树过程也知道。
1.找一个最小结点作为左子树
2.找一个第二小结点作为右子树
3.两个结点相加的值形成一个新结点,又参与建树过程

    /**
     * Construct the tree.
     */
    public void constructTree(){
        // Step 1. Allocate space.
        nodes = new HuffmanNode[alphabetLength * 2 - 1];
        boolean[] tempProcessed = new boolean[alphabetLength * 2 - 1];

        // Step 2. Initialize leaves.
        for (int i = 0; i < alphabetLength; i++) {
            nodes[i] = new HuffmanNode(alphabet[i], charCounts[i], null, null, null);
        }

        // Step 3. Construct the tree.
        int tempLeft, tempRight, tempMinimal;
        for (int i = alphabetLength; i < 2 * alphabetLength - 1; i++) {
            // Step 3.1 Select the first minimal as the left child.
            tempLeft = -1;
            tempMinimal = Integer.MAX_VALUE;
            for (int j = 0; j < i; j++) {
                if (tempProcessed[j]) {
                    continue;
                }

                if (tempMinimal > charCounts[j]) {
                    tempMinimal = charCounts[j];
                    tempLeft = j;
                }
            }
            tempProcessed[tempLeft] = true;

            // Step 3.2 Select the second minimal as the right child.
            tempRight = -1;
            tempMinimal = Integer.MAX_VALUE;
            for (int j = 0; j < i; j++) {
                if (tempProcessed[j]) {
                    continue;
                }

                if (tempMinimal > charCounts[j]) {
                    tempMinimal = charCounts[j];
                    tempRight = j;
                }
            }
            tempProcessed[tempRight] = true;
            System.out.println("Selecting " + tempLeft + " and " + tempRight + "========== the value:" + charCounts[tempLeft] + " and " + charCounts[tempRight]);

            // Step 3.3 Construct the new node.
            charCounts[i] = charCounts[tempLeft] + charCounts[tempRight];
            nodes[i] = new HuffmanNode('*', charCounts[i], nodes[tempLeft], nodes[tempRight], null);

            // Step 3.4 Link with children.
            nodes[tempLeft].parent = nodes[i];
            nodes[tempRight].parent = nodes[i];
            System.out.println("The children of " + i + " are " + tempLeft + " and " + tempRight+ "========== the value:" + charCounts[i] +" are "  + charCounts[tempLeft] + " and " + charCounts[tempRight]);
        }
        System.out.println("Their counts are: " + Arrays.toString(charCounts));
    }

在这里插入图片描述

4.生成哈夫曼编码

建树成功后,要对叶子节点上的每一个字符进行编码(左0右1)来产生编码,并存在一个字符数组中。在生成哈夫曼编码,利用了一个双重循环,外层循环是循环需要编码的字符个数,内层循环是对每一个字符从底向上去判断他的双亲进行编码(通过双亲结点向上),则打印的时候就是以我们正常的从上向下读的编码.
例如:
我们以a为例,

  • 判断a结点是否有双亲结点,有9,则判断9右孩子为a,则编码拼接tempCharCode = 1
  • 再往上走,9的双亲结点为15,15的右孩子为9,则拼接tempCharCode = 11
  • 再走没有双亲跳出循环
    在这里插入图片描述
    在这里插入图片描述

5.编码

输入字符串,结合生成的哈夫曼编码的字符串数组 拼接成字符串即可

    /**
     * Encode the given string.
     * @param paraString
     * @return
     */
    public String coding(String paraString) {
        String resultCodeString = "";
        int tempIndex;
        for (int i = 0; i < paraString.length(); i++) {
            // From the original char to the location in the alphabet.
            tempIndex = charMapping[(int) paraString.charAt(i)];

            // From the location in the alphabet to the code.
            resultCodeString += huffmanCodes[tempIndex];
        }
        return resultCodeString;
    }

我输入的测试是:hdashuhaasahssa
在这里插入图片描述

6.解码

输入编码字符串,在解码的时候 我们就要从根开始去循环字符串编码,遇到0就往左子树走,遇到1就往右子树走,直到遇到的结点左子树为null(根据哈夫曼树的特点,哈夫曼树的度只能为0或2,只要左子树为null,右子树一定为null,故不用判断右子树),说明第一个字符的编码走完(在哈夫曼树中,字符结都在叶子结点上),又重新回到根节点走下一个字符的编码。
还是以这张图为例,给的字符串编码为01000111001001011111101101101011

  • 15为根结点,读入编码0 ,跳转到根结点的左子树的根结点6
  • 结点6的左孩子不为空,则继续判断第二个编码 1,则1跳到右子树,根结点为4
  • 4 的左孩子为空(则右孩子也为空),则输出对应结点的字符h
  • 然后又将结点跳到根结点15 继续接下来编码的判断

在这里插入图片描述

    /**
     *  Decode the given string.
     * @param paraString  The given string.
     * @return
     */
    public String decoding(String paraString){
        String resultCodeString = "";
        HuffmanNode tempNode = getRoot();

        for (int i = 0; i < paraString.length(); i++) {
            if (paraString.charAt(i) == '0') {
                tempNode = tempNode.leftChild;
                System.out.println(tempNode);
            } else {
                tempNode = tempNode.rightChild;
                System.out.println(tempNode);
            }

            if (tempNode.leftChild == null) {
                System.out.println("Decode one:" + tempNode.character);
                // Decode one char.
                resultCodeString += tempNode.character;

                // Return to the root.
                tempNode = getRoot();
            }
        }
        return resultCodeString;
    }

4.其他

4.1 java 类型强转

char类型转int:在char类型字符运行时实际上底层还是会转换为ASCII表中对应的整数,所以char类型可以转为int型。
(1)在java中,将char类型转为int,则他返回的值是给定的ASCII码值,如代码中
在这里插入图片描述

4.2 java异常处理

在本次文章中,读文本用到了异常处理,在java中会经常用到异常处理

  • try-catch
    将可能会发生异常的代码放在try中,如果发生异常可以通过catch去捕获,再对异常进行处理
  • try-catch-finally
    finally是必须要执行的代码,即无论代码是否正常还是错误都会执行这个里面的代码,在一些需要文件读入读出时就会加上finally,来确保关闭文件的输入输出流等。
try {
  // 可能会抛出异常的代码
} catch (type1 e) {
  // 处理 type1  异常的代码
} catch (type2 e) {
  // 处理 type2 异常的代码
} finally {
  // 在 try 或 catch 块中抛出异常后执行的代码
}

  • throw直接抛出异常
    这个异常的抛出主要是在方法中进行手动抛出, 可以结合try-catch一起使用
  • throws抛出异常
    这个一般是放在方法的声明上,对可能出现的异常进行抛出
/**
     * Read text
     * @param paraFilename  The text filename.
     */
    public void readText(String paraFilename){
        try {
            inputText = Files.newBufferedReader(Paths.get(paraFilename), StandardCharsets.UTF_8)
                    .lines().collect(Collectors.joining("\n"));
        } catch (Exception ee) {
            System.out.println(ee);
            System.exit(0);
        }

        System.out.println("The text is:\r\n" + inputText);
    }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/10035.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

linux线程调度策略

系统中既有分时调度&#xff0c;又有时间片轮转调度和先进先出调度 学习这个主要为了在linux多线程中&#xff0c;解决几条指令间延时在1-2ms内&#xff1b; 1.比如之前处理过&#xff1a;给一个板子发送一个can指令&#xff0c;接着需要给另外一个模块发送移动指令&#xff0c…

用ChatGPT怎么赚钱?普通人用这5个方法也能赚到生活费

ChatGPT在互联网火得一塌糊涂&#xff0c;因为它可以帮很多人解决问题。比如&#xff1a;帮编辑人员写文章&#xff0c;还可以替代程序员写代码&#xff0c;帮策划人员写文案策划等等。ChatGPT这么厉害&#xff0c;能否用它来赚钱呢&#xff1f;今天和大家分享用ChatGPT赚钱的5…

关键词数据分析-搜索词和关键词分析工具

要搜索热门关键词获取&#xff0c;可以采用以下几种方法&#xff1a; 使用百度指数&#xff1a;百度指数是一个实用的工具&#xff0c;可用于查看关键词的热度趋势、搜索量等数据。在百度指数中&#xff0c;您可以输入您要搜索的关键词&#xff0c;并查看近期的相关数据。这可以…

短视频矩阵怎么玩?抖音短视频矩阵运营详细攻略!

短视频矩阵的工作包括确定目标受众和平台、制定短视频内容策、短视频制作与发布&#xff0c;私信评论维护&#xff0c;短视频数据分析等。传统短视频矩阵需要大量的人力物力&#xff0c;操作起来比较复杂&#xff0c;使用短视频矩阵工具则可以提供极大的便利。      1、确定…

Vue项目中关于全局css的处理

Vue项目中关于全局css的处理步骤一&#xff1a;定义声明全局CSS的样式文件(common.scss)步骤二&#xff1a;挂载到全局封装一&#xff1a;对common.scss拆分封装二&#xff1a;新建index.scss&#xff0c;对elementPlus或者element-ui样式进行覆盖封装三&#xff1a;variable.s…

GitLab CI/CD 新书发布,助企业降本增效

前言 大家好&#xff0c;我是CSDN的拿我格子衫来&#xff0c; 昨天我的第一本书《GitLab CI/CD 从入门到实战》上架啦&#xff0c;这是业内第一本详细讲解GitLab CI/CD的书籍。 历经无数个日夜&#xff0c;最终开花结果。感触良多&#xff0c;今天就借这篇文章来谈一谈这本书的…

Java基础(十五):异常处理

Java基础系列文章 Java基础(一)&#xff1a;语言概述 Java基础(二)&#xff1a;原码、反码、补码及进制之间的运算 Java基础(三)&#xff1a;数据类型与进制 Java基础(四)&#xff1a;逻辑运算符和位运算符 Java基础(五)&#xff1a;流程控制语句 Java基础(六)&#xff1…

Linux内核设备驱动设备树概念与使用

一、设备树概念以及作用 1.1设备树概念 设备树(Device Tree)&#xff0c;将这个词分开就是“设备”和“树”&#xff0c;描述设备树的文件叫做 DTS(DeviceTree Source)&#xff0c;这个 DTS 文件采用树形结构描述板级设备&#xff0c;也就是开发板上的设备信息&#xff0c;比…

python入门:cl.exe‘ failed with exit status 2错误通用解决方案

文章目录 错误一错误二pypi.org独立安装正确安装错误一 error: Microsoft Visual C++ 14.0 or greater is required. Get it with "Microsoft C++ Build Tools": https://visualstudio.microsoft.com/visual-cpp-build-tools/ 这个错误在windows系统上安装python工…

Spring《三》DI依赖注入

&#x1f34e;道阻且长&#xff0c;行则将至。&#x1f353; 上一篇&#xff1a;Spring《二》bean的实例化与生命周期 下一篇&#xff1a;敬请期待 目录一、setter注入&#x1f349;1.注入引用数据类型2.注入简单数据类型二、构造器注入&#x1f34a;1.注入引用数据类型2.简单数…

Spring 源码分析(二)——GenericBeanDefinition 分析

BeanDefinition 中存储着 Bean 的定义信息&#xff0c;它具有属性值、构造函数参数值以及具体实现 Bean 提供的进一步信息&#xff0c;在学习 Spring 的 Bean 初始化流程之前&#xff0c;还是非常有必要先了解一下 BeanDefinition。 一、注册 Bean 示例 首先&#xff0c;本文…

SpringCloud微服务技术栈之网关服务Gateway

文章目录SpringCloud微服务技术栈之网关服务Gateway前言网关服务Gateway的基本概念Gateway的体系结构Gateway的主要功能网关服务Gateway的架构设计架构设计方案示例代码网关服务Gateway的实践操作1. 创建工程2. 配置路由规则3. 实现过滤器4. 集成服务注册中心5. 启动网关服务器…

2020年11月信息系统项目管理师真题(综合+案例)

请点击↑关注、收藏&#xff0c;本博客免费为你获取精彩知识分享&#xff01;有惊喜哟&#xff01;&#xff01; 1、&#xff08; &#xff09;使系统的描述及信息模型的表示与客观实体相对应&#xff0c;符合人们的思维习惯&#xff0c;有利于系统开发过程中用户与开发人员的…

Redhat6.7离线安装rabbitmq

一、下载资源文件&#xff08;.rpm文件&#xff09; 链接: https://pan.baidu.com/s/1j2Ze_Jjm0oMrP-r95PPCtA?pwdv3is 提取码: v3is 复制这段内容后打开百度网盘手机App&#xff0c;操作更方便哦 创建rabbit文件夹Mkdir rabbit 三、通过ftp上传文件 四、安装erlang环境 …

强大到让人无法想象的ChatGPT-5即将发布,上千名人士却紧急叫停

目录 【ChatGPT 5简介】 【ChatGPT 5的潜在应用】 【ChatGPT 5的潜在危险】 ChatGPT4还没有好好体验&#xff0c;比GPT4强大1000倍的ChatGPT5又即将发布&#xff01;届时将彻底改变人工智能领域&#xff0c;并改变我们现有的世界 【ChatGPT 5简介】 OpenAI计划在2023年12月发…

面试了上百位性能测试后,我发现了一个令人不安的事实...

在企业中负责技术招聘的同学&#xff0c;肯定都有一个苦恼&#xff0c;那就是招一个合适的测试太难了&#xff01;若要问起招哪种类型的测试最难时&#xff0c;相信很多人都会说出“性能测试”这个答案。 每当发布一个性能测试岗位&#xff0c;不一会就能收到上百份简历&#…

kafka-4 生产者和消费者

kafka的生产者和消费者四、 生产者4.1 分区分配策略4.2 副本和消息消费4.2.1 副本&#xff08;AR、ISR、OSR&#xff09;4.2.2 HW与LEO4.2.3 ISR 集合和 HW、LEO的关系五、消费者5.1 分区分配策略5.2 消费者offset的存储四、 生产者 4.1 分区分配策略 &#xff08;1&#xff…

Webpack 实践:配置、性能优化和最佳实践

总结 通过以下的配置示例和性能优化策略&#xff0c;我们希望能帮助你在 Webpack 实践中获得更好的开发体验和项目性能。这里仅仅是冰山一角&#xff0c;Webpack 的功能还有很多等待你去探索。 在本篇文章中&#xff0c;我们将深入探讨 Webpack 的实践&#xff0c;包括配置示例…

Python 小型项目大全 71~75

七十一、声音模拟 原文&#xff1a;http://inventwithpython.com/bigbookpython/project71.html 类似于西蒙电子玩具&#xff0c;这款识记游戏使用第三方playsound模块&#xff0c;播放四种不同的声音&#xff0c;分别对应键盘上的A、S、D、F键。当你成功地重复游戏给你的图案时…

【SSL】ssl证书简介、ssl证书生成工具与ssl证书生成步骤

ssl证书简介、ssl证书生成工具与ssl证书生成步骤一、ssl证书是什么&#xff1f;二、ssl证书生成工具有哪些&#xff1f;2.1、工具一&#xff1a;CFSSL2.2、工具二&#xff1a;OpenSSL2.3、工具三&#xff1a;XCA三、ssl证书有什么用&#xff1f;四、ssl证书生成步骤4.1 步骤1&a…