使用HashMap实现,对一个字符集进行哈夫曼编码

最终达到的效果:

调用一个类

class HuffmanCodin{.....}

使用类中的静态方法,获取哈夫曼编码:


事前准备——哈夫曼树的节点定义

class Node implements Comparable<Node> {

    int weight;//权重
    Node left;
    Node right;
    char ch;//关键字,字符
    String code;//相应的哈夫曼编码

    public Node(char ch, int weight) {//构造方法,键值对
        this.weight = weight;
        this.ch = ch;
    }

    //构造方法,只设置出现频率
    public Node(int weight) {
        this.weight = weight;
    }



    //重写compareTo方法
    @Override
    public int compareTo(Node node) {

        if(this.weight - node.weight==0){//如果两个字符出现的频率一样,那么就比较字典序(两个字符一定是不同的)
            return this.ch-node.ch;
        }
        return this.weight - node.weight;//默认排列升序
    }



//重写toString方法
//效果:[ 字符 -> 010 ]
    @Override
    public String toString() {//重写之后,等一下打印就可以直接用引用就可以了
        return "[" + this.ch + " -> " + this.code + "]  ";
    }

}

步骤:

想要达到上述效果,大致可以分为这几步:

1、字符集转化成一个一个的键值对;

2、键值对转节点,节点放入一个集合

3、依据集合创建哈夫曼树。

4、对哈夫曼树的叶子节点进行哈夫曼编码

下面我们一点一点来解决


1、字符集转键值对

这里就要使用到HashMap了:

HashMap的

Key=一个字符

Value=权重(就是一个字符在字符集出现的频率,当然也不完全是,等一下会讲到)

public class Test {

    public static void main(String[] args) {
        Scanner in = new Scanner(System.in);

        System.out.println("输入的字符集:");
        String arr = in.nextLine();
        char[] chars = arr.toCharArray();//转化成字符数组

        Node root=HuffmanCoding.createTree(chars);//调用这个静态方法,具体实现看下一块代码      
    }

}
class HuffmanCoding {

    public static Node createTree(char[] arr) {

        Map.Entry<Character, Integer>[] entries = charGetEntry(arr);//获取键值对


}

charGetEntry()方法就是专门用来把字符集转化成一个一个的键值对的,然后返回这个类型:

Map.Entry<Character, Integer>[]

为什么是这个类型?

因为HashMap不能直接同时访问Character也就是字符,以及Integer接也就是对应字符的权重。

如果要访问键值对,需要调用HashMap的setEntry方法,setEntry方法会返回Map.Entry<Character, Integer>[]类型的数组

而Map.Entry中有访问和修改关键字和值的方法。

charGetEntry()方法:

private static Map.Entry<Character, Integer>[] charGetEntry(char[] arr) {

        //定义Hashmap储存不重复的键值对
        Map<Character, Integer> map = new HashMap<>(arr.length);//长度肯定不会超过arr的长度
        for (char ch : arr) {
            map.put(ch, 0);//权值默认先给0,等一下处理
        }

        //定义Entry[]这个集合,用来存放键值对
        Map.Entry<Character, Integer>[] entrys = new Map.Entry[map.size()];//长度刚好就是map的长度

        int i = 0;
        for (Map.Entry<Character, Integer> entry : map.entrySet()) {//遍历每一个entry,以此把每一个键值对放到集合entrys中

            entrys[i++] = entry;
        }

        //现在就可以赋值weight了
        i=entrys.length-1;//从后往前遍历,当然从前往后也可以
        while(i>=0){
            int n=0;
            for (int j = 0; j <arr.length ; j++) {
                if(entrys[i].getKey()==arr[j]){//两个字符一样,那么频率++
                    n++;
                }
            }
            entrys[i--].setValue(n);
        }

        //程序到达这里,键值对已经储存完毕,下面直接返回集合即可
        return entrys;
    }

如下第一步完成:


2、键值对转节点

上一步我们已经获得了所有的键值对,储存在entries中,现在只需创建一个List<Node>类型的集合,获遍历entries,获取键值对即可:

        //放入节点中(用集合来管理)
        int length = entries.length;
        List<Node> nodeList = new ArrayList<>(length);//长度一定和entries是一样的
        while (length > 0) {

//用Node的构造方法,创建结点,第一个参数是关键子,第二个参数是权重
            nodeList.add(new Node(entries[length - 1].getKey(), entries[length - 1].getValue()));
            length--;
        }

此时,第二步完成,nodeList就是一个储存着所有结点的集合。

3、构造哈夫曼树

此时类

HuffmanCoding

的静态方法createTree已经定义好了:

    public static Node createTree(char[] arr) {

        Map.Entry<Character, Integer>[] entries = charGetEntry(arr);//获取键值对,已经完成,保存在了entries中

        //放入节点中(用集合来管理)
        int length = entries.length;
        List<Node> nodeList = new ArrayList<>(length);//长度一定和entries是一样的
        while (length > 0) {
            nodeList.add(new Node(entries[length - 1].getKey(), entries[length - 1].getValue()));
            length--;
        }

        while (nodeList.size() > 1) {//只要大于一,就合并
            Collections.sort(nodeList);//先排升序,重写了用weight比较

            Node a = nodeList.remove(0);
            Node b = nodeList.remove(0);
            Node newNode = new Node(a.weight + b.weight);//这个是双亲节点
            newNode.left = a;
            newNode.right = b;
            nodeList.add(newNode);
        }

        return nodeList.remove(0);//还剩下的一个节点,就是哈夫曼树的根节点
    }

4、叶结点编码

下面运用的是递归,对叶子结点进行赋值0或者1(左结点是0,右结点时1):

 //这个函数可以把Node的code修改
    public static void coding(Node root, StringBuilder sb) {

        if (root == null) return;//如果只有一个节点,code==“”---->空字符串

        root.code = sb.toString();//先根节点
        if (root.left == null && root.right == null) {
            return;//直接返回
        }

        //如果不是叶子节点,那么一定有左右孩子----》因为这是哈夫曼树

        sb.append("0");//先左边,所以加一个0
        coding(root.left, sb);//递归

        sb.replace(sb.length() - 1, sb.length(), "1");//把最后一个替换成1,因为要走右边了

        coding(root.right, sb);//递归
        sb.delete(sb.length() - 1, sb.length());//也要删除,删除的区间是:左开右闭的!

    }

现在这个HuffmanCoding这个类就可以对一个字符集进行哈夫曼编码了,当然如果想要打印对应的值,需要写一个打印叶子结点的方法:

  //前序遍历打印叶子结点
    public static void showChar(Node root) {
        if (root == null) return;
        if (root.left == null && root.right == null) {//这是一个叶子节点,直接打印然后返回
            System.out.println(root);
            return;
        }
        //不是叶子结点,就遍历左右子树
        showChar(root.left);
        showChar(root.right);
    }

测试

最终哈夫曼编码类的源码:

class HuffmanCoding {

    public static Node createTree(char[] arr) {

        Map.Entry<Character, Integer>[] entries = charGetEntry(arr);//获取键值对,已经完成,保存在了entries中

        //放入节点中(用集合来管理)
        int length = entries.length;
        List<Node> nodeList = new ArrayList<>(length);//长度一定和entries是一样的
        while (length > 0) {
            nodeList.add(new Node(entries[length - 1].getKey(), entries[length - 1].getValue()));
            length--;
        }

        while (nodeList.size() > 1) {//只要大于一,就合并
            Collections.sort(nodeList);//先排升序,重写了用weight比较

            Node a = nodeList.remove(0);
            Node b = nodeList.remove(0);
            Node newNode = new Node(a.weight + b.weight);//这个是双亲节点
            newNode.left = a;
            newNode.right = b;
            nodeList.add(newNode);
        }

        return nodeList.remove(0);//还剩下的一个节点,就是哈夫曼树的根节点
    }



    private static Map.Entry<Character, Integer>[] charGetEntry(char[] arr) {
        //定义Hashmap储存不重复的键值对
        Map<Character, Integer> map = new HashMap<>(arr.length);//长度肯定不会超过arr的长度
        for (char ch : arr) {
            map.put(ch, 0);//权值默认先给0,等一下处理
        }

        //定义Entry[],又来放键值对(可以访问的)
        Map.Entry<Character, Integer>[] entrys = new Map.Entry[map.size()];//长度刚好就是map的长度
        int i = 0;
        for (Map.Entry<Character, Integer> entry : map.entrySet()) {
            entrys[i++] = entry;
        }

        //先在赋值weight
        i=entrys.length-1;
        while(i>=0){
            int n=0;
            for (int j = 0; j <arr.length ; j++) {
                if(entrys[i].getKey()==arr[j]){//两个字符一样,那么频率佳佳
                    n++;
                }
            }
            entrys[i--].setValue(n);
        }

        //程序到达这里,键值对已经储存完毕
        return entrys;
    }

    //这个函数可以把Node的code修改
    public static void coding(Node root, StringBuilder sb) {

        if (root == null) return;//如果只有一个节点,code==“”---->空字符串

        root.code = sb.toString();//先根节点
        if (root.left == null && root.right == null) {
            return;//直接返回
        }

        //如果不是叶子节点,那么一定有左右孩子----》因为这是哈夫曼树

        sb.append("0");//先左边,所以加一个0
        coding(root.left, sb);//递归

        sb.replace(sb.length() - 1, sb.length(), "1");//把最后一个替换成1,因为要走右边了

        coding(root.right, sb);//递归
        sb.delete(sb.length() - 1, sb.length());//也要删除,删除的区间是:左开右闭的!

    }

    

    //前序遍历打印叶子结点
    public static void showChar(Node root) {
        if (root == null) return;
        if (root.left == null && root.right == null) {//这是一个叶子节点,直接打印然后返回
            System.out.println(root);
            return;
        }
        //不是叶子结点,就遍历左右子树
        showChar(root.left);
        showChar(root.right);
    }

}

类中静态方法使用的演示:

关于哈夫曼编码的解码

会了编码,其实解码就很容易了

值得注意的是:

不同的字符集合,对应的哈夫曼编码是有所差异的

所以如果要进行解码,那么必须直到每一个字符对应出现的频率

解码思路:

在接收到字符频度表之后,创建一颗哈夫曼树,每次从root结点开始遍历,从第一个字符开始,是0就往左树走,是1就往右走,直到叶子结点即可解码。

具体实现:

    public static void deCoding(Map.Entry<Character, Integer>[] arrEntry, String arr) {//需要接收字符频度表 and 哈夫曼编码
        Node Cur= createTree(arrEntry);//调用了重载的创建哈夫曼树的方法

        char[] chars = arr.toCharArray();

        int cur = 0;//表示读取编码的位置

        Node root=Cur;//Cur保存了哈夫曼树的根结点
        while (cur < chars.length) {//读完就退出循环
            while (root.left != null && root.right != null) {//没有到叶子结点就一直循环
                if (chars[cur] == '1') {//是1走右边
                    cur++;
                    root = root.right;
                } else {//是二走左边
                    cur++;
                    root = root.left;
                }
            }

            //如果跳出了循环说明已经是叶子结点了
            System.out.println(root);
            root=Cur;
        }

    }

因为我们在createTree()方法中传入的类型是Map.Entry<Character, Integer>[],

所以需要对createTree()方法,

进行一次重载,

这个重载其实不麻烦,只要改一下接口,就可以了:

    private static Node createTree(Map.Entry<Character, Integer>[] entries){//重载方法,用在解码时调用这个方法

        //放入节点中(用集合来管理)
        int length = entries.length;//只改了这一行,和方法的唯一参数!!!!!
        
        
        
        List<Node> nodeList = new ArrayList<>(length);//长度一定和entries是一样的
        while (length > 0) {
            nodeList.add(new Node(entries[length - 1].getKey(), entries[length - 1].getValue()));
            length--;
        }

        while (nodeList.size() > 1) {//只要大于一,就合并
            Collections.sort(nodeList);//先排升序,重写了用weight比较

            Node a = nodeList.remove(0);
            Node b = nodeList.remove(0);
            Node newNode = new Node(a.weight + b.weight);//这个是双亲节点
            newNode.left = a;
            newNode.right = b;
            nodeList.add(newNode);
        }

        return nodeList.remove(0);//还剩下的一个节点,就是哈夫曼树的根节点
    }

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/606931.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

asp.net论坛指南系统

说明文档 运行前附加数据库.mdf&#xff08;或sql生成数据库&#xff09; 主要技术&#xff1a; 基于asp.net架构和sql server数据库 登陆可查看 浏览记录 TA的发布 TA的回复 TA的收藏 TA的点赞 管理员登陆可以查看举报管理 编辑管理 认证审核 帖子置顶申请审核 运行环境…

如何利用IPIDEA代理IP优化数据采集效率?

一、 前言二、 IPIDEA介绍三、体验步骤四、实战训练五、结语 一、 前言 在全球化与信息化交织的当代社会&#xff0c;数据已成为驱动商业智慧与技术革新的核心引擎。网络&#xff0c;作为信息汇聚与交流的枢纽&#xff0c;不仅是人们获取知识的窗口&#xff0c;更是商业活动与技…

FX110书籍推荐:如何快速成为一名专业股票投资人?

股票投资领域有一本神作《股票交易入门》&#xff0c;它是股票从业人员的入门必备书籍。 关于股票入门的书籍很多&#xff0c;但这本书涉及的知识面最全、实用性最强。从这本书里&#xff0c;我们可以领略到股票交易世界的跌宕起伏而又波澜壮阔的魅力。本书作者 本书的作者是美…

Navicat导入sql报错[Err] 1046 - No database selected

Navicat导入sql报错[Err] 1046 - No database selected ​ 今天系统重装了&#xff0c;就很完蛋。所有东西都重新下载安装。向Navicat导入sql的时候导入失败&#xff1a; 报错[Err] 1046 - No database selected。我很疑惑地又导了几次。当然又全都失败. 错误造成原因&#x…

项目风采展示【车酷-雷克萨斯2】

1&#xff1a;支持桌面展示 2&#xff1a;支持桌面时钟 3&#xff1a;支持桌面陀螺仪

怎么将文字做成二维码?文本活码在线的生成技巧

文本类型的活码该如何来制作呢&#xff1f;通过二维码来展示文字信息是现在很常用的一种方式&#xff0c;包括物品、建筑、人员等方面的信息&#xff0c;都可以用生成二维码后让其他人通过扫码了解自己需要的信息。那么文本活码的制作需要几步操作呢&#xff1f;下面就教大家使…

mysql等保测评2.0命令-三级

版本 Win默认安装位置 C:\Program Files\MySQL\MySQL Server 8.0\bin 版本&#xff1a;select version() from dual; 身份鉴别 a应对登录的用户进行身份标识和鉴别&#xff0c;身份标识具有唯一性&#xff0c;身份鉴别信息具有复杂度要求并定期更换&#xff1b; 1、SELEC…

OpenGL入门第二步:颜色、纹理设置(解析)

OpenGL入门第一步:创建窗口、重写虚函数-CSDN博客 1、设置颜色 添加QColor变量,如果需要颜色随时间变化,那就再添加一个定时器QElapsedTimer以及重写虚函数timerEvent。 initializeGL()函数设置片段着色器中颜色变量 如果需要设置时间别忘了开启计时器 timerEvent函数里写…

UE和three.js的区别

UE&#xff08;Unreal Engine&#xff09;和three.js都是用于创建3D图形的软件平台&#xff0c;但它们在功能、目标和应用场景方面存在一些差异。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0c;欢迎交流合作。 功能 UE 是一款功能全面的3D游戏引擎&…

03-单片机商业项目编程,从零搭建低功耗系统设计

一、本文内容 上一节《02-单片机商业项目编程&#xff0c;从零搭建低功耗系统设计-CSDN博客》引出了伪时间片的概念&#xff0c;这也是再低功耗系统设计中必须使用的程序设计逻辑&#xff0c;本文着重来讲解如何利用伪时间片来设计伪多任务&#xff0c;以及伪时间片多任务内核设…

力扣刷题第1天:消失的数字

大家好啊&#xff0c;从今天开始将会和大家一起刷题&#xff0c;从今天开始小生也会开辟新的专栏。&#x1f61c;&#x1f61c;&#x1f61c; 目录 第一部分&#xff1a;题目描述 第二部分&#xff1a;题目分析 第三部分&#xff1a;解决方法 3.1 思路一&#xff1a;先排序…

私人健身教练预约管理小程序开发源码现成案例(小程序+APP+H5 源码部署)

一、私人健身教练预约管理系统-环境介绍 1.1 私人健身教练预约管理系统-运行环境 开发语言&#xff1a;PHP 数据库&#xff1a;MySQL 系统架构&#xff1a;TP 后端&#xff1a;SpringBoot 前端&#xff1a;Vue 2. 私人健身教练预约管理系统-系统介绍。 2.1私人健身教练预约管…

手机传输助手有哪些?如何快速互传文件?

手机已经成为我们生活和工作中不可或缺的一部分&#xff0c;而手机传输助手&#xff0c;作为一种帮助我们在不同设备之间快速、方便地共享文件的工具&#xff0c;其重要性不言而喻。无论是在工作中需要将文件从电脑传输到手机&#xff0c;还是在生活中想要与朋友分享美好的瞬间…

FFmpeg常用命令详解与实战指南

下载地址&#xff1a;Releases BtbN/FFmpeg-Builds (github.com) 1. 获取视频信息 使用FFmpeg获取视频信息是最基本的操作之一。你可以使用-i选项指定输入文件&#xff0c;然后使用FFmpeg内置的分析器来获取视频的各种信息&#xff0c;包括视频编解码器、音频编解码器、分辨…

2.外卖点餐系统(Java项目 springboot)

目录 0.系统的受众说明 1.系统功能设计 2.系统结构设计 3.数据库设计 3.1实体ER图 3.2数据表 4.系统实现 4.1用户功能模块 4.2管理员功能模块 4.3商家功能模块 4.4用户前台功能模块 4.5骑手功能模块 5.相关说明 新鲜运行起来的项目&#xff1a;如需要源码数据库…

封装一个可以最小化和展开的弹窗组件

gl-dialog 大概思路&#xff1a; 在弹窗组件内部引入gl-dialog-collapse&#xff0c;这个组件主要用于存储已经被最小化的弹窗&#xff08;基础数据&#xff09; 弹窗内部的数据如何在父组件拿到是通过作用域插槽来实现的 gl-dialog接收一个tempData这个数据会在内部被记录下来…

IDEA远程连接Docker服务

1.确保你的服务器已经安装docker docker安装步骤可查看&#xff1a;CentOS 9 (stream) 安装 Docker 2.安装完docker后开启远程连接 默认配置下&#xff0c;Docker daemon只能响应来自本地Host的客户端请求。如果要允许远程客户端请求&#xff0c;需要在配置文件中打开TCP监听…

【数据结构】栈(Stack)和队列(Queue)

文章目录 栈一、栈的概念及结构二、栈的特点三、栈的实现1.初始化栈2.判断栈空3.入栈4.出栈5.取栈顶元素6.栈的元素个数7.销毁 队列一、队列的概念及结构二、队列的特点三、队列的实现1.初始化2.入队3.出队4.判断队空5.取队头元素6.取队尾元素 总结 栈 一、栈的概念及结构 栈…

k8s 理论知识基本介绍

目录 一 k8s 理论前言 &#xff08;一&#xff09;微服务是什么 1&#xff0c;应用场景 2&#xff0c;API 是什么 &#xff08;二&#xff09;&#xff0c;微服务 如何做版本迭代 1. Docker镜像构建 2. 版本标记 3. Docker Registry 4. 环境一致性 5. 滚动更新…

26 | 备库为什么会延迟好几个小时?

在官方的 5.6 版本之前,MySQL 只支持单线程复制,由此在主库并发高、TPS 高时就会出现严重的主备延迟问题。 coordinator 就是原来的 sql_thread, 不过现在它不再直接更新数据了,只负责读取中转日志和分发事务。真正更新日志的,变成了 worker 线程。而 work 线程的个数,就是…