算法学习笔记(7.6)-贪心算法(霍夫曼编码)

目录

1.什么是霍夫曼树

2.霍夫曼树的构造过程

3.霍夫曼编码

3.1具体的作用-频率统计

##实战题目


1.什么是霍夫曼树

给定N个权值作为N个叶子结点,构造一棵二叉树,若该树的带权路径长度达到最小,称这样的二叉树为最优二叉树,也称为哈夫曼树(Huffman Tree)。哈夫曼树是带权路径长度最短的树,权值较大的结点离根较近。

相关知识:
1、路径和路径长度
在一棵树中,从一个结点往下可以达到的孩子或孙子结点之间的通路,称为路径。
通路中分支的数目称为路径长度。若规定根结点的层数为1,则从根结点到第L层结点的路径长度为L-1。
2、结点的权及带权路径长度
若将树中结点赋给一个有着某种含义的数值,则这个数值称为该结点的权。
结点的带权路径长度为:从根结点到该结点之间的路径长度与该结点的权的乘积。
3、树的带权路径长度
树的带权路径长度规定为所有叶子结点的带权路径长度之和,记为WPL。

2.霍夫曼树的构造过程

哈夫曼树的节点个数:
哈夫曼树是一种满二叉树,这意味着除了叶节点外,每个节点都有两个子节点。对于 (N) 个唯哈夫曼树的节点个数与输入的唯一字符数量有关。设字符集合的大小为 (N)(即有 (N) 个唯一字符),则哈夫曼树的节点数最小值和最大值如下:一字符,会有 (N) 个叶节点,每个叶节点代表一个字符。

最小值
最小节点数:当输入的字符集合大小为 (N) 时,最小的哈夫曼树(也是理论上的最小值)会有 (2N - 1) 个节点。这是因为在构建哈夫曼树时,每次合并两个节点会创建一个新的内部节点,而最终只剩下一个节点(根节点)没有被合并。这意味着有(N-1) 次合并操作,每次合并操作增加一个新的内部节点,因此有 (N-1) 个内部节点和 (N) 个叶节点,总共 (2N - 1) 个节点。

最大值
对于哈夫曼树,最大节点数的概念实际上并不适用,因为哈夫曼树的构建是基于字符的频率的,其目的是为了创建一个尽可能高效的编码方案。每个唯一字符都会成为树的一个叶节点,而内部节点的数量总是 (N-1),所以节点总数固定为 (2N - 1)。不会有比这更多的节点数,因为这是根据哈夫曼算法的定义和工作方式所固有的。

结论
对于 (N) 个唯一字符,哈夫曼树的节点数总是 (2N - 1),这里没有最大值概念,因为节点总数是固定的,只要给定了唯一字符的数量。

哈夫曼树的构造过程:

假设有n个权值,则构造出的哈夫曼树有n个叶子结点。 n个权值分别设为 w1、w2、…、wn,则哈夫曼树的构造规则为:

(1) 将w1、w2、…,wn看成是有n 棵树的森林(每棵树仅有一个结点);

(2) 在森林中选出两个根结点的权值最小的树合并,作为一棵新树的左、右子树,且新树的根结点权值为其左、右子树根结点权值之和;

(3)从森林中删除选取的两棵树,并将新树加入森林;

(4)重复(2)、(3)步,直到森林中只剩一棵树为止,该树即为所求得的哈夫曼树。

3.霍夫曼编码

哈夫曼编码是一种压缩编码的编码算法,是基于哈夫曼树的一种编码方式。哈夫曼树又称为带权路径长度最短的二叉树。

哈夫曼编码跟 ASCII 编码有什么区别?

ASCII 编码是对照ASCII 表进行的编码,每一个字符符号都有对应的编码,其编码长度是固定的。而哈夫曼编码对于不同字符的出现频率其使用的编码是不一样的。其会对频率较高的字符使用较短的编码,频率低的字符使用较高的编码。这样保证总体使用的编码长度会更少,从而实现到了数据压缩的目的。

3.1具体的作用-频率统计

哈夫曼树是一个带权的二叉树,而在哈夫曼编码中,字符的出现频率就是字符的权重。因此要根据字符的频率放入优先队列中进行排序。然后根据这些字符构建一棵哈夫曼树

##代码实现

//c++代码实现
#include <iostream>
#include <vector>
using namespace std;
#include <algorithm> // 包含<algorithm>以使用reverse函数
#define MAXCODELEN 100
#define MAXHAFF 256 // 为了简化,假设最多处理256个不同的字符
#define MAXWEIGHT 10000

typedef struct Haffman {
	//权重 
    int weight;
    //字符 
    char ch;
    //父节点,左儿子,右儿子 
    int parent, leftChild, rightChild;
} HaffmanNode;

typedef struct Code {
    int code[MAXCODELEN];
    int start;
} HaffmanCode;

HaffmanNode haffman[MAXHAFF * 2 - 1]; // 扩展数组大小以容纳所有可能的内部节点
HaffmanCode code[MAXHAFF];

//构造哈夫曼树的过程 
void buildHaffman(int all) {
	//对每个节点进行初始化 
	//哈夫曼节点的个数总为 2 * all - 1 
    for (int i = 0; i < 2 * all - 1; i++) {
        haffman[i].weight = 0;
        haffman[i].parent = -1;
        haffman[i].leftChild = -1;
        haffman[i].rightChild = -1;
    }
	
    cout << "请输入需要哈夫曼编码的字符和权重大小" << endl;
    for (int i = 0; i < all; i++) {
    	//获取每个字符及权重 
        cout << "请分别输入第" << i + 1 << "个哈夫曼字符和权重:" << endl;
        cin >> haffman[i].ch >> haffman[i].weight;
    }

    //用来存储两个最小权值的节点以及权重 
	int x1, x2, w1, w2;
    //all个节点,只需要合并all - 1 次,循环all - 1 次即可 
    for (int i = 0; i < all - 1; i++) {
    	//初始化成不可能的值 
        x1 = x2 = -1;
        w1 = w2 = MAXWEIGHT;
        //遍历每一个可能的节点,包括初始的叶节点和已经创建的内部节点。 
        for (int j = 0; j < all + i; j++) {
            if (haffman[j].parent == -1) {
            	//如果当前节点没有父节点 ,即还没有加入到haffman树中,即考虑这个节点 
                if (haffman[j].weight < w1) {
                    w2 = w1;
                    x2 = x1;
                    //利用x1,和w1来接受第一个节点和权值 
                    w1 = haffman[j].weight;
                    x1 = j;
                    
                }
				//利用x2,和w2来接受第二个节点和权值 
				else if (haffman[j].weight < w2) {
                    w2 = haffman[j].weight;
                    x2 = j;
                }
            }
        }
        //循环遍历一遍后,x1,x2,w1,w2即是最小两个节点的选择和权值 
		//将其加入到huffman树中 
        haffman[all + i].leftChild = x1;
        haffman[all + i].rightChild = x2;
        haffman[all + i].weight = w1 + w2;
        haffman[x1].parent = all + i;
        haffman[x2].parent = all + i;
    }
}

void printCode(int all) {
	//遍历每一个字符-我们所输入的 
    for (int i = 0; i < all; i++) {
    	//用来存储每一个字符的haffman编码 
        vector<int> hCode;
        int current = i;
        int parent = haffman[current].parent;
        //通过回溯到根节点,然后确保haffman编码的完整性 
        while (parent != -1) {
        	//左孩子 '0' 
            if (haffman[parent].leftChild == current) {
                hCode.push_back(0);
            }
			//右孩子 '1' 
			else {
                hCode.push_back(1);
            }
            current = parent;
            parent = haffman[current].parent;
        }
        reverse(hCode.begin(), hCode.end());
        cout << haffman[i].ch << ": Huffman Code is: ";
        for (int j = 0 ; j < hCode.size() ; j++)
        {
			cout << hCode[j] ;
		}	
//        for (int bit : hCode) {
//            cout << bit;
//        }
        cout << endl;
    }
}

int main() {
    cout << "请输入有多少个哈夫曼字符:" << endl;
    int all = 0;
    cin >> all;

    if (all <= 0) {
        cout << "你输入的个数有误" << endl;
        return -1;
    }
    buildHaffman(all);
    printCode(all);
    return 0;
}

#python代码
import heapq
from collections import defaultdict, Counter


# 定义树的节点
class Node:
    def __init__(self, char, freq):
        self.char = char
        self.freq = freq
        self.left = None
        self.right = None

    # 为了让节点能在优先队列中按频率排序,定义比较方法
    def __lt__(self, other):
        return self.freq < other.freq


# 构建哈夫曼树
def build_huffman_tree(text):
    # 统计字符频率
    frequency = Counter(text)

    # 创建优先队列
    priority_queue = [Node(char, freq) for char, freq in frequency.items()]
    heapq.heapify(priority_queue)

    # 循环直到队列中只剩一个元素
    while len(priority_queue) > 1:
        # 弹出两个最小元素
        left = heapq.heappop(priority_queue)
        right = heapq.heappop(priority_queue)

        # 创建新的内部节点,将两个节点作为子节点
        merged = Node(None, left.freq + right.freq)
        merged.left = left
        merged.right = right

        # 将新节点加入优先队列
        heapq.heappush(priority_queue, merged)

    # 队列中剩下的元素就是树的根节点
    return priority_queue[0]


# 生成哈夫曼编码
def generate_codes(node, prefix="", code={}):
    if node is not None:
        if node.char is not None:
            code[node.char] = prefix
        generate_codes(node.left, prefix + "0", code)
        generate_codes(node.right, prefix + "1", code)
    return code


# 编码文本
def encode(text, codes):
    return ''.join(codes[char] for char in text)


# 解码文本
def decode(encoded_text, root):
    decoded_text = ""
    current_node = root
    for bit in encoded_text:
        if bit == '0':
            current_node = current_node.left
        else:
            current_node = current_node.right
        if current_node.char is not None:
            decoded_text += current_node.char
            current_node = root
    return decoded_text


# 主函数
# def main():
#     text = "this is an example for huffman encoding"
#     root = build_huffman_tree(text)
#     codes = generate_codes(root)
#     encoded_text = encode(text, codes)
#     decoded_text = decode(encoded_text, root)
#
#     print(f"Original text: {text}")
#     print(f"Encoded text: {encoded_text}")
#     print(f"Decoded text: {decoded_text}")


# if __name__ == "__main__":
#     main()

# 主函数
def main():
    text = "this is an example for huffman encoding"
    root = build_huffman_tree(text)
    codes = generate_codes(root)

    # 打印每个字符的哈夫曼编码
    print("Huffman Codes for each character:")
    for char, code in codes.items():
        print(f"'{char}': {code}")

    encoded_text = encode(text, codes)
    decoded_text = decode(encoded_text, root)

    print(f"\nOriginal text: {text}")
    print(f"Encoded text: {encoded_text}")
    print(f"Decoded text: {decoded_text}")

if __name__ == "__main__":
    main()

##实战题目

3531. 哈夫曼树 - AcWing题库

##示例代码

//c++代码
#include <iostream>
#include <queue>
using namespace std;

int n, x, ans;
priority_queue <int, vector <int>, greater <int> > q;

int main ()
{
    cin >> n;
    for (int i = 1; i <= n; i ++)
    {
        cin >> x, q.push (x); // 加入二叉堆(优先队列)
    }
    while (-- n)
    {
        x = q.top (), q.pop (), x += q.top (), q.pop (); // 取出两个堆顶(当前最小值)合并
        ans += x, q.push (x); // 统计答案,在放进堆中
    }
    cout << ans;
    return 0;
}

 148. 合并果子 - AcWing题库

 149. 荷马史诗 - AcWing题库

##代码示例

//c++代码示例
#include<bits/stdc++.h>
using namespace std ;

typedef long long LL ;
typedef pair<LL,int> PLI ;
const int N = 1e5 + 10 ;

int n , m ;
priority_queue<PLI,vector<PLI>,greater<PLI>> p ;

int main()
{
    cin >> n >> m ;
    for (int i = 1 ; i <= n ; i++)
    {
        LL w ;
        cin >> w ;
        p.push({w,0}) ;
    }
    //这是因为在每次合并操作中,会从堆中取出 m 个节点并合并为一个新节点,这意味着总节点数将减少 m−1。
    //为了最终能够合并到只剩一个节点,初始的节点数 n 与合并的分支数 m 必须满足 n - 1 是 m - 1 的倍数。
    while ((n - 1) % (m - 1))
    {
        p.push({0ll,0}) ;
        n++ ;
    }
    LL ans = 0 ; 
    while (p.size() > 1)
    {
        LL sum = 0 ;
        int depth = 0 ;
        for (int i = 1 ; i <= m ; i++)
        {
            sum += p.top().first ;
            depth = max(depth, p.top().second) ;
            p.pop() ;
        }
        ans += sum ;
        p.push({sum,depth+1}) ;
    }
    cout << ans << endl << p.top().second ;
    return 0 ;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/688130.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

计算机组成结构—IO方式

目录 一、程序查询方式 1. 程序查询基本流程 2. 接口电路 3. 接口工作过程 二、程序中断方式 1. 程序中断基本流程 2. 接口电路 3. I/O 中断处理过程 三、DMA 方式 1. DMA 的概念和特点 2. DMA 与 CPU 的访存冲突 3. DMA 接口的功能 4. DMA 接口的组成 5. DMA 的…

STCunio数字电源带PID数字闭环(带详细的代码说明文档)

STCunio&#xff0c;即 system on chip unusual i/o,采用类似 arduino 构架设计&#xff0c;即使没有单片机知 识的设计师和艺术家们能够很快地通过它学习电子和传感器的基础知识&#xff0c;并应用到他们的设 计当中。设计中所要表现的想法和创意才是最主要的&#xff0c;至于…

Windows 搭建C++ 纯开源开发环境 进行 YOLOv8 模型推理的开发测试环境

文章大纲 IDE 选择纯开源首选 Codeblocks 跨平台开发IDE其次选择 visual studio 社区版 or visual studio code包管理MSYS2pacmanconda & mambavcpkgNuGetapt-get其他手动配置 Visual studio 开发环境下载 visual studio基本配置基本测试:打开图片,打开摄像头读取图片读取…

STL中stack和queue模拟实现+容器适配器

目录 容器适配器 STL标准库中stack和queue的底层结构 deque的简单介绍 deque的缺陷 为什么选择deque作为stack和queue的底层默认容器 stack的模拟实现 queue的模拟实现 容器适配器 适配器是一种设计模式&#xff08;设计模式是一套被反复使用的&#xff0c;多数人知晓…

吴谨言墨雨背后用真诚柱铸就爆款之路

吴谨言&#xff1a;墨雨背后&#xff0c;用真诚铸就爆款之路在繁华的娱乐圈&#xff0c;每一个成功的背后隐藏着不为人知的努力和汗水。而今天&#xff0c;我们要讲述的&#xff0c;正是这样一位用真诚和执着&#xff0c;一步步走向成功的演员——吴谨言。近日&#xff0c;一则…

cs与msf权限传递

cs传递到msf 1&#xff0c;先启动cs ┌──(root㉿ring04h)-[~/cobalt_strike_4.7] └─# ./teamserver 192.168.196.144 123456 ​ ┌──(root㉿ring04h)-[~/cobalt_strike_4.7] └─# ./start.sh ​ 2&#xff0c;上传木马&#xff0c;上线主机 3&#xff0c;msf配置一个…

出售iPhone前的必做步骤:完全擦除个人数据的方法

当您准备在闲鱼上转售旧 iPhone、将其捐赠、送给朋友或通过 Apple 回收之前&#xff0c;您可能会选择执行“恢复”操作来擦除您的数据。但请注意&#xff0c;这一操作并不能真正删除设备中的数据。被“删除”或“格式化”的数据实际上仍存在于 iPhone 中&#xff0c;只是被系统…

106、python-第四阶段-3-设计模式-单例模式

不是单例类&#xff0c;如下&#xff1a; class StrTools():pass str1StrTools() str2StrTools() print(str1) print(str2) 运用单例&#xff0c;先创建一个test.py class StrTools():pass str1StrTools()然后创建一个hello.py&#xff0c;在这个文件中引用test.py中的对象&a…

Day14:响应式网页

通过媒体查询、Bootstrap 框架完成腾讯全端网页响应式布局。 一、响应式布局方案 1、什么是响应式布局 它的主要特点是能够使网页根据不同的设备屏幕尺寸&#xff08;如桌面电脑、平板电脑、手机等&#xff09;和分辨率自动调整布局和显示效果&#xff0c;以提供最佳的用户体…

解决:Navicat导入sql脚本时报2006

目录 问题复现原因分析解决办法问题小结 1) MySQL 服务宕了 2) mysql连接超时 3) mysql请求链接进程被主动kill 4) Your SQL statement was too large. 问题复现 今天在用Navicat 16.0.6导入.sql文件时&#xff0c;运行一半就报错了。错误如下&#xff1a; [E…

FPGA新起点V1开发板(十)——按键控制LED

文章目录 一、实验任务二、代码展示三、管脚分配 一、实验任务 二、代码展示 module key_led(input sys_clk,input rst_n,input [3:0] key,output reg [3:0] led);// reg define reg [23:0] cnt; reg [1:0] led_ctrl;//0.2s计数器 always (posed…

开发一个Dapp需要多少?

区块链开发一个Dapp要多少钱&#xff1f; 开发一个去中心化应用&#xff08;Dapp&#xff09;的成本取决于多个因素&#xff0c;包括Dapp的复杂性、功能需求、区块链平台以及开发团队的经验水平。以下是一些主要的影响因素&#xff1a; 1. 区块链平台&#xff1a;不同区块链…

利用梯度提升树分类法实现乳腺癌数据集分类

目录 1. 作者介绍2. 梯度提升树算法2.1 Boosting 算法2.2 Boosting Tree &#xff08;提升树&#xff09;2.3 梯度提升树&#xff08;Gradient Boosting Tree&#xff09; 3. 利用梯度提升树分类法实现乳腺癌数据集分类实验3.1 乳腺癌数据集介绍3.2 实验过程3.3 实验结果3.4 完…

C语言数据结构(排序算法总结)

目录 算法类型 算法比较 稳定性描述 插入排序 选择排序 冒泡排序 希尔排序 堆排序 快速排序 霍尔排序&#xff08;递归&#xff09; 挖坑法&#xff08;递归&#xff09; 双指针&#xff08;递归&#xff09; 快排(非递归) 归并排序 计数排序 总结&#xff08;速…

华为端云一体化开发 (起步1.0)(HarmonyOS学习第七课)

官方文献&#xff1a; 为丰富HarmonyOS对云端开发的支持、实现端云联动&#xff0c;DevEco Studio推出了云开发功能&#xff0c;开发者在创建工程时选择云开发模板&#xff0c;即可在DevEco Studio内同时完成HarmonyOS应用/元服务的端侧与云侧开发&#xff0c;体验端云一体化协…

ChatGPT交卷2024年高考新课标I卷语文关于AI方面的作文试题

2024年新课标I卷作文试题&#xff1a; 阅读下面的材料&#xff0c;根据要求写作。&#xff08;60分&#xff09; 随着互联网的普及、人工智能的应用&#xff0c;越来越多的问题能很快得到答案。那么&#xff0c;我们的问题是否会越来越少&#xff1f; 以上材料引发了你怎样的…

CarSim车辆运动轨迹绘制

CarSim车辆运动轨迹绘制 CarSim中与车辆位置有关的信息分别为Xo和Yo 输出到Simulink中 导入到工作空间中保存&#xff0c;low_carsim_path.mat &#xff0c;绘制结果曲线&#xff0c;low_carsim_path_comp.m data csvread(low_two_path.csv,1,0); low_two_path_x data(:,1)…

【FAS】《CN103106397B》

原文 CN103106397B-基于亮瞳效应的人脸活体检测方法-授权-2013.01.19 华南理工大学 方法 / 点评 核心方法用的是传统的形态学和模板匹配&#xff0c;亮点是双红外发射器做差分 差分&#xff1a;所述FPGA芯片控制两组红外光源&#xff08;一近一远&#xff09;交替亮灭&…

DVWA-XSS(Reflected)

反射型XSS可以用来窃取cookie Low 输入1111进行测试&#xff0c;发现1111被打印 输入<script>alert(document.cookie)</script>&#xff0c;出现弹窗&#xff0c;获得cookie Medium 查看后端代码&#xff0c;发现对<script>进行了转义&#xff0c;但是…

codeforces round 949 div2

A Turtle and Piggy Are Playing a Game 题目&#xff1a; 思路&#xff1a;输出2的幂次b使得2^b为最大的不超过x的数 代码&#xff1a; #include <iostream>using namespace std;const int N 2e5 10;void solve() {int l, r;cin >> l >> r;if(r % 2) …