【数据结构 】哈夫曼编译码器

数据结构-----哈夫曼编译码器

  • 题目
    • 题目描述
    • 基本要求
    • 算法分析
  • 代码实现
    • 初始化
    • 编码
    • 解码
    • 打印代码
    • 打印哈夫曼树
  • 总结

题目

题目描述

  • 利用哈夫曼编码进行信息通信可大大提高信道利用率,缩短信息传输时间,降低传输成本。
    要求:在发送端通过一个编码系统对待传数据预先编码;在接收端将传入的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道),每端都需要个完整的编/译码系统。试为这样的信息收发站写一个哈夫曼的编/译码系统。

基本要求

  • 基本要求
    系统应具有以下功能:
    ① I:初始化.从终端读入字符集大小n及n个字符和n个权值,建立哈夫曼树,井将它存于文件HuffmanTree中。
    ② C:编码。利用已建立好的哈夫曼树(如不在内存,则从文件HuffmanTree中读入)。对文件tobetrans中的正文进行编码,然后将结果存入文件codefile中。
    ③ D:解码。利用已建立好的哈夫曼树将文件codefile中的代码进行译码,结果存入testfile中。
    ④ P:打印代码文件。将文件codefile以紧凑格式显示在终端上,每行50个代码。同时将此字符形式的编码文件写入文件codeprint中。
    ⑤ T:打印哈夫曼树。将已在内存中的哈夫曼树直观的方式(树或凹入表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件treeprint中。

算法分析

  • 本题例主要用到3个算法如下:
    ① 哈夫曼编码。在初始化(I)的过程中,要用输入的字符和权值建立哈夫曼树并求得哈夫曼编码。先将输入的字符和权值放到一个结构体数据中,建立哈夫曼树,将计算所得的哈夫曼编码存储到另一个结构体数组中。
    ② 串的匹配。在解码(D)的过程中,要对已经编码过的代码进行译码,可利用循环,将代码中与哈夫曼编码长度相同的串与这个哈夫曼编码进行比较,如果相等就回显并存入文件。
    ③二叉树的遍历。在打印哈夫曼树(T)的过程中,因为哈夫曼树也是二叉树,所以就要利用二叉树的前序遍历将哈夫曼树输出。

代码实现

代码部分参考了《数据结构-C语言版第2版》这本书中代码以及C++风格进行书写,测试文件tobetrans中的内容为"ABCABC"

初始化

题目要求从终端读入字符集大小n及n个字符和n个权值,建立哈夫曼树,并将它存于文件HuffmanTree中,可以先将哈夫曼树构建起来,得到哈夫曼树及其对应叶子节点的编码,再通过文件的输入输出将这些编码写入文件HuffmanTree中即可

  • 构造哈夫曼树
/*找出森林集合中根权值最小的两个*/
void Select(HuffmanTree HT,int len,int &s1,int &s2)
{
	int i,min1=0x3f3f3f3f,min2=0x3f3f3f3f;//先赋予最大值
	for(i=1;i<=len;i++)
	{
		if(HT[i].weight<min1&&HT[i].parent==0)
		{
			min1=HT[i].weight;
			s1=i;
		}	
	}
	int temp=HT[s1].weight;//将原值存放起来,然后先赋予最大值,防止s1被重复选择
	HT[s1].weight=0x3f3f3f3f;
	for(i=1;i<=len;i++)
	{
		if(HT[i].weight<min2&&HT[i].parent==0)
		{
			min2=HT[i].weight;
			s2=i;
		}
	}
	HT[s1].weight=temp;//恢复原来的值
}

/*构建哈夫曼树*/
void CreatHuffmanTree(HuffmanTree &HT,int n)
{
	//构造赫夫曼树HT
	int m,s1,s2,i;
	if(n<=1) return;
	m=2*n-1;
	HT=new HTNode[m+1];  		//0号单元未用,所以需要动态分配m+1个单元,HT[m]表示根结点   
	for(i=1;i<=m;++i)        	//将1~m号单元中的双亲、左孩子,右孩子的下标都初始化为0   
	   { HT[i].parent=0;  HT[i].lchild=0;  HT[i].rchild=0; }
	cout<<"请输入叶子结点的字符和权值:\n";
	for(i=1;i<=n;++i)        	//输入前n个单元中叶子结点的权值  
		cin>>HT[i].s>>HT[i].weight;  
	/*――――――――――初始化工作结束,下面开始创建赫夫曼树――――――――――*/ 
	for(i=n+1;i<=m;++i) 
	{  	//通过n-1次的选择、删除、合并来创建赫夫曼树
		Select(HT,i-1,s1,s2);
		//在HT[k](1≤k≤i-1)中选择两个其双亲域为0且权值最小的结点,
		// 并返回它们在HT中的序号s1和s2
		HT[s1].parent=i; 	
		HT[s2].parent=i;   
		//得到新结点i,从森林中删除s1,s2,将s1和s2的双亲域由0改为i
		HT[i].lchild=s1;   
		HT[i].rchild=s2;							//s1,s2分别作为i的左右孩子
		HT[i].weight=HT[s1].weight+HT[s2].weight; 	//i 的权值为左右孩子权值之和
	}											
}
  • 哈夫曼编码
/*哈夫曼树编码*/
void CreatHuffmanCode(HuffmanTree HT,HuffmanCode &HC,int n)
{
	//从叶子到根逆向求每个字符的赫夫曼编码,存储在编码表HC中
	int i,start,c,f;
	HC=new char*[n+1];         						//分配n个字符编码的头指针矢量
	char *cd=new char[n];							//分配临时存放编码的动态数组空间
	cd[n-1]='\0';                            		//编码结束符
	for(i=1;i<=n;++i)
	{                      							//逐个字符求赫夫曼编码
		start=n-1;                          		//start开始时指向最后,即编码结束符位置
		c=i; 
		f=HT[i].parent;                 			//f指向结点c的双亲结点
		while(f!=0)
		{                          					//从叶子结点开始向上回溯,直到根结点
			--start;                          		//回溯一次start向前指一个位置
			if(HT[f].lchild==c)  
				cd[start]='0';						//结点c是f的左孩子,则生成代码0
			else 
				cd[start]='1';                 		//结点c是f的右孩子,则生成代码1
			c=f; 
			f=HT[f].parent;             			//继续向上回溯
		}                                  			//求出第i个字符的编码      
		HC[i]=new char[n-start];         			// 为第i 个字符编码分配空间
		strcpy(HC[i], &cd[start]);        			//将求得的编码从临时空间cd复制到HC的当前行中
	}
	delete cd;                            			//释放临时空间
}
  • 将编码写入到文件HuffmanTree
    这里通过循环将构造好的哈夫曼编码直接写入到文件
//编码写入文件HuffmanTree.txt
void printCreatHuffmanCode(HuffmanTree HT, HuffmanCode HC,int n)
{
    ofstream hFile("HuffmanTree.txt");
    if (!hFile.is_open()) {
        cout << "文件HuffmanTree.txt打开失败." << endl;
        exit(1);
    } 
	cout<<"各字符对应的编码如下:"<<endl; 
    for (int i = 1; i <=n; i++)
    {
        cout << HT[i].s << HC[i] << endl;
        hFile << HT[i].s << HC[i]<<endl; 
    }

	hFile.close();
    cout << "成功写入文件HuffmanTree.txt" << endl;
}

初始化部分运行截图如下:
哈夫曼树及其编码初始化

编码

思路:通过文件逐行读出字符,并将其存放到数组,通过遍历该数组以及哈夫曼树,从而将对应的编码写入到文件codefile.txt中

//编码部分 
void Huffmancode(HuffmanTree HT,HuffmanCode HC,int n) {
    // 函数用于对 "tobetrans.txt" 文件中的内容进行编码,并将结果存储在 "codefile.txt" 文件中
    // 假设 "tobetrans.txt" 包含要编码的内容,每一行表示一个要编码的字符串。
	ifstream tFile("tobetrans.txt");//读 
	ofstream cFile("codefile.txt");//写 
	
	if (!tFile.is_open()) {
	    cout << "文件tobetrans.txt打开失败.\n"<<endl;
	    exit(1);
	}
	if (!cFile.is_open()) {
	    cout << "文件codefile.txt打开失败.\n"<<endl;
	    exit(1);
	}
	
	char tobetrans[100];//临时存放文件中每一行的字符 
	
	// 逐行读取内容
	while (tFile.getline(tobetrans, sizeof(tobetrans))) {//行不空 
	   
	    int m= strlen(tobetrans);//数组长度,即每一行字符个数
		cout<<"tobetrans内容:"<<tobetrans; 
		cout<<endl; 
	    for (int i = 0; i <m; i++) {//遍历数组 
	    	for(int j=1;j<=n;j++) //遍历树节点(0号单元为根节点未启用) 
	    	{
	    		if (HT[j].s == tobetrans[i]) {//相等则将其对应的编码写入文件 
	        	cFile << HC[j];
				}
	        }
	    }
	}
	 
	tFile.close();
	cFile.close();
	cout<<"成功写入文件codefile.txt"<<endl;

}

编码部分运行截图如下:
将文件中的内容进行编码

解码

思路:和编码部分一样,先从文件逐行读出存入数组,接着再遍历该数组和树的节点,从而将对应的字符写入到testfile.txt中

//译码部分 
void HuffmanDecode(HuffmanTree HT, int n) {
	//函数用于利用已建立好的哈夫曼树将文件"codefile.txt"中的代码进行译码,结果存入"testfile.txt"中

	ifstream codeFile("codefile.txt");//读 
	ofstream testFile("testfile.txt");//写 
	
	if (!codeFile.is_open()) {
	    cout << "文件codefile.txt打开失败.\n"<<endl;
	    exit(1);
	}
	if (!testFile.is_open()) {
	    cout << "文件testfile.txt打开失败.\n"<<endl;
	    exit(1);
	}
	
	char pwd[100];
	codeFile.getline(pwd, sizeof(pwd));//每次读取一行放入数组pwd中进行译码 
	
	int len = strlen(pwd);
	int i = 0;
	int node = 2 * n - 1;//从根节点开始 
	
    while (i < len) {  // 循环遍历读取数组中的每个字符
        while (HT[node].lchild != 0 && HT[node].rchild != 0) {  // 当当前节点不是叶子节点时循环
            if (pwd[i] == '0') {  // 如果当前读取的字符是 '0'
                node = HT[node].lchild;  // 移动到当前节点的左孩子节点
            } else if (pwd[i] == '1') {  // 如果当前读取的字符是 '1'
                node = HT[node].rchild;  // 移动到当前节点的右孩子节点
            }
            i++;  // 移动到下一个字符
        }
        testFile << HT[node].s;  // 将叶子节点对应的字符写入到输出文件中
        node = 2 * n - 1;  // 将节点移动回到根节点
    }

	
	codeFile.close();
	testFile.close();
	cout << "成功写入文件testfile.txt" << endl;

}

解码部分运行截图如下:
将已经编译好的字符码进行解码

打印代码

思路:通过文件逐行读出二进制码,在根据题目要求将对应的格式输出到终端输入到文件(我这里以每5行为例)

//打印代码文件 
void Print()
{
	//函数用于将文件codefile.txt以紧凑格式显示在终端上,每行5个代码。
	//同时将此字符形式的编码文件写入文件codeprint.txt中。 
	char str[1000];//存储codefile.txt的0-1编码 
	int num = 0;
	ifstream file1("codefile.txt");//读出 
	ofstream file2("codeprint.txt");//写入 
	if(file1.fail()){
		cout<<"文件codefile.txt打开失败"<<endl;
		exit(0);
	}
	if(file2.fail()){
		cout<<"文件codeprint.txt打开失败"<<endl;
		exit(0);
	}
	file1.getline(str, 10000);//读取每一行
	cout<<"str内容"<<str; 
	cout<<endl;
	cout<<"文件codefile.txt内容显示如下:"<<endl; 
	while(str[num]){
		if(num%5==0&&num!=0)//每输出5个字符换行,由于数组下标从0开始所以要忽略num==0这个情况 
		{
			cout<<endl; 
			file2<<endl;//文件里也是每5个字符换行 
		}
		cout<<str[num];
		file2<<str[num];//写入文件 
		num++; 				
	}
	cout<<endl;
	file1.close();
	file2.close();
	cout<<"成功写入文件codeprint.txt"<<endl;	
	
}

打印代码部分运行截图如下:
打印代码文件

打印哈夫曼树

这里结合树的前序遍历,并以凹入表的形式进行输出

void PrintHuffmanTree(HuffmanTree HT, int root, int level) {
    // 递归打印哈夫曼树的结构(凹入表形式)
    if (root != 0) {
        // 打开文件 treeprint.txt
        ofstream treeFile("treeprint.txt", ios::app);  // 使用 ios::app 追加模式
        if (treeFile.fail()) {
            cout << "文件 treeprint.txt 打开失败" << endl;
            exit(0);
        }

        // 输出当前节点信息(以凹入表形式)
        cout << string(4 * level, ' ');  // 控制缩进
        cout << HT[root].weight;//输出节点权值 
        if (HT[root].s) {
            cout << " (" << HT[root].s << ")";//节点字符 
        }
        cout << endl;
        
        treeFile << string(4 * level, ' ');
        treeFile << HT[root].weight;
        if (HT[root].s) {
            treeFile << " (" << HT[root].s << ")";
        }
        treeFile << endl;

        // 递归打印左右子树
        PrintHuffmanTree(HT, HT[root].lchild, level + 1);
        PrintHuffmanTree(HT, HT[root].rchild, level + 1);
    }
}

打印哈夫曼树运行截图如下:
打印哈夫曼树

总结

关于如何书写一个哈夫曼编译码器,以上代码大家可以参考,仅供参考!!!毕竟我写的也不是很优秀,只能做到题目的要求,代码中还有许多可以优化的地方,介于自己能力有限,就先分享这么多,大家如果在参考以上代码存在问题时,需要我自己书写的完整代码可以私信我哦,在此感谢各位大佬的支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/322218.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

DC电源模块与AC电源模块的对比分析

DC电源模块与AC电源模块的对比分析 BOSHIDA DC电源模块和AC电源模块是两种常见的电源模块&#xff0c;它们在供电方式、稳定性、适用范围等方面有所不同&#xff0c;下面是它们的对比分析&#xff1a; 1. 供电方式&#xff1a; DC电源模块通过直流电源供电&#xff0c;通常使用…

韩国Neowine(纽文微)第三代加密芯片ALPU-C

由工采网代理的ALPU-C是韩国Neowine&#xff08;纽文微&#xff09;推出第三代加密芯片&#xff1b;是ALPU系列中的高端IC&#xff1b;其加密性更强、低耗电、体积小&#xff1b;使得防复制、防抄袭板子的加密性能大大提升&#xff0c;让系统产品及嵌入式软体的开发商更能有效保…

C#,字符串匹配(模式搜索)原生(Native)算法的源代码

算法没什么可说的&#xff0c;就是一段一段匹配呗。 运行效果&#xff1a; 源代码&#xff1a; using System; using System.Collections; using System.Collections.Generic; namespace Legalsoft.Truffer.Algorithm { /// <summary> /// 字符串匹配&#xf…

虹科分享 | PCAN工具:强大的CAN通讯解决方案,你了解多少?

导读&#xff1a;在当今的汽车和工业自动化领域&#xff0c;可靠的通讯系统至关重要&#xff0c;PCAN工具为这些应用提供了强大的支持。本文将介绍PCAN工具的功能、应用和优势&#xff0c;以帮助您根据实际需求选择合适的工具和配件。 PCAN 网络允许 PCAN 应用程序&#xff08…

JVM:从零到入门

JVM&#xff0c;就是Java虚拟机。 JVM是一个巨大的话题&#xff0c;我们本文主要简单介绍一些围绕JVM相关的基础知识。 目录 JVM内存区域划分 本地方法栈 虚拟机栈 堆 程序计数器 方法区/ 元数据区 类加载 1.加载 2.验证 3.准备 4.解析 5.初始化 双亲委派模型 …

操作系统(复习提纲)

现在距离操作系统考试还剩三天&#xff0c;我今天刚刚整理好这份提纲&#xff0c;里面还附加了一些可能考的计算题的讲解视频&#xff0c;都是B站上一些优秀的UP主录制的&#xff0c;我觉得讲的还挺好的&#xff0c;对于应付考试&#xff0c;以不挂科为宗旨应该可以哈哈哈。 1…

FFmpeg解决视频播放加载卡顿问题(FFmpeg+M3U8分片)

FFmpeg解决视频播放加载卡顿问题(FFmpegM3U8分片) 在这静谧的时光里&#xff0c;我们能够更清晰地审视自己&#xff0c;思考未来的方向。每一步的坚实&#xff0c;都是对勇气的拥抱&#xff0c;每一个夜晚的努力&#xff0c;都是对未来的信仰。不要害怕独行&#xff0c;因为正是…

如何复制整个网页,这里提供详细步骤

谷歌Chrome中的检查元素功能可以帮助你查看网页上特定元素的HTML源代码。在本教程中,我将向你展示如何使用此功能提取任何网页的整个HTML代码。 网站的HTML源代码是web浏览器用来呈现页面并根据页面上应用的HTML、CSS和JS代码和规则进行显示的代码。网站的源代码,即网站的结…

串口通信USART

前言 通信的目的&#xff1a;将一个设备的数据传送到另一个设备&#xff0c;扩展硬件系统&#xff1b;单片机有了通信的功能&#xff0c;就能和别的模块互联&#xff1b; 通信协议&#xff1a;制定通信的规则&#xff0c;通信双方按照协议规则进行数据收发&#xff1b; 名称 …

游戏开发丨基于PyGlet的简易版Minecraft我的世界游戏

文章目录 写在前面我的世界PyGlet简介实验内容游戏按键程序设计引入文件 运行结果写在后面 写在前面 本期内容&#xff1a;基于PyGlet的简易版Minecraft我的世界游戏 实验环境&#xff1a; pycharmpyglet 项目下载地址&#xff1a;https://download.csdn.net/download/m0_6…

2024了,你还对国产ERP有刻板印象吗?

2024了&#xff0c;你还对国产ERP有刻板印象吗&#xff1f; 近年来&#xff0c;我国ERP市场重磅消息不断&#xff1a; 前不久&#xff0c;由上海博科资讯股份有限公司等参与研发的中国石油昆仑 ERP 在大庆石化公司成功单轨运行&#xff0c;中国石油从而成为国内首个使用国产高端…

YOLOv8 Ultralytics:使用Ultralytics框架进行FastSAM图像分割

YOLOv8 Ultralytics&#xff1a;使用Ultralytics框架进行FastSAM图像分割 前言相关介绍前提条件实验环境安装环境项目地址LinuxWindows 使用Ultralytics框架进行FastSAM图像分割参考文献 前言 由于本人水平有限&#xff0c;难免出现错漏&#xff0c;敬请批评改正。更多精彩内容…

计算机毕业设计-----SSH在线电影售票选座版网站平台系统

项目介绍 本项目为前后台项目&#xff0c;首先分为管理员和普通用户&#xff0c;游客。 游客可以进入首页&#xff0c;必须注册成为普通用户才能进行影片的购买。管理员和普通用户进行分权限登录&#xff0c;登录后进入不同页面。 普通用户登录后进入首页&#xff0c;首页有影…

Rust-所有权和移动语义

什么是所有权 拿C语言的代码来打个比方。我们可能会在堆上创建一个对象&#xff0c;然后使用一个指针来管理这个对象&#xff1a; Foo *p make_object("args");接下来&#xff0c;我们可能需要使用这个对象&#xff1a; use_object(p);然而&#xff0c;这段代码之…

AI 图像自动补全 Uncrop 工具介绍

ClipDrop Uncrop是一款基于AI的图像自动补全工具&#xff0c;由StabilityAI旗下的Clipdrop开发。通过利用StableDiffusionXL开发的算法和深度学习技术&#xff0c;Uncrop可以对用户上传的图片进行自动扩展和补全&#xff0c;改变图片尺寸&#xff0c;使得图像内容得到更完整的呈…

mysql中DATE_FORMAT() 函数详解

mysql中DATE_FORMAT() 函数详解 一. 说明 在 MySQL 中&#xff0c;DATE_FORMAT() 函数用于将日期/时间类型的值按照指定的格式进行格式化输出。它的一般语法如下&#xff1a; DATE_FORMAT(date, format)其中&#xff0c;date 参数是要被格式化的日期/时间值&#xff0c;form…

Windows系统下python版本Open3D-0.18.0 的快速安装与使用

目录 一、安装Anaconda3二、安装open3d三、测试代码四、结果展示五、测试数据 Windows系统下python版本Open3D-0.18.0 的快速安装与使用由CSDN点云侠原创&#xff0c;爬虫自重。如果你不是在点云侠的博客中看到该文章&#xff0c;那么此处便是不要脸的爬虫。 一、安装Anaconda…

极海APM035电机驱动板评测

首先感谢面包板社区提供的评测机会&#xff0c;技术支持服务也非常到位&#xff0c;爆赞&#xff01; 1. 摸一摸硬件资料 板子工整漂亮&#xff0c;用料足。上电真图&#xff1a; 原理图还是挺模块挺清晰的&#xff0c;但是这个开发板没有手册&#xff0c;没有个quickstart的…

【2023我的编程之旅】系统学习C语言easyx图形库心得体会

目录 引言 C语言基础知识回顾 easyx图形库介绍 如何快速学习easyx图形库 学习笔记积累 学习成果展示 学习拓展 总结 引言 首先说一下我为什么要学习C语言easyx图形库。我接触C语言easyx图形库是在我今年一月份的时候&#xff0c;也是机缘巧合之下偶然在B站上看到了鸣人…

C++力扣题目450--删除二叉搜索树中的节点

给定一个二叉搜索树的根节点 root 和一个值 key&#xff0c;删除二叉搜索树中的 key 对应的节点&#xff0c;并保证二叉搜索树的性质不变。返回二叉搜索树&#xff08;有可能被更新&#xff09;的根节点的引用。 一般来说&#xff0c;删除节点可分为两个步骤&#xff1a; 首先…