数据结构和算法|堆排序系列问题(一)|堆、建堆和Top-K问题

在这里不再描述大顶堆和小顶堆的含义,只剖析原理层面。

主要内容来自:Hello算法

文章目录

  • 1.堆的实现
    • 1.1 堆的存储与表示过程
    • 1.2 访问堆顶元素
    • 1.4元素出堆
  • 2.⭐️建堆
    • 2.1 方法一:借助入堆操作实现
    • 2.2 ⭐️方法二:通过遍历堆化实现
  • 应用:Top-K问题
    • ⭐️方法一:遍历选择
    • 方法二:排序
    • ⭐️方法三:堆

1.堆的实现

1.1 堆的存储与表示过程

完全二叉树非常适合用数组来进行表示,而堆就是一颗完全二叉树,所以我们可以使用数组来存储堆。也就是说,堆的逻辑结构是一颗完全二叉树,它的物理结构(底层存储)是一个数组。

对于一个给定索引 i i i,其左子树和右子树索引分别为 2 i + 1 2i + 1 2i+1 2 i + 2 2i + 2 2i+2,其父节点的索引为 ( i − 1 ) / 2 (i-1)/2 (i1)/2(向下取整)。

封装索引的映射公式:

//获取左子节点的索引
int left(int i) {
	return 2 * i + 1;
}
//获取右子节点的索引
int right(int i) {
	return 2 * i + 2;
}
//获取父节点的索引
int parent(int i) {
	return (i - 1) / 2;
} 

1.2 访问堆顶元素

堆顶元素即为二叉树的根结点,也就是列表的首元素 ```cpp //访问堆顶元素 int peek() { return maxHeap[0]; } ``` ## ⭐️1.3元素入堆 该环节非常重要。

对于一个给定元素 val ,

  • 将其添加到堆底。添加到堆底后, val 可能大于堆中其他元素,所以我们需要恢复从出啊如结点到根结点的路径上的各个节点,这个操作就是堆化(heapify)
  • 从入堆结点开始,从底到顶执行堆化。我们比较插入节点与其父节点的值,如果插入节点更大,则将它们交换。然后继续执行此操作,从底至顶修复堆中的各个节点,直至越过根节点遇到无须交换的节点时结束。

动态流程可以查看文章:3. 元素入堆

我们应该分析一下入堆的时间复杂度,设节点总数为 n n n,则树的高度为 O ( l o g n ) O(logn) O(logn)。所以堆化操作的循环论述最多为 O ( l o g n ) O(logn) O(logn)
综上,元素入堆操作的时间复杂度为 O ( l o g n ) O(logn) O(logn)

void push(int val) {
	//添加节点minHeap是一个数组
	maxHeap.push_back(val);
	//从底至顶堆化
	siftUp(size() - 1);
}
//从节点i开始,从底至顶堆化操作
void siftUp(int i) {
	while (true) {
		//获取节点 i 的父节点
		int p = parent(i);
		//当“越过根节点”或“节点无须修复”时,结束堆化
		if (p < 0 || maxHeap[i] <= maxHeap[p]) 
			break;
		//交换两个结点
		swap(maxHeap[i], maxHeap[p]);
		//循环向上堆化
		i = p;
	}
}

再次强调:元素入堆的时间复杂度为 O ( l o g n ) O(logn) O(logn)

1.4元素出堆

元素出堆和我们一般想的所谓直接直接弹出不同,因为如果直接弹出,那么我想想要修复堆结构变得极其困难。为了尽量减少元素索引的变动,我们这样操作出堆:

  1. 交换堆顶元素与堆底元素(交换根结点与最右叶子结点)。
  2. 交换完成后,将堆底从列表中删除(由于已经交换,因此实际上删除的是原来的堆顶元素)。
  3. 从根结点开始,从顶至底执行堆化操作(下溯)。

“从顶至底堆化”的操作方向与“从底至顶堆化”相反,我们将根节点的值与其两个子节点的值进行比较,将最大的子节点与根节点交换。然后循环执行此操作,直到越过叶节点遇到无须交换的节点时结束。

具体流程可以看4. 堆顶元素出堆,流程极为详细。

时间复杂度分析,从顶至底的堆化,很明显时间复杂度仍然是O(logn)。

/* 元素出堆 */
void pop() {

/* 从节点 i 开始,从顶至底堆化 */
void siftDown(int i) {

2.⭐️建堆

给定你任意一个列表,我们想要使用其所有元素来构建一个堆,这个过程被称为“建堆操作”。

2.1 方法一:借助入堆操作实现

首先我们维护一个空堆,然后依次对每个元素执行“入堆操作”,即现将元素添加至堆的尾部,然后“从底至顶”堆化即可。

至此我们可以维护一个真正的堆了,而且肯定是根结点最先被构建出来。

每当一个元素入堆,堆的长度就加一。由于节点是从顶到底依次被添加进二叉树的,因此堆是“自上而下”构建的。

设元素数量为 n n n,每个元素的入堆操作使用 O ( l o g n ) O(logn) O(logn)时间,所以整个建堆方法的时间复杂度为:
O ( n l o g n ) O(nlogn) O(nlogn)

2.2 ⭐️方法二:通过遍历堆化实现

这是一个更高效的建堆方法,共分为两步:

  • 将列表所有元素原封不动添加到堆中,此时堆的性质尚未得到满足;
  • 倒序遍历堆(层序遍历的倒序),依次对每个非叶节点执行“从顶至底堆化”

每当堆化一个结点后,以该节点为根结点的子树就形成了一个合法的子堆。

而由于是倒序遍历,因此堆是“自下而上”构建的。(之所以选择倒序遍历,是因为这样能够保证当前节点之下的子树已经是合法的子堆,这样堆化当前节点才是有效的。)

并且由于叶子结点没有子结点,因此他们天然就是合法的子堆,无须堆化。

/* 构造方法,根据输入列表建堆 */
MaxHeap(vector<int> nums) {
	//将列表元素原封不动添加进堆
	maxHeap = nums;
	//堆化出也节点以外的其他所有节点
	for (int i = parent(size() - 1); i >= 0; i--) {
		siftDown(i);
	}
}

时间复杂度分析:

  • 假设完全二叉树的节点数量为 n n n,则叶节点数量为 ( n + 1 ) / 2 (n+1)/2 (n+1)/2。因此需要堆化的节点数量为 ( n − 1 ) / 2 (n-1)/2 (n1)/2
  • 从顶至底堆化的过程中,每个节点最多堆化到叶节点,因此最大迭代次数为二叉树高度 l o g n logn logn

将上述两者相乘,可得到建堆过程的时间复杂度为 O ( n l o g n ) O(nlogn) O(nlogn)

但这只是一种粗略的估算,严格来说,我们应该进行详细的计算,基本的思想就是高度较高的节点堆化需要的迭代次数较多,较低节点堆化的迭代次数较少。
我们需要对各层的“节点数量X结点高度”求和,得到所有节点的堆化迭代次数的总和
最终的结果是 O ( n ) O(n) O(n)

应用:Top-K问题

Question:
给定一个长度为n的无序数组nums,请返回数组中最大的k个元素。

⭐️方法一:遍历选择

暴力求解!我们进行 k 轮遍历,分别在每轮中提取第 1 、 2 、 . . . 、 k 1、2、...、k 12...k大的元素,时间复杂度为 O ( n k ) O(nk) O(nk)
当然了,此方法只适用于 k < < n k << n k<<n 的情况,因为当 k k k n n n比较接近时,其时间复杂度趋向于 O ( n 2 ) O(n^2) O(n2),非常耗时:

k = n k=n k=n 时,我们可以得到完整的有序序列,此时等价于“选择排序”算法。

算法步骤如下:

  • 初始化:指定一个变量来记录当前需要考虑的数组的结尾位置。
  • 重复寻找最大值:遍历当前未处理的数组部分,找到最大元素。
  • 交换元素: 将找到的最大元素与当前考虑的数组的最后一个元素交换。
  • 调整考虑范围: 减少考虑数组范围的长度。
  • 重复: 重复以上步骤 𝑘。
vector<int> topKsearch(vector<int>& nums, int k) {
	int n = nums.size();
	int end = n - 1 //初始化结束索引
	for (int i = 0; i < k; i++) {
		int maxIndex = 0;
		for (int j = 0; j <= end; j++) {
			if (nums[j] > nums[maxIndex]) 
				maxIndex = j;
		} 
		//交换最大元素到当前考虑的数组的末尾
		swap(nums[maxIndex], nums[end]);
		end--;
	}
}

方法二:排序

这个思路也比较简单,先对数组进行排序,然后返回最右边的k个 元素,时间复杂度为: O ( n l o g n ) O(nlogn) O(nlogn)
显然,该方法“超额”完成任务了,我们其实只需要找出最大的k个元素即可。

vector<int> topKsort(vector<int>& nums, int k) {
    sort(nums.begin(), nums.end(), greater<int>()); // 降序排序
    vector<int> result;
    for (int i = 0; i < k; i++) {
        result.push_back(nums[i]);
    }
    return result;
}

⭐️方法三:堆

堆天生就适合解决这样的Top-K问题。

  1. 初始化一个小顶堆,其顶堆元素最小;
  2. 现将数组的前 k k k个元素依次入堆,也就是说我们只维护大小为 k k k的堆;
  3. 从第 k + 1 k+1 k+1个元素开始,如果当前元素大于堆顶元素,则将堆顶元素出堆,并将当前元素入堆。
  4. 遍历整个nums后,堆中保存的就是最大的k个元素。

具体的实验流程可以看《Hello World》文章:方法三:堆

时间复杂度分析:
我们一共执行n次入堆和出堆,堆的最大长度为 k k k,所以时间复杂度为 O ( n l o g k ) O(nlogk) O(nlogk)
该方法效率极高,当 k k k较小时,时间复杂度趋向于 O ( n l o g k ) O(nlogk) O(nlogk);当 k k k较大时,时间复杂度也不会超过 O ( n l o g n ) O(nlogn) O(nlogn)
此外,该方法适用于动态数据流的使用场景。在不断加入数据时,我们可以持续维护堆内的元素,从而实现最大的 k k k个元素的动态更新。

代码如下:

vector<int> topKHeap(vector<int> &nums, int k) {
	//初始化一个最小堆
	priority_queue<int, vector<int>, gereater<int>> heap;
	//先将前k个元素入堆
	for (int i = 0; i < k; i++) {
		heap.push(nums[i]);
	}
	//遍历整个数组,维护大小为k的小顶堆
	for (int i = k; i < nums.size(); i++) {
		//若当前元素大于堆顶元素,则将堆顶元素出堆、当前元素入堆
		if (nums[i] > heap.top()) {
			heap.pop();
			heap.push(nums[i]);
		}
	}
	//将堆中的元素收集到结果像两种
	vector<int> result;
	while (!heap.empty()) {
		result.push_back(heap.top());
		heap.pop();
	}
	return result;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/635359.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Java 多线程抢红包

问题需求 一个人在群里发了1个100元的红包&#xff0c;被分成了8个&#xff0c;群里有10个人一起来抢红包&#xff0c;有抢到的金额随机分配。 红包功能需要满足哪些具体规则呢? 1、被分的人数抢到的金额之和要等于红包金额&#xff0c;不能多也不能少。 2、每个人至少抢到1元…

Ubuntu Nerfstudio安装

https://blog.csdn.net/qq_30565883/article/details/133778529 https://blog.csdn.net/weixin_52581013/article/details/137982846 https://zhuanlan.zhihu.com/p/654394767 1. 结论 因为需要安装tiny-cuda-nn&#xff0c;然而 所以我之前的在笔记本上安装就白费了&#xf…

基于python的k-means聚类分析算法,对文本、数据等进行聚类,有轮廓系数和手肘法检验

K-means算法是一种常见的聚类算法&#xff0c;用于将数据点分成不同的组&#xff08;簇&#xff09;&#xff0c;使同一组内的数据点彼此相似&#xff0c;不同组之间的数据点相对较远。以下是K-means算法的基本工作原理和步骤&#xff1a; 工作原理&#xff1a; 初始化&#x…

QT C++ QTableWidget 演示

本文演示了 QTableWidget的初始化以及单元格值改变时响应槽函数&#xff0c;打印单元格。 并且&#xff0c;最后列不一样,是combobox &#xff0c;此列的槽函数用lambda函数。 在QT6.2.4 MSVC2019 调试通过。 1.界面效果 2.头文件 #ifndef MAINWINDOW_H #define MAINWINDOW…

使用API有效率地管理Dynadot域名,进行域名邮箱的默认邮件转发设置

关于Dynadot Dynadot是通过ICANN认证的域名注册商&#xff0c;自2002年成立以来&#xff0c;服务于全球108个国家和地区的客户&#xff0c;为数以万计的客户提供简洁&#xff0c;优惠&#xff0c;安全的域名注册以及管理服务。 Dynadot平台操作教程索引&#xff08;包括域名邮…

【四数之和】python,排序+双指针

四层循环&#xff1f;&#xff08;doge) 和【三数之和】题目很类似 class Solution:def fourSum(self, nums: List[int], target: int) -> List[List[int]]:nums.sort()#a,b,c,d四个数&#xff0c;先固定两个数&#xff0c;那就是双指针问题了&#xff0c;令ba1&#xff…

【数据结构】【C语言】堆~动画超详细解读!

目录 1 什么是堆1.1 堆的逻辑结构和物理结构1.2 堆的访问1.3 堆为什么物理结构上要用数组?1.4 堆数据上的特点 2 堆的实现2.1 堆类型定义2.2 需要实现的接口2.3 初始化堆2.4 销毁堆2.5 堆判空2.6 交换函数2.7 向上调整(小堆)2.8 向下调整(小堆)2.9 堆插入2.10 堆删除2.11 //堆…

若依解决使用https上传文件返回http路径问题

若依通过HTTPS请求进行文件上传时却返回HTTP的文件链接地址&#xff0c;主要原因是使用了 request.getRequestURL 获取链接地址。 解决办法&#xff1a; 在nginx配置文件location处加上&#xff1a;proxy_set_header X-Forwarded-Scheme $scheme; 然后代码通过request.getHea…

【跳坑日记】暴力解决Ubuntu SSH报错: Failed to start OpenBSD Secure Shell server

报错环境说明&#xff1a; 服务器环境&#xff1a;Ubuntu 20.04 错误内容 最近服务器突然报错&#xff0c;提示如下图信息&#xff1a; 搜素了各种问答&#xff0c;国内的回答大多数是用 ssh-keygen -A命令来解决&#xff0c;但最终也无法登录服务器。 最终搜索到ask ubun…

比较kube-proxy模式:iptables还是IPVS?

kube-proxy是任何 Kubernetes 部署中的关键组件。它的作用是将流向服务&#xff08;通过集群 IP 和节点端口&#xff09;的流量负载均衡到正确的后端pod。kube-proxy可以运行在三种模式之一&#xff0c;每种模式都使用不同的数据平面技术来实现&#xff1a;userspace、iptables…

go-zero 实战(3)

引入 Redis 在之前的 user 微服务中引入 redis。 1. 修改 user/internal/config/config.go package configimport ("github.com/zeromicro/go-zero/core/stores/cache""github.com/zeromicro/go-zero/zrpc" )type Config struct {zrpc.RpcServerConfMys…

代码随想录算法训练营第36期DAY35

DAY35 122买卖股票的最佳时机ii 很巧妙&#xff0c;也很难想到&#xff1a;计算每天的利润&#xff08;今天卖出&#xff0c;昨天买入的利润&#xff09;&#xff0c;只取正数相加。 class Solution {public: int maxProfit(vector<int>& prices) { int…

【机器学习300问】93、到底什么是优化器optimizer?

本文是对之前我写的梯度下降优化算法相关内容进行一次简要总结。在学习PyTorch框架的过程中&#xff0c;会遇到“优化器”&#xff08;optimizer&#xff09;这个概念。我想用通俗易懂的方式&#xff0c;说说优化器到底是个什么东西&#xff0c;并在此基础上&#xff0c;将前文…

Qt代码初识

文章目录 Qt代码初识1. Qt Hello World 程序1.1 使⽤ "按钮" 实现1.1.1 纯代码⽅式实现1.1.2 可视化操作实现 1.2 使⽤ "标签" 实现1.2.1 纯代码⽅式实现1.2.2 可视化操作实现 2. 项⽬⽂件解析2.1 .pro ⽂件解析2.2 widget.h ⽂件解析2.3 main.cpp ⽂件解析…

SwanLab入门深度学习:BERT IMDB文本情感分类

基于BERT模型的IMDB电影评论情感分类&#xff0c;是NLP经典的Hello World任务之一。 这篇文章我将带大家使用SwanLab、transformers、datasets三个开源工具&#xff0c;完成从数据集准备、代码编写、可视化训练的全过程。 观察了一下&#xff0c;中文互联网上似乎很少有能直接…

Apache Log4j Server 反序列化命令执行漏洞(CVE-2017-5645)

漏洞复现环境搭建请参考 http://t.csdnimg.cn/MxmId 漏洞版本 Apache Log4j 2.8.2之前的2.x版本 漏洞验证 &#xff08;1&#xff09;开放端口4712 漏洞利用 &#xff08;1&#xff09;ysoserial工具获取 wget https://github.com/frohoff/ysoserial/releases/download/v0…

强化学习算法

从上图看出&#xff0c;强化学习可以分成价值/策略、随机策略/确定策略、在线策略/离线策略、蒙特卡洛/时间差分这四个维度。这里分析了基础算法中除了在线策略/离线策略以外的其他维度。 &#xff08;一&#xff09;基础知识 一、基础概念 重点概念&#xff1a;状态S、动作A、…

浏览器自动化~插件推荐Automa

引言 作为一款现代浏览器&#xff0c;得自动化吧&#xff0c;自主完成那些日复一日的重复性任务&#xff0c;开启音乐啥的不在话下~。而你则可以专注于其他更有意义的事情&#xff0c;如享受音乐带来的愉悦。但如果你对编写脚本一窍不通&#xff0c;又该如何实现这一愿景呢&am…

华为机考入门python3--(28)牛客28-素数伴侣

分类&#xff1a;质数、素数、贪心算法、矩阵 知识点&#xff1a; 素数里除了2&#xff0c;都是奇数 奇奇偶&#xff0c;偶&#xff0b;偶偶 对矩阵求和 sum(map(sum, matrix)) 查找元素 3 在列表中的索引 my_list.index(3) 题目来自【牛客】 质数又称素数&#xff0c;是指…

一种综合评价及决策方法:层次分析法AHP

大家好&#xff0c;层次分析法(Analytic Hierarchy Process&#xff0c;AHP)是一种多准则决策方法&#xff0c;它帮助决策者处理复杂的决策问题&#xff0c;将其分解成层次结构&#xff0c;然后通过两两比较来确定各个层次的因素之间的相对重要性。这种分析方式允许决策者对问题…