【算法 高级数据结构】树状数组:一种高效的数据结构(一)

🚀个人主页:为梦而生~ 关注我一起学习吧!
💡专栏:算法题、 基础算法~赶紧来学算法吧
💡往期推荐
【算法基础 & 数学】快速幂求逆元(逆元、扩展欧几里得定理、小费马定理)
【算法基础】深搜


文章目录

  • 1 引言
    • 1.1 树状数组的概念
    • 1.2 树状数组的应用场景
  • 2 基础知识
    • 2.1 二进制索引的概念和性质
    • 2.2 前缀和的概念和计算
  • 3 树状数组的定义和数学推导
    • 3.1 通俗易懂的解释什么是树状数组※
    • 3.2 树状数组的数学推导※


1 引言

1.1 树状数组的概念

树状数组(Binary Indexed Tree,BIT)是一种数据结构,用于高效地处理数组的动态查询和更新操作。它可以在O(log n)的时间复杂度内完成单点更新和前缀和查询操作。树状数组常用于解决数组频繁更新和查询前缀和的问题,比如求解逆序对、区间和等。

在这里插入图片描述

1.2 树状数组的应用场景

  1. 动态查询问题:树状数组非常适用于需要动态查询某个区间内元素和的场景。
  2. 频繁更新问题:树状数组也适用于频繁更新数组元素的情况。
  3. 逆序对问题:逆序对问题是一个常见问题,即找出数组中所有满足i<ja[i]>a[j](i, j)对。树状数组可以在O(nlogn)的时间复杂度内解决这个问题。

2 基础知识

2.1 二进制索引的概念和性质

二进制索引,也称为树状数组或有限差分数组,是一种特殊的数据结构,用于高效地处理数组中的前缀和查询。它的核心思想是利用二进制表示中的每一位来快速计算前缀和,从而实现高效的查询和更新操作。

在这里插入图片描述

概念

二进制索引的主要概念是基于数组元素的二进制表示来构建索引。具体来说,对于数组中的每个元素,我们可以将其下标转换为二进制形式,并根据二进制位来构建索引。通过维护这些索引,我们可以快速计算数组的前缀和,从而实现高效的查询和更新操作。

性质

  • 前缀和查询的高效性:二进制索引可以在O(log n)的时间复杂度内计算数组的前缀和。这是因为它利用了二进制表示的特性,通过跳跃式地计算不同位上的前缀和,实现了快速查询。
  • 单点更新的高效性:与前缀和查询一样,二进制索引也可以在O(log n)的时间复杂度内完成单点更新操作。当数组中的某个元素发生变化时,只需要更新对应的索引,即可快速反映到前缀和上。
  • 空间效率:二进制索引的空间复杂度与原始数组相同,即O(n)。它不需要额外的存储空间来维护索引结构,因此具有较高的空间效率。

2.2 前缀和的概念和计算

前缀和(Prefix Sum)是一个数组的概念,指的是数组中从第一个元素开始到某个位置元素(包括该位置元素)的总和。前缀和通常用于快速计算某个区间的和,避免了对每个元素进行逐一相加的操作,从而提高计算效率。

计算前缀和的方法很简单,通常是通过迭代数组中的每个元素,并将当前元素与前一个元素的前缀和相加,得到当前元素的前缀和。第一个元素的前缀和就是它本身。

例如,给定一个数组 arr = [1, 2, 3, 4, 5],它的前缀和数组 prefix_sum 可以这样计算:

prefix_sum[0] = arr[0] = 1  
prefix_sum[1] = arr[0] + arr[1] = 1 + 2 = 3  
prefix_sum[2] = arr[0] + arr[1] + arr[2] = 1 + 2 + 3 = 6  
prefix_sum[3] = arr[0] + arr[1] + arr[2] + arr[3] = 1 + 2 + 3 + 4 = 10  
prefix_sum[4] = arr[0] + arr[1] + arr[2] + arr[3] + arr[4] = 1 + 2 + 3 + 4 + 5 = 15

所以,前缀和数组 prefix_sum 为 [1, 3, 6, 10, 15]。


3 树状数组的定义和数学推导

3.1 通俗易懂的解释什么是树状数组※

在这里插入图片描述

对于一个数组,我们通常需要这样的操作:

  1. 修改某个元素的值
  2. 求一段区间的和

如果用朴素的做法,我们通常需要开一个数组,保存下来所有元素,每查询一次,遍历一次数组

但这会使得求和操作的时间复杂度达到 O ( n ) O(n) O(n),但如果数据量和查询次数达到上百万,这样的效率太低了

  • 但有人可能会想到,把数组中的元素两两求和,保存到另一个数组中:
    在这里插入图片描述

这样我们在计算的时候就会节省一半的时间,修改数据的时候也就是多改一个数字而已,但是对于很大的数据量,还是很慢。

  • 那我们可以再将这一层元素两两求和,往上叠加一层,直到只剩一个元素为止:
    在这里插入图片描述

这样即使要求和的数字很多,我们也可以利用这些额外的数组计算出需要的答案(用空间换时间的思想)

例如:要计算前14个数字的和
在这里插入图片描述
只需要计算这样4个数字就行
在这里插入图片描述

即使要计算前一百万个数字的和,我们也只需要进行10~20次加法

这样将查询的时间复杂度降到了 O ( log ⁡ n ) O(\log n) O(logn),效率提升了很多

观察这个数组我们可以发现,数组中的某些数字是不会用到的,大家可以手动模拟一下,所有层的第偶数个数字在计算时都不会被用到,都有更好的方案来替代
在这里插入图片描述

去除掉不会被用到的数字之后,剩下的数字正好是 n n n个,这与数组的长度是一样的

所以,我们可以用一个与原数组长度相同的数组来装下这些数,这个数组就是一颗树状数组,数组中的每一个元素都对应下面的每一个区间,这些区间表示的都是每个对应的区间和
在这里插入图片描述
求和时,我们只需要找到对应的区间,将这些区间相加即可找到答案

修改某个数据时,我们也只需要向上找到包含它的所有区间修改即可

所有查询以及修改元素的操作,都可以在 O ( log ⁡ n ) O(\log n) O(logn)的时间复杂度内完成

3.2 树状数组的数学推导※

对于一个数 x x x,我们可以把它分解成二进制的形式:
2 i k + 2 i k − 1 + 2 i k − 2 + . . . + 2 i 1 2^{i_{k}}+2^{i_{k-1}} + 2^{i_{k-2}} + ... + 2^{i_{1}} 2ik+2ik1+2ik2+...+2i1其中, 2 i k 2^{i_k} 2ik表示 x x x的最高二进制位, 2 i 1 2^{i_{1}} 2i1表示最低二进制位 i k ≥ i k − 1 ≥ . . . ≥ i 1 ( k ≤ log ⁡ x ) i_{k} \geq i_{k-1} \geq ... \geq i_{1} (k \leq \log x) ikik1...i1(klogx)

假设我们要求 1 − x 1-x 1x的和,我们可以把区间分成 k k k个区间

( x − 2 i 1 , x ] (x-2^{i_1},x] (x2i1,x]
( x − 2 i 1 − 2 i 2 , x − 2 i 1 ] (x-2^{i_1}-2^{i_2},x-2^{i_1}] (x2i12i2,x2i1]
. . . ... ...
( 0 , x − 2 i 1 − 2 i 2 − . . . − 2 i k − 1 ] (0,x-2^{i_1}-2^{i_2}-...-2^{i_{k-1}}] (0,x2i12i2...2ik1]

这样我们把 x x x分成了 log ⁡ x \log x logx个区间,如果我们把所有区间的和都预处理出来,最多只需要加 log ⁡ x \log x logx次就可以将区间和算出来

如何预处理这些数呢?

我们看一下这些区间有什么性质:

  • 首先,每个区间都包含 2 i 2^i 2i个数
  • 每个区间 ( L , R ] (L,R] (L,R]的长度一定是 R R R的二进制表示的最后一位 1 1 1所对应的次幂

所以,利用lowbit函数,我们可以把贝格区间简化为 ( R − l o w b i t ( R ) + 1 , R ] (R-lowbit(R)+1,R] (Rlowbit(R)+1,R](该函数的定义如下)

def lowbit(x):
	return x & -x

于是,我们如果想用数组来记录区间和,可以用c[R]来表示区间和:c[x] = a[x - lowbit(x) + 1, x]

下面来看一下c[x]之间的关系:

在这里插入图片描述

经过这样的数学推导之后,我们得到了与上面介绍中一致的形式

下面来介绍一下如何计算的数学推导

  • 给出x,如何找到x的所有子节点

假设 x > 0 x > 0 x>0,则必然存在最后一位 1 1 1,假设这一位 1 1 1后面有 k k k 0 0 0,我们让 x − 1 x-1 x1,则后面有连续的 k k k 1 1 1,这每个 1 1 1都对应一个儿子,我们找每个儿子只需要每次减去最后一位 1 1 1,一直减 k k k次,直到变成 0 0 0

二进制表示解释如下:

c[x] ~ (x - lowbit(x) + 1, x]
x - 1 ~ ...1000(k个0)
儿子区间1 : (...0111, ...0110]
儿子区间2 : (...0110, ...0100]
儿子区间3 : (...0100, ...0000]
  • 如何通过子节点找父节点?

这个与找儿子结点是相反的,是一个迭代的过程,通常用于修改结点

假设给定一个x,修改完a[x]之后要修改哪些区间和?

假设 p p p是一个父节点,它的二进制表示要满足要找子节点之前的形式(最后一位1后面跟着若干个0),那么它的子节点一定满足那个1变成0,后面跟若干个1,后面是若干个0

我们只需要把上面的过程逆过来就可以了

每次加上一个lowbit(x),就找到直接父节点,然后一直往上加,直到加到那个父节点的位置是1,一共加 log ⁡ x \log x logx次,就可以找到所有父节点

对于一个要修改的a[x],修改操作的代码是:

for(int i = x; i <= n; i += lowbit(i)) tr[i] += c;

要想明白的是:为什么改完x之后,只需要更新tr数组的最多这么logx个位置(结合上面的黑白图)

查询(1~x的区间和)操作的代码(找子区间):

for(int i = x; i; i -= lowbit(x)) res += tr[i];

部分内容及灵感来源:
https://www.bilibili.com/video/BV1ce411u7qP/
https://www.acwing.com/file_system/file/content/whole/index/content/172493/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/440012.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【详识C语言】自定义类型之一:结构体

本文重点 结构体 结构体类型的声明 结构的自引用 结构体变量的定义和初始化 结构体内存对齐 结构体传参 结构体实现位段&#xff08;位段的填充&可移植性&#xff09; 结构体 结构体的声明 结构的基础知识 结构是一些值的集合&#xff0c;这些值称为成员变量。结构的每个…

21、状态模式(行为性模式)

版本一、get状态指针 #include <iostream> using namespace std;//前置声明 class Context;//状态 class State{ public://4个状态virtual void toUp (Context& context){ }virtual void toDown (Context& context){ }virtual void toLeft (Context& cont…

Linux报错排查-刚安装好的ubuntu系统无法ssh连接

Linux运维工具-ywtool 目录 一.问题描述二.问题解决2.1 先给ubuntu系统配置阿里云源2.2 安装openssh-server软件2.3 在尝试ssh连接,可以连接成功了 三.其他命令 一.问题描述 系统:ubuntu-18.04-desktop-amd64 系统安装完后,想要通过xshell软件连接系统,发现能Ping通系统的IP,但…

视频水印怎么轻松去除?这三款神器让您直呼过瘾!

在现代社会&#xff0c;视频内容日益丰富多样&#xff0c;但有时我们更希望获得视频中的文字文稿&#xff0c;以便于搜索、编辑或传播。下面我将为您介绍三款优秀的视频转文字工具&#xff0c;它们能够帮助您快速、准确地将视频内容转换为可编辑的文字格式。让我们一起来看看这…

STM32的启动流程分析 和 一些底层控制的原理

阅读引言&#xff1a; 阅读本文之后&#xff0c; 你将对单片机&#xff0c; 甚至是嵌入式系统&#xff0c; 或者是传统的PC机系统的启动流程有一个大致的了解&#xff0c; 本文更加偏向于单片机的启动流程分析。 目录 一、基础知识 1.STM32系列的微控制器&#xff08;mcu&…

【打工日常】使用docker部署IT运维管理平台CAT

​一、CAT介绍 CAT是一个专为 IT 运维从业者打造的一站式解决方案平台&#xff0c;包含资产管理、工单、工作流、仓储等功能模块。 本项目是celaraze/chemex重构版&#xff0c;原项目chemex名称弃用&#xff1b;CAT采用全新架构设计&#xff0c;大量提升使用体验的细节&#xf…

拼多多1000元虚拟店铺免4万保证金

众所周知拼多多现在流量非常大&#xff0c;虚拟也算是蓝海&#xff0c;想做的人大部分都被保证金拦在门外&#xff0c;高达4W的保证金不是每个人都能承受的&#xff0c;正好在当下有一个方法可以解决这个苦恼。 拼多多虚拟店铺免保证金玩法现在处于前期阶段&#xff0c;很多人…

付强:基于注意力机制的听觉前端处理 | 嘉宾公布

一、智能家居与会议系统专题论坛 智能家居与会议系统专题论坛将于3月28日同期举办&#xff01; 智能会议系统它通过先进的技术手段&#xff0c;提高了会议效率&#xff0c;降低了沟通成本&#xff0c;提升了参会者的会议体验。对于现代企业、政府机构和学术界是不可或缺的。在这…

5款免费且出色的ai智能ppt制作软件,值得拥有!

如果说2023是AI崛起的元年&#xff0c;那2024无疑是AI应用的真正元年&#xff0c;人们对AI技术逐渐回归理性&#xff0c;关注的焦点也从产品层转向应用层&#xff0c;探索AI如何更好地赋能业务&#xff0c;或是重塑工作流程&#xff0c;让AI真正为自己所用。 在数字化盛兴的当…

如何利用生成式人工智能助力短视频剧本创作?

短视频已成为现代人获取娱乐和信息的一种流行方式。不同于传统的电影和电视剧&#xff0c;短视频的时长通常较短&#xff0c;内容形式多样&#xff0c;更适合快节奏的社会生活。本文将讨论如何编写短视频剧本&#xff0c;以及它与传统故事在结构和内容上的区别。 简介 短视频剧…

docker拉取镜像失败的解决方案大全

更换国内源 创建或修改 /etc/docker/daemon.json 文件&#xff0c;修改&#xff1a; {"registry-mirrors" : ["https://registry.docker-cn.com","http://hub-mirror.c.163.com","https://docker.mirrors.ustc.edu.cn","https:…

图文并茂的讲清楚Linux零拷贝技术

今天我们来聊一聊Linux零拷贝技术&#xff0c;今天我们以一个比较有代表性的技术sendfile系统调用为切入点&#xff0c;详细介绍一下零拷贝技术的原理。 1.零拷贝技术简介 Linux零拷贝技术是一种优化数据传输的技术&#xff0c;它可以减少数据在内核态和用户态之间的拷贝次数&…

c8t6,hal库,pwm输出

1.cubemx配置 设置分配系数&#xff1a;71&#xff1b; 自动重装在计数值&#xff1a;499&#xff1b; 72MHZ/(711) 1MHZ&#xff1b; 1MHZ即1秒计数1000000次&#xff1b; 即1毫秒计数1000次&#xff1b; 自动重装载计数值设置为499&#xff1b;即0.5ms一个周期&#xff…

新方法简单无成本申请网易云/腾讯音乐人

外面接单申请的音乐人是原创音乐人&#xff0c;通过这个方法申请的只是翻唱音乐人 如果你不想通过音乐平台赚钱的话&#xff0c;其实这两个音乐人都没什么区别 无非就是原创音乐人多了个作词、作曲的标签 翻唱音乐人一样可以领酷狗会员 音乐人特权&#xff1a; 酷狗音乐人…

@require_PUTNameError: name ‘require_PUT‘ is not defined 解决方法

require_PUT 是一个自定义的装饰器&#xff0c;它在你的Django项目中并不存在。在Django中&#xff0c;没有内置的 require_PUT 装饰器&#xff0c;但你可以使用 require_http_methods 装饰器来限制视图函数接受的HTTP请求方法。 你可以将 require_PUT 替换为 require_http_me…

SPFA找负环

2024-01-31&#xff08;最短路径&#xff09;-CSDN博客 求负环的常用方法&#xff0c;基于spfa&#xff1a; 1.统计每个点入队的次数&#xff0c;如果有个点入队n次&#xff0c;则说明存在负环 2.统计当前每个点的最短路中包含的边数&#xff0c;如果某个点的最短路的所包含的边…

2024年新版CMS内容管理使用,不用回退老版本 使用最新小程序云开发cms内容模型

一&#xff0c;问题描述 最近越来越多的同学找石头哥&#xff0c;说cms用不了&#xff0c;其实是小程序官方最近又搞大动作了&#xff0c;偷偷的升级的云开发cms&#xff08;内容管理&#xff09;以下都称cms&#xff0c;不升级不要紧&#xff0c;这一升级&#xff0c;就导致我…

uniapp列表进入动画

一、目前使用的是uni-list-chat的uniapp组件,可以自己定义的样式 <template><view class="container"><uni-list-chat title="uni-app" avatar="https://qiniu-web-assets.dcloud.net.cn/unidoc/zh/unicloudlogo.png"note=&quo…

Linux 网络监控工具

企业依靠其网络基础设施向客户和最终用户提供数字服务&#xff0c;这些环境包括 Windows 和 Linux 网络设备。与 Windows 网络相比&#xff0c;带有 GUI 的 Windows 网络相对易于管理&#xff0c;而 Linux 网络提供了更大的灵活性和高级级别的自定义。 由于操作系统有助于部署…

mysql中两千万大表做时间范围查询很慢,怎么解决

预备知识 1、一个表的数据量达到好几千万或者上亿时&#xff0c;加索引的效果没那么明显啦。性能之所以会变差&#xff0c;是因为维护索引的B树结构层级变得更高了&#xff0c;查询一条数据时&#xff0c;需要经历的磁盘IO变多&#xff0c;因此查询性能变慢。 少量数据可以考…