B树:原理、操作及应用

B树:原理、操作及应用

  • 一、引言
  • 二、B树概述
    • 1. 定义与性质
    • 2. B树与磁盘I/O
  • 三、B树的基本操作
    • 1. 搜索(B-TREE-SEARCH)
    • 2. 插入(B-TREE-INSERT)
    • 3. 删除(B-TREE-DELETE)
  • 四、B树的C代码实现示例
  • 五、总结

一、引言

在现代计算机科学中,高效的数据存储和检索是许多应用程序成功的关键。B树(B-tree)是一种自平衡的树,它能够保持数据稳定有序,其插入与查询的时间复杂度都是对数级别的,非常适合于磁盘等辅助存储器的存取系统。本文将详细介绍B树的基本原理、基本操作,并通过伪代码和C代码示例来解释其实现。

在这里插入图片描述

二、B树概述

1. 定义与性质

B树是一种多叉树,每个节点可以包含多个关键字和多个子节点。一个m阶的B树(m≥2)满足以下性质:

  • 每个节点至多有m个孩子。
  • 除了根节点外,每个非叶子节点至少有⌈m/2⌉个孩子。
  • 根节点至少有两个孩子,除非它是叶子节点。
  • 所有叶子节点都在同一层,并且不带信息(可以视为外部节点或查找失败的节点)。
  • 非叶子节点包含n个关键字信息(K₁, K₂, …, Kₙ),且满足K₁ < K₂ < … < Kₙ。
  • 非叶子节点的第i个子树中的所有关键字都在K_{i-1}和K_i之间(其中,K₀表示一个比该节点所有关键字都小的值,K_{n+1}表示一个比该节点所有关键字都大的值)。

2. B树与磁盘I/O

由于磁盘I/O操作通常比内存操作慢得多,因此,在设计和实现数据结构时,尽量减少磁盘I/O次数是关键。B树的设计充分考虑了磁盘的存取特性,通过增加树的扇出(即每个节点的子节点数)来降低树的高度,从而减少了查找过程中所需的磁盘I/O次数。

三、B树的基本操作

1. 搜索(B-TREE-SEARCH)

B树的搜索操作与二叉搜索树类似,从根节点开始,根据关键字的大小决定向下搜索的路径,直到找到目标关键字或到达叶子节点为止。以下是B树搜索的伪代码示例:

B-TREE-SEARCH(x, k)
    i = 1
    while i ≤ x.n and k > x.key[i]
        i = i + 1
    if i ≤ x.n and k == x.key[i]
        return (x, i) // 返回包含关键字的节点和关键字在节点中的位置
    elseif x.leaf
        return NIL // 关键字不在树中
    else DISK-READ(x, c[i]) // 读取子节点
        return B-TREE-SEARCH(x.c[i], k) // 递归搜索子树

2. 插入(B-TREE-INSERT)

向B树中插入关键字的过程相对复杂,因为需要维护B树的性质。当向满节点插入新关键字时,需要进行分裂操作。以下是B树插入操作的伪代码框架:

B-TREE-INSERT(T, k)
    r = T.root
    if r.n == 2t - 1 // 根节点满了
        s = ALLOCATE-NODE() // 分配新节点作为根节点的子节点
        T.root = s
        s.leaf = FALSE
        s.n = 0
        s.c[1] = r
        B-TREE-SPLIT-CHILD(s, 1) // 分裂根节点
        B-TREE-INSERT-NONFULL(s, k) // 向非满的新根节点插入关键字
    else
        B-TREE-INSERT-NONFULL(r, k) // 直接向根节点插入关键字

// 辅助过程,向非满节点插入关键字
B-TREE-INSERT-NONFULL(x, k)
    // ... 省略具体实现细节,包括分裂操作等 ...

3. 删除(B-TREE-DELETE)

从B树中删除关键字同样需要维护B树的性质。删除操作可能比插入操作更复杂,因为可能需要合并节点或重新调整关键字。以下是B树删除操作的一个简要描述:

  • 如果要删除的关键字在叶子节点中,直接删除并调整节点大小。
  • 如果要删除的关键字在内部节点中,找到其前驱或后继替代该关键字,并递归删除前驱或后继。
  • 如果删除操作导致节点大小低于最小要求,可能需要从相邻兄弟节点借调关键字,或者合并节点。

四、B树的C代码实现示例

由于完整的B树C代码实现较长且复杂,这里仅提供一个简化的框架和关键部分的代码示例,以便读者理解其实现思路。

首先,我们定义B树节点的结构体和一些辅助函数:

#include <stdio.h>
#include <stdlib.h>
#include <stdbool.h>

#define MAX_KEYS 5
#define MAX_CHILDREN 6

typedef int KeyType;

typedef struct BTreeNode {
    int n; // 关键字数量
    KeyType keys[MAX_KEYS]; // 关键字数组
    struct BTreeNode *children[MAX_CHILDREN]; // 子节点指针数组
    bool is_leaf; // 是否为叶子节点
} BTreeNode;

// 创建新节点
BTreeNode* createNode(bool is_leaf) {
    BTreeNode* node = (BTreeNode*)malloc(sizeof(BTreeNode));
    node->n = 0;
    node->is_leaf = is_leaf;
    for (int i = 0; i < MAX_CHILDREN; i++) {
        node->children[i] = NULL;
    }
    return node;
}

// 分裂节点
void splitNode(BTreeNode* parent, int index, BTreeNode* child) {
    // 创建新节点,并分配中间关键字之后的元素
    BTreeNode* newNode = createNode(child->is_leaf);
    newNode->is_leaf = child->is_leaf;
    int mid = MAX_KEYS / 2;

    for (int i = mid + 1; i <= MAX_KEYS; i++) {
        newNode->keys[newNode->n] = child->keys[i];
        newNode->n++;
    }

    if (!child->is_leaf) {
        for (int i = mid + 1; i <= MAX_CHILDREN; i++) {
            newNode->children[newNode->n] = child->children[i];
            newNode->n++;
        }
    }

    // 将中间关键字上升到父节点
    parent->keys[index] = child->keys[mid];
    child->n = mid;

    // 插入新节点为父节点的一个子节点
    for (int i = parent->n; i > index; i--) {
        parent->keys[i] = parent->keys[i - 1];
        parent->children[i + 1] = parent->children[i];
    }
    parent->children[index + 1] = newNode;
    parent->n++;
}

// 插入非满节点
void insertNonFull(BTreeNode* node, KeyType key) {
    int i = node->n - 1;

    // 找到新关键字的插入位置
    while (i >= 0 && key < node->keys[i]) {
        node->keys[i + 1] = node->keys[i];
        i--;
    }

    node->keys[i + 1] = key;
    node->n++;
}

// B树插入操作
void insert(BTreeNode** root, KeyType key) {
    BTreeNode* node = *root;

    // 如果树为空,创建一个新节点
    if (node == NULL) {
        *root = createNode(true);
        insertNonFull(*root, key);
        return;
    }

    BTreeNode* current = node;
    BTreeNode* parent = NULL;
    int index = 0;

    // 查找插入位置
    while (!current->is_leaf) {
        index = 0;
        while (index < current->n && key > current->keys[index]) {
            index++;
        }
        parent = current;
        current = current->children[index];
    }

    // 插入到叶子节点
    insertNonFull(current, key);

    // 检查是否需要分裂
    while (current->n == MAX_KEYS + 1) {
        splitNode(parent, index, current);

        if (parent == NULL) {
            // 根节点满了,创建一个新的根节点
            *root = createNode(false);
            (*root)->children[0] = node;
            splitNode(*root, 0, node);
            return;
        }

        index = 0;
        while (parent->keys[index] < current->keys[0]) {
            index++;
        }

        current = parent;
        parent = parent->children[0] == current ? NULL : current->children[index + 1];
    }
}

// 主函数,用于测试
int main() {
    BTreeNode* root = NULL;

    // 插入一些关键字进行测试
    insert(&root, 10);
    insert(&root, 20);
    insert(&root, 5);
    insert(&root, 15);
    insert(&root, 7);
    // ... 可以继续插入其他关键字进行测试 ...

    // 这里可以添加代码来遍历和打印B树的内容,以验证插入操作的正确性

    return 0;
}

这个示例代码实现了B树的插入操作,包括节点的分裂和根节点的提升。请注意,这个代码是为了教学目的而简化的,并没有处理所有的边界情况,也没有实现删除和查找等操作。在实际应用中,还需要进一步完善和优化。

五、总结

B树作为一种高效的数据结构,广泛应用于数据库和文件系统的索引中。其自平衡的特性保证了高效的插入、删除和搜索操作,尤其适用于磁盘等辅助存储器的存取系统。通过伪代码和C代码示例的介绍,我们可以更深入地理解B树的原理和实现细节。在实际应用中,根据具体需求和场景,可以对B树进行适当的变种和优化,以进一步提高其性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/589417.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于 Wireshark 分析 IP 协议

一、IP 协议 IP&#xff08;Internet Protocol&#xff09;协议是一种网络层协议&#xff0c;它用于在计算机网络中实现数据包的传输和路由。 IP协议的主要功能有&#xff1a; 1. 数据报格式&#xff1a;IP协议将待传输的数据分割成一个个数据包&#xff0c;每个数据包包含有…

mac电脑关于ios端的appium真机自动化测试环境搭建

一、app store 下载xcode,需要登录apple id 再开始下载 二、安装homebrew 1、终端输入命令&#xff1a; curl -fsSL <https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh>如果不能直接安装&#xff0c;而是出现了很多内容&#xff0c;那么这个时候不要着急&…

06.Git远程仓库

Git远程仓库 #仓库种类&#xff0c;举例说明 github gitlab gitee #以这个仓库为例子操作登录码云 https://gitee.com/projects/new 创建仓库 选择ssh方式 需要配置ssh公钥 在系统上获取公钥输入命令&#xff1a;ssh-keygen 查看文件&#xff0c;复制公钥信息内…

【画图】读取无人机IMU数据并打印成log用matlab分析

一、修改IMU频率 原来的imu没有加速度信息&#xff0c;查看加速度信息的指令为&#xff1a; rostopic echo /mavros/imu/data 修改imu频率&#xff0c;分别修改的是 原始IMU数据话题 /mavros/imu/data_raw。飞控计算过后的IMU数据 /mavros/imu/data rosrun mavros mavcmd l…

Uniapp好看登录注册页面

个人介绍 hello hello~ &#xff0c;这里是 code袁~&#x1f496;&#x1f496; &#xff0c;欢迎大家点赞&#x1f973;&#x1f973;关注&#x1f4a5;&#x1f4a5;收藏&#x1f339;&#x1f339;&#x1f339; &#x1f981;作者简介&#xff1a;一名喜欢分享和记录学习的…

【Linux-点灯烧录-SD卡/USB烧写】

目录 1. 烧写方式2. 烧写之代码编译2.1 led.s->led.o2.2 led.o->led.elf2.3 led.elf->led.bin2.4 反汇编&#xff1a;led.elf->led.dis 3. 烧写之烧录到SD卡上&#xff1a;3.1 开启烧录软件权限&#xff1a;3.2 确定SD卡的格式&#xff1a;FAT323.3 烧录到SD卡上3.…

makefile中wildcard函数和patsubst用法

makefile中函数用法 makefile中函数的调用语法&#xff1a; $(<function> <arguments>) 或 ${<function> <arguments>}函数调用以$开头用{}或者()将函数名以及参数包含起来函数名和第一个参数之间以空格分隔参数之间使用逗号分隔 wildcard函数 wil…

python判断大图中包含小图并输出位置总结

python判断大图中包含小图并输出位置总结 没啥可说的&#xff0c;项目遇到了就直接上代码&#xff0c;可以减轻劳动力&#xff0c;花最少得时间实现应用功能。 import cv2 # 读取大图片和小图片的路径 img_big cv2.imread(big_image.png) img_small cv2.imread(small_image…

VScode+ubuntu配置ROS开发环境

VScodeubuntu配置ROS开发环境 写在前面 在vscode中先安装几个插件&#xff1a;中文语言包、Python插件、C插件、CMake插件、vscode-icons、ROS插件、Visual Studio IntelliCode、URDF、Markdown All in One 一、工作空间是什么 在ROS机器人开发中&#xff0c;我们针对机器人…

ue引擎游戏开发笔记(27)——解决角色移动及转动存在卡顿掉帧小技巧

1.需求分析&#xff1a; 随之游戏越来越大&#xff0c;难免出现部分时候移动出现卡顿&#xff0c;能否进行一定优化。 2.操作实现&#xff1a; 1.思路&#xff1a;采取捕获最后deltaseconds来逐帧进行旋转或移动&#xff0c;使动作显得不那么卡顿。 .2.首先在引擎中建立映射&a…

第一课 自动驾驶概述

1. contents 2. 什么是无人驾驶/自动驾驶 3 智慧出行大智慧 4. 无人驾驶的发展历程

24.5.2数据结构|顺序表实现

主要是记笔记&#xff0c;留着以后复习回来看的&#xff0c;有些内容解释的并不清晰。也就稍微可以借鉴借鉴。 一、如何定义结构&#xff1f; 应该有的部分用来约束的部分 二、看书搞清楚顺序表实现流程 1、准备工作&#xff1a;如何定义结构体&#xff1f;SeqList&#xf…

Acrobat Pro DC 2023:专业PDF编辑软件,引领高效办公新时代

Acrobat Pro DC 2023是一款专为Mac和Windows用户设计的专业PDF编辑软件&#xff0c;凭借其强大的功能和卓越的性能&#xff0c;成为现代职场人士不可或缺的得力助手。 这款软件拥有出色的PDF编辑能力。用户不仅可以轻松地对PDF文档中的文字、图片和布局进行编辑和调整&#xf…

【Vue】结合ElementUI实现简单数据请求和页面跳转功能

一、准备工作 1、创建一个Vue-cli程序 之前的博客有。各位看官姥爷&#xff0c;可以自查。 2、安装ElementUI 在创建Vue-cli程序的过程中&#xff0c;需要在控制台执行以下指令&#xff1a; #安装 element-ui npm i element-ui -S #安装 SASS 加载器 cnpm install sass-loa…

[实例] Unity Shader 利用顶点着色器模拟简单水波

我们都知道顶点着色器可以用来改变模型各个顶点的位置&#xff0c;那么本篇我们就利用顶点着色器来做一个模拟简单水波的应用。 1. 简谐运动 在进行模拟水波之前&#xff0c;我们需要了解简谐运动&#xff08;Simple Harmonic Motion&#xff09;公式&#xff1a; 其中&#…

【跟马少平老师学AI】-【神经网络是怎么实现的】(四)卷积神经网络

一句话归纳&#xff1a; 1&#xff09;用1个小粒度的模式&#xff0c;逐个与图像的局部区域进行运算&#xff0c;运算结果反映模式与区域的匹配程度。 2&#xff09;卷积神经网络与全连接神经网络的区别&#xff1a; 卷积神经网络的输出只与局部输入有连接。参数较少&#xff0…

使用jdbc方式操作ClickHouse

1、创建测试表&#xff0c;和插入测试数据 create table t_order01(id UInt32,sku_id String,total_amount Decimal(16,2),create_time Datetime ) engine MergeTreepartition by toYYYYMMDD(create_time)primary key (id)order by (id,sku_id);insert into t_order01 values …

jupyter notebook切换conda虚拟环境

首先&#xff0c;切换到某个虚拟环境&#xff0c;本人切换到了d2l环境&#xff1a; (d2l) C:\Users\10129>pip install ipykernel然后&#xff0c;如代码所示安装ipykernel包 最后&#xff0c;按下述代码执行&#xff1a; (d2l) C:\Users\10129>python -m ipykernel i…

SQL 基础 | UNION 用法介绍

在SQL中&#xff0c;UNION操作符用于合并两个或多个SELECT语句的结果集&#xff0c;形成一个新的结果集。 使用UNION时&#xff0c;合并的结果集列数必须相同&#xff0c;并且列的数据类型也需要兼容。 默认情况下&#xff0c;UNION会去除重复的行&#xff0c;只保留唯一的行。…

Istio基础知识

一、什么是Istio Istio 提供⼀种简单的⽅式来为已部署的服务建⽴⽹络&#xff0c;该⽹络具有 负载均衡、服务间认证、监控等功能&#xff0c;只需要对服务的代码进⾏⼀点或不需要做任何改动。想要让服务⽀持 Istio&#xff0c;只需要在您的环境中部署⼀个特殊的 sidecar 代 理&…