【手写数据库内核组件】01 解析树的结构,不同类型的数据结构组多层的链表树,抽象类型统一引用格式

不同类型的链表

专栏内容

  • postgresql使用入门基础
  • 手写数据库toadb
  • 并发编程

个人主页:我的主页
管理社区:开源数据库
座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物.

文章目录

  • 不同类型的链表
  • 概述
  • 1. 数据类型识别
    • 1.1 TLV格式介绍
    • 1.2 结构体分层定义
    • 1.3 定义抽象数据类型
  • 2. 链表定义
    • 2.1 数据节点定义
    • 2.2 链表类型定义
  • 节点解析
  • 链表遍历
  • 多级树链表
  • 总结
  • 结尾

概述


在实际使用中,会存在不同的数据类型,有基本类型,有自定义的结构体的复杂类型。

当这么丰富的数据出现时,只能记录到动态扩展的链表中,同时还能够查找,并按正确的类型取出。

本节就来介绍,在同一个链表中如何记录如此丰富的数据资源,分别从

  • 数据类型识别;
  • 链表的定义;
  • 节点解析;
  • 链表遍历
    四个方面来展开介绍。

1. 数据类型识别


要识别出不同的数据类型,这里介绍一种数据结构的定义格式TLV。

1.1 TLV格式介绍

TLV(tag-length-value)是一种用于以结构化方式表示数据的二进制格式。TLV在计算机网络协议、智能卡应用以及其他数据交换场景中经常被使用。TLV由以下三部分组成:

  1. 标签(Tag):唯一标识数据的类型。它通常是一个单字节或一小段字节序列, 可以是不同bit代表不同含义,也可以是整体表示序列。

  2. 长度(Length):数据字段的字节长度。在某些协议中,标签和长度字段的长度也会被包含在内。

  3. 值(Value):实际传输的数据,可以是任何类型或格式。

在这里插入图片描述

这种格式通过明确区分数据的类型、长度和具体内容,使得数据的解析和处理变得更加清晰和高效。

1.2 结构体分层定义

  • 首先定义复合类型,一般使用枚举类型进行定义。

在手写数据库toadb的src/sqlcore/node/nodeType.h文件中就有用到这种定义。

这里举例定义如下:

typedef enum NodeType
{
	T_START,

	/* parser nodes */
	T_List,
	T_MANAGER,
    T_HR,
    T_EMPLOYEE
}NodeType;
  • 然后在各复合类型的结构定中,前两个字段采用公共字段。

这里定义经理,HR,员工三个结构体类型,每个人都有一个sno员工号的数据,他们的个性化数据有:

  • 经理,有管理多少个员工;
  • HR,新入职了多少新员工;
  • 员工,对应的部门经理的工号;
typedef struct stManager
{
    NodeType type;
    int size;
    int sno;
    int employeeNum;
}stManager;

typedef struct stHr
{
    NodeType type;
    int size;
    int sno;
    int newEmployeesNum;
}stHr;

typedef struct stEmployee
{
    NodeType type;
    int size;
    int sno;
    int partMgr;
}stEmployee;

1.3 定义抽象数据类型

自定义的数据结构太多了,为了在使用中统一和简化,这里定义Node数据类型,是对上述数据类型的统称。

/* common type, real size is just by type. */
typedef struct Node
{
    NodeType type;
    int size;
}Node;

Node数据结构中包含两个公共的字段,类型和大小。

这样在参数引用,链表节点引用时,都可以用这个抽象的类型来代表以上众多的数据类型。

当然,有这个抽象结构定义之后,ListCell中的数据指针类型可以用Node类型代替,而不是之前定义的void。

2. 链表定义


既然是链表,肯定采用指针的方式串连起来,以往都是定义一种明确的数据类型作为链表的节点。

而面对如此多的数据类型,链表节点的结构如何定义呢?

2.1 数据节点定义

数据节点中存储真实的数据,由链表指针将数据节点串连起来。

它的定义如下:

/* tree list cell */
typedef struct ListCell
{
    void* pValue;
    struct ListCell *next;
}ListCell;
  • 数据类型不确定,所以定义为void *;
  • 单链表的形式,next指向下一个节点;

2.2 链表类型定义

部门的结构是一个多层级形式,每个层级又是多个员工,也是一个链表。

因此,数据类型中,除了实际意义的数据类型,如上面定义的经理,HR,员工外,还需要增加链表的数据类型。

/* tree list node */
typedef struct List
{
	NodeType type;
    int size;
	int length;         /* number of ListCell struct */
	ListCell *head;
}List;

链表的数据类型中,数据有两个:

  • length, 链表中的节点个数;
  • head,链表头;

节点解析


数据的多样性,增加了链表节点类型解析工作,因为之前采用了统一类型定义,所以类型的解析变得简单。

采用统一的接口对类型进行解析, 分发到对应的类型进行处理。

static void ShowNode(Node *n)
{
    if(NULL == n)
    {
        return;
    }

    switch(n->type)
    {
        case T_List:
            ShowNodList(n);
        break;
        
        case T_MANAGER:
            ShowNodManager(n);
        break;
        
        case T_HR:
            ShowNodHR(n);
        break;
        
        case T_EMPLOYEE:
            ShowNodEmployee(n);
        break;
        
        default:
        break;
    }
}

这里定义了一个展示各节点信息的接口,根据节点类型再调用各自的接口进行展示。

链表遍历


经过上面的抽象类型之后,链表的遍历就非常简单,这里以链表的节点的显示为例。

void TravelListCell(List *list)
{
    ListCell *tmpCell = NULL;
    List *l = list;
    
    if(NULL == l)
    {
        return;
    }

    /* list cell node show */
    for(tmpCell = l->head; tmpCell != NULL; tmpCell = tmpCell->next)
    {
        Node *node = (Node *)(tmpCell->pValue);

        ShowNode(node);
    }

    return;
}

说明:

  • 传入的是一个List的指针,这里会包含一个链表;
  • 从成员head开始遍历,直到链表节点的next为空,也就是链尾;
  • 将链表节点的数据成员转为抽象类型Node *, 传入统一的处理接口;

多级树链表


将经理的数据成员增加一项,除了下属成员数量外,还列出下属的员工信息;

typedef struct stManager
{
    NodeType type;
    int size;
    int sno;
    int employeeNum;
    Node *employeeList;
}stManager;

这里有个特别的地方,对于T_List类型的数据,内部会递归调用TravelListCell,这样就是一个多级链表树。

在这里插入图片描述

如同一个公司的组织架构一样,顶层由HR,高级经理列表组成,每个高级经理下属由员工,中级经理组成;

而中级经理下属由多名员工组成,整体组成一个公司的树形组织架构图。

对于T_LIst类型的节点,它的显示处理函数如下:

void ShowNodList(Node *n)
{
    if(NULL == n)
        return ;

    TravelListCell((List *) n);
}

其实是深度优先的图递归遍历,其它数据节点的显示就相对简单,打印成员信息即可,这里不再列举。

总结


本文介绍了链表节点为不同数据类型时的处理方法,定义了抽象类型后使引用的类型统一,同时在遍历树形链表时,对于成员仍为链表时,采用深度优先的递归遍历。

这种链表在数据库内核中应用比较广泛,比如在SQL语法解析时,将语法的各子句解析成不同的数据类型,而像select子句,可以写多个列名,该子句内部又以链表形成存储列信息。

结尾


非常感谢大家的支持,在浏览的同时别忘了留下您宝贵的评论,如果觉得值得鼓励,请点赞,收藏,我会更加努力!

作者邮箱:study@senllang.onaliyun.com
如有错误或者疏漏欢迎指出,互相学习。

注:未经同意,不得转载!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/780105.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

图像基础知识

图像卷积 卷积(convolution)是通过两个函数f和g生成第三个函数的一种数学算子,表征函数f与g经过翻转和平移的重叠部分的面积。 卷积概念是两个变量在某范围内相乘后求和的结果。图像处理中的卷积概念:数字图像是一个二维的离散信号,对数字图像做卷积操作其实就是利用卷积…

【帧中继实验-ensp】

实验要求 在R1上开启一个点对点子接口,用于连接 R1–R2,两端IP地址为12.1.1.x 。开启一个多点子接口 ,用于连接R1–R3,R4,两段IP地址为134.1.1.x。 具体DLCI分配和映射关系如下: R1 102 R2 201—动态映射…

华为OD机试 - 来自异国的客人(Java 2024 D卷 100分)

华为OD机试 2024D卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试(JAVA)真题(D卷C卷A卷B卷)》。 刷的越多,抽中的概率越大,每一题都有详细的答题思路、详细的代码注释、样例测…

使用Github Actions自建Docker镜像仓库

使用Github Actions自建Docker镜像仓库 背景使用Github Actions自建Docker镜像仓库fork项目[docker_image_sync](https://github.com/xqxyxchy/docker_image_sync)获取云厂商容器镜像服务信息配置github secrets运行github action配置需要同步的镜像同步后效果华为云配置 背景 …

机器学习简介--NLP(二)

机器学习简介 机器学习简介机器学习例子机器学习分类有监督学习有监督学习的应用 无监督学习 机器学习常见概念数据集k折交叉验证过拟合欠拟合评价指标 机器学习简介 机器学习例子 问题: 2,4,6,8,?&#…

深入理解JS逆向代理与环境监测

博客文章:深入理解JS逆向代理与环境监测 1. 引言 首先要明确JavaScript(JS)在真实网页浏览器环境和Node.js环境中有很多使用特性的区别。尤其是在环境监测和对象原型链的检测方面。本文将探讨如何使用JS的代理(Proxy&#xff09…

2024亚太杯中文赛数学建模B题word+PDF+代码

2024年第十四届亚太地区大学生数学建模竞赛(中文赛项)B题洪水灾害的数据分析与预测:建立指标相关性与多重共线性分析模型、洪水风险分层与预警评价模型、洪水发生概率的非线性预测优化模型,以及大规模样本预测与分布特征分析模型 …

算法011:最大连续的1的个数

最大连续的1的个数. - 备战技术面试?力扣提供海量技术面试资源,帮助你高效提升编程技能,轻松拿下世界 IT 名企 Dream Offer。https://leetcode.cn/problems/max-consecutive-ones-iii/ 乍一看,这道题很奇怪,什么叫最多翻转k个0&a…

自动控制:反馈控制

自动控制:反馈控制 反馈控制(Feedback Control)是一种在控制系统中通过测量输出信号,并将其与期望信号进行比较,产生误差信号,再根据误差信号调整输入来达到控制目标的方法。反馈控制是自动控制系统中最常…

揭秘Conda:Python开发者必备的包管理神器

conda 简介 Conda 是一个开源的包管理系统和环境管理系统,用于安装和管理软件包以及创建和维护不同的软件环境。 它最初是为 Python 语言设计的,但现在已经支持多种编程语言,包括 R、Ruby、Lua、Scala 等。 1、Anaconda:是一个…

HCIE之IPV6和OSPFv6(十四)

IPV6 1、IPv6基础1.1 Ipv6地址静态配置、Eui 641.1.1 Ipv6地址静态配置1.1.2、Ipv6地址计算总结1.1.2.1、IEEE eui 64计算1.1.2.1.1、作用1.1.2.1.2、计算方法1.1.2.1.3、计算过程 1.1.2.2、被请求加入的组播组地址计算(三层)1.1.2.2.1、 作用1.1.2.2.2、…

在pycharm里如何使用Jetbrains AI Assistant

ai assistant激活成功后,如图 ai assistant渠道:https://web.52shizhan.cn/activity/ai-assistant 在去年五月份的 Google I/O 2023 上,Google 为 Android Studio 推出了 Studio Bot 功能,使用了谷歌编码基础模型 Codey,Codey 是…

浪潮信息元脑服务器支持英特尔®至强®6能效核处理器 展现强劲性能

如今,服务器作为数字经济的核心基础设施,正面临着前所未有的挑战和机遇。作为服务器领域的领军企业,浪潮信息始终站在行业前沿,不断推陈出新,以满足客户日益增长的需求。近日,浪潮信息再次展现技术实力&…

从零开始学习网络安全渗透测试之Linux基础篇——(六)Linux网络及防火墙配置

从零开始学习网络安全渗透测试之Linux基础篇 第六章 Linux网络及防火墙配置 1、Linux网络配置文件 查看第一张网卡的网卡信息: [rootlocalhost yum.repos.d]# cat vi /etc/sysconfig/network-scripts/ifcfg-ens33 cat: vi: 没有那个文件或目录TYPEEthernet PR…

【高中数学/基本不等式】已知:x,y皆为正实数,且满足2x+y=1 求:1/x+1/y的最小值?

【问题】 已知:x,y皆为正实数,且满足2xy1 求:1/x1/y的最小值? 【解答】 解法一:(基本不等式法) 这个问题貌似无从下手,实际把分子的1替换成2xy就出现我们熟悉的适合基本不等式发…

数据自动备份方法分享!

现在很多朋友对于第三方软件颇为青睐,因为它们具备许多电脑自带备份工具所不具备的功能。例如,自动备份数据的需求。尽管你已经备份了电脑数据,但日常使用中数据常会增加,你可能无暇顾及每天的备份工作。因此,使用数据…

alibaba EasyExcel 简单导出数据到Excel

导入依赖 <dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>4.0.1</version> </dependency> 1、alibaba.excel.EasyExcel导出工具类 import com.alibaba.excel.EasyExcel; import …

c++ primer plus 第15章友,异常和其他: 15.2.1 嵌套类和访问权限系

c primer plus 第15章友&#xff0c;异常和其他&#xff1a; 15.2.1 嵌套类和访问权限系 提示&#xff1a;这里可以添加系列文章的所有文章的目录&#xff0c;目录需要自己手动添加 例如&#xff1a;c primer plus 第15章友&#xff0c;异常和其他&#xff1a; 15.2.1 嵌套类和…

Kubernetes分享

幂等性(Idempotency) 介绍 简单来说&#xff0c;幂等性幂等性(Idempotency)是计算机科学中的一个重要概念&#xff0c;特别是在分布式系统和网络应用中。指的是某个操作可以重复执行多次&#xff0c;但其结果是相同的&#xff0c;不会因为多次执行而改变系统的状态。 https://…

rkmpp移植与测试

一、mpp交叉编译 MPP(Media Process Platform )是Rockchip提供的一款硬件编解码媒体处理软件平台&#xff0c;适用于Rockchip芯片系列。它屏蔽了有关芯片的复杂底层处理&#xff0c;屏蔽了不同芯片的差异&#xff0c;为使用者提供了一组MPI统一接口。如果想达到最好的效果&…