【数据结构】数据结构整体大纲

数据结构用来干什么的?很简单,存数据用的。 (这篇文章仅介绍数据结构的大纲,详细讲解放在后面的每一个章节中,逐个击破)

那为什么不直接使用数组、集合来存储呢 ——> 如果有成千上亿条数据呢?假如说:有一块连续的40w个字节大小的数据被存储在内存空间当中,请问,这个时候我需要提取出其中的某一条数据,不方便进行操作。

数组有个问题,数据一旦太大,如果想在内存中找到特定的空间很难,而我们将数据零散的四处分配在不同的空间中,所以我们采用了数据结构的方式进行数据的存储,然后中间通过指针的方式将这些数据串起来。创建之后,从此以后,这些数据形成了一个链条,所以,当我们知道一个链条的起始点,一个一个链接中的节点往下找,便可以找到这个链条其中的每一个数据,这便是数据结构的本质,这个链条被称为 链表。
请添加图片描述
根据上图的逻辑,我们现在要存储 10 20 30 40 50 60 六个数据使它们形成一个链表,该怎么写呢?

struct node
{
    int d;
    struct node *next;
};

struct node *p1 = (struct node *)malloc(sizeof(struct node));
p1->d = 10;

struct node *p2 = (struct node *)malloc(sizeof(struct node));
p2->d = 20;
p1->next = p2;

struct node *p3 = (struct node *)malloc(sizeof(struct node));
p3->d = 30;
p2->next = p3;
p1->next->next->d;  // 30

//如此以往,环环相扣,首位相连

这便是数据结构的本质与基础,很简单吧。数据结构一点都不难,只要能够理解数据之间串联方式的内在逻辑,再看数据结构的各种方式不过是根据以上图基础的变种而已。它们的目的都是 链接零散在内存空间中数据 而存在的,用一些具有规则、规律的方式或者结构,对数据进行存储、插入、删除、查找、更新的过程。

什么是数据

  • 广义:你在计算机里看到的一切 —— 现实生活中的一切事物皆是数据。
  • 狭义:代码产生的一系列数据:int a = 10; ——> a是数据,10也是数据。

什么是结构?

  • 指的是关系 ——> 存储关系,逻辑关系,算法关系等。

什么是数据结构?

  • 研究数据与数据之间的关系。例如:

关系:

  1. 研究分析 数据 与 数据之间的关系 ----------------------------> 逻辑关系(结构):表示数据运算之间的抽象关系(如邻接关系、从属关系等),按每个数据元素可能具有的 直接前驱数直接后继数 将逻辑结构分为“线性结构”和非线性结构两大类。
    1.1 集合
    数据元素除了“同属于一个集合”外,无其他关系。例子: 鸡,鸭,鹅 属于 —> 禽类
    1.2 线性结构
    指数据元素之间存在 一个对一个 的关系,形成有序的集合。这样结构中,每个数据元素都有一个明确的 前驱后继,除了第一个元素没有前驱,最后一个元素没有后继,就像一辆火车一样一节节车厢链接在一起。
    1.3 树状结构
    呈现一个对多个的关系(自上而下)。
    1.4 图形结构
    呈现多对多的关系(人工智能)。
    例如:脑神经,数据元素呈现多对多的关系。
  2. 将这种关系保存在计算机中 -------------------------------------> 存储关系(结构) :存储结构是数据的逻辑结构在计算机存储器中的映射。存储结构是通过计算机语言所编制的程序来实现的。
    2.1 顺序存储
    将这些数据依次存储在一块连续的空间中(数组)
    2.2 链式存储
    给每一个数据单独申请一个独立的空间,利用指针建立它们之间的关系。(构造数据用结构体形式去实现)
  3. 通过某种手段,修改在计算机中保存的关系 ----------------> 算法(狭义:增删改查)
    3.1 插入 删除 修改 替换 排序 (增删改查操作)

数据结构是计算机科学的核心内容,主要研究如何高效地组织、存储和操作数据。不同的数据结构适用于不同的应用场景,可以显著提高程序的性能和算法的效率。这篇文章是数据结构的完整学习大纲,涵盖了基础概念、常用数据结构及其相关算法、应用场景等内容。学习数据结构时,建议按照从简单到复杂的顺序,由浅入深逐步深入理解每种结构的实现和应用。

数据结构的作用:

  • 提高程序的可维护性和扩展性:数据结构通过抽象化数据的存储和操作,使程序更易维护和扩展。

解决特定领域的问题:

  • 数据结构广泛应用于操作系统、数据库、网络、人工智能、大数据等领域,解决特定问题。比如说:B+树 用于数据库索引,图结构 用于建模网络。
  1. 数据结构的定义和分类:高效的存储与操作数据
    1.1 数据结构提供了一种合理的方式来组织和存储数据,以支持各种数据操作(如插入、删除、查询、排序等)。
    1.2 例如:使用 数组 可以快速按索引访问数据。使用 哈希表 实现快速查找。
  2. 数据结构与算法的关系
  3. 时间复杂度与空间复杂度
    3.1 大 O 表示法
    3.2 最优、最坏、平均复杂度分析;合理选择数据结构可以显著降低算法的时间复杂度。
    3.3 例如,使用 实现优先队列,使插入和删除的时间复杂度从 O(n) 降为 O(log n)。
  4. 基本操作:插入、删除、查找、更新。

数据结构整体大纲

数据结构的分类

(1)线性数据结构

  • 数据元素按线性顺序排列。
  • 数据元素之间存在 一个对一个 的关系,形成有序的集合。这样结构中,每个数据元素都有一个明确的 前驱后继,除了第一个元素没有前驱,最后一个元素没有后继,就像一辆火车一样一节节车厢链接在一起。
  • 常见例子:
    • 数组(Array)
    • 链表(Linked List):单向链表、单向循环链表、双向链表、双向循环链表、内核链表。
    • 栈(Stack)
    • 队列(Queue)
    • 双端队列(Deque)

(2)非线性数据结构

  • 数据元素之间不一定是线性关系,可以是层次关系或网状关系。
  • 常见例子:
    • 树(Tree)
    • 图(Graph)

(3)哈希结构

  • 通过哈希函数将数据映射到特定位置,支持快速查找和插入。
  • 常见例子:
    • 哈希表(Hash Table)

(4)高级数据结构

  • 基于基础数据结构的抽象或优化。
  • 常见例子:
    • 堆(Heap)
    • 并查集(Union-Find)
    • 字典树(Trie)
    • 跳表(Skip List)
    • B 树与 B+ 树

各数据结构的详细介绍

1. 数组(Array)
作用:存储固定大小的连续数据,支持随机访问。
解决的问题:快速按索引访问数据。
应用场景

  • 实现栈、队列。
  • 存储二维或多维矩阵数据(如图像处理)。
  • 动态数组(如 C++ 的 std::vector 和 Python 的 list)。

2. 链表(Linked List)
作用:通过节点链式存储数据,支持动态插入和删除。
解决的问题:在不知道数据大小或需要频繁插入/删除时提供灵活的存储方式。
种类

  • 单向链表、单向循环链表、双向链表、双向循环链表、内核链表。

应用场景

  • 内存管理(如空闲内存块管理)。
  • LRU 缓存(使用双向链表和哈希表实现)。
  • 实现队列和其他数据结构。

3. 栈(Stack)
作用:后进先出(LIFO)的数据结构。
解决的问题:用于处理具有递归或嵌套结构的数据。
常见操作:push(入栈),pop(出栈),peek(查看栈顶元素)。
应用场景

  • 函数调用栈(保存函数调用上下文)。
  • 括号匹配问题(如验证表达式合法性)。
  • 表达式求值(如中缀转后缀表达式)。

4. 队列(Queue)
作用:先进先出(FIFO)的数据结构。
解决的问题:适用于需要按顺序处理任务的场景。
种类

  • 普通队列、双端队列(Deque)、优先队列。

应用场景

  • 任务调度(如操作系统中的进程调度)。
  • 广度优先搜索(BFS)。
  • 实现消息队列(如 RabbitMQ)。

5. 树(Tree)
基本概念:节点、根、叶子、子树、高度、深度。
作用:层次化存储数据,便于快速查找、插入和删除。
解决的问题:高效存储和操作有层次关系的数据。
种类

  • 二叉树、二叉搜索树(BST)、平衡二叉树(如 AVL 树、红黑树)、堆。

应用场景

  • 文件系统(如目录结构)。
  • 数据检索(如表达式树)。
  • 数据库索引(如 B+ 树)。

6. 图(Graph)
基本概念:存顶点、边、权重、度。
作用:存储网状关系的数据。
解决的问题:建模网络、路径规划等问题。
常见表示

  • 邻接矩阵、邻接表。
  • 有向图 vs 无向图。

应用场景

  • 网络路由(如最短路径算法:Dijkstra)。
  • 社交网络分析。
  • 电路设计、推荐系统。

7. 哈希表(Hash Table)
基本概念:哈希函数,键值对存储。
作用:通过哈希函数支持快速插入和查找。
解决的问题:快速检索键值对。
冲突解决方法

  • 链地址法、开放地址法。

应用场景

  • 缓存(如 LRU 缓存)。
  • 数据去重。
  • 实现字典(如 Python 的 dict)。

8. 堆(Heap)
作用:动态维护最大值或最小值。
解决的问题:快速找到优先级最高的元素。
种类

  • 大顶堆、小顶堆。
  • 完全二叉树。

应用场景

  • 优先队列。
  • Top-K 问题(如实时流数据分析)。
  • 堆排序。

高级数据结构

9. 并查集(Union-Find)
作用:解决连通性问题。
解决的问题:动态合并集合并查询集合所属。
优化

  • 路径压缩、按秩合并。

应用场景

  • 网络连通性。
  • Kruskal 最小生成树算法。

10. 字典树(Trie)
作用:高效存储和检索字符串集合。
解决的问题:快速搜索前缀匹配数据。

应用场景

  • 搜索引擎的自动补全。
  • 拼写检查。
  • 字符串去重。

11. 平衡树
作用:插入、删除、旋转操作,性质与平衡维护数据。
解决的问题:性质与平衡维护;应用:STL 的 mapset

应用场景

  • AVL 树。
  • 红黑树。

12. 跳表(Skip List)
作用:通过引入多级索引(多层链表)以提高操作效率,是平衡树(如 AVL 树、红黑树)的高效替代方案,能够在有序数据集合中快速进行查找、插入和删除操作。
解决的问题:时间复杂度分析:O(log n)

应用场景

  • 数据库索引。
  • 有序集合操作。

13. B 树与 B+ 树
作用:平衡多路查找树,适合磁盘存储。
解决的问题:高效管理和检索大规模数据。

应用场景

  • 数据库索引(如 MySQL)。
  • 文件系统(如 NTFS)。

数据结构解决的问题及对应应用场景

问题类型解决问题的数据结构应用场景
快速查找和插入哈希表、平衡树(红黑树、AVL 树)数据检索、缓存、字典实现
动态优先级管理堆(大顶堆、小顶堆)优先队列、任务调度、实时流数据的 Top-K 问题
快速存储和检索字符串字典树(Trie)拼写检查、搜索引擎自动补全
路径或连通性问题图(邻接表、邻接矩阵)、并查集网络路由、社交网络分析、最小生成树
数据的层次化存储与操作树(BST、B+ 树)文件系统、数据库索引
处理动态长度的数据链表(单链表、双向链表)内存管理、链式存储
任务调度或顺序问题队列、双端队列(Deque)操作系统进程调度、消息队列
递归或嵌套问题函数调用栈、表达式求值、括号匹配
搜索和路径规划问题图(DFS、BFS)、堆(用于 Dijkstra)地图导航、最短路径算法
大规模数据的排序与检索堆、平衡树(红黑树)、B+ 树外部排序、数据库查询、文件系统

常用算法与数据结构结合

  1. 排序算法
    • 冒泡排序、选择排序、插入排序
    • 快速排序、归并排序、堆排序
    • 桶排序、计数排序、基数排序
    • 时间复杂度及适用场景
  2. 搜索算法
    • 线性搜索
    • 二分搜索
    • 深度优先搜索(DFS)、广度优先搜索(BFS)
    • A* 搜索算法(启发式搜索)
  3. 字符串匹配算法
    • 暴力匹配
    • KMP 算法
    • Rabin-Karp 算法
    • Trie 树(前缀树)

综上。
数据结构的作用:通过合理组织和存储数据,解决效率、存储和操作问题。
学习掌握的过程由浅入深:先掌握基础数据结构(数组、链表、栈、队列),再逐步学习复杂的数据结构(树、图、哈希)。
结合算法:理解排序、搜索、字符串匹配等算法中使用的数据结构。
解决的问题:快速查找、动态优先级管理、路径规划、大规模数据检索等。
应用场景:从操作系统、数据库、网络路由到人工智能、大数据分析,数据结构是解决实际问题的重要工具。

每种数据结构都有其独特的特性和适用场景,学习时需结合理论与应用,理解其实现原理和使用方法,以便在实际开发中合理选用。

以上。仅供学习与分享交流,请勿用于商业用途!转载需提前说明。

我是一个十分热爱技术的程序员,希望这篇文章能够对您有帮助,也希望认识更多热爱程序开发的小伙伴。
感谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/940435.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Flutter组件————FloatingActionButton

FloatingActionButton 是Flutter中的一个组件,通常用于显示一个圆形的按钮,它悬浮在内容之上,旨在吸引用户的注意力,并代表屏幕上的主要动作。这种按钮是Material Design的一部分,通常放置在页面的右下角,但…

python rabbitmq实现简单/持久/广播/组播/topic/rpc消息异步发送可配置Django

windows首先安装rabbitmq 点击参考安装 1、环境介绍 Python 3.10.16 其他通过pip安装的版本(Django、pika、celery这几个必须要有最好版本一致) amqp 5.3.1 asgiref 3.8.1 async-timeout 5.0.1 billiard 4.2.1 celery 5.4.0 …

【Verilog】期末复习

数字逻辑电路分为哪两类?它们各自的特点是什么? 组合逻辑电路:任意时刻的输出仅仅取决于该时刻的输入,而与电路原来的状态无关 没有记忆功能,只有从输入到输出的通路,没有从输出到输入的回路 时序逻辑电路&…

光伏电站无人机巡检都有哪些功能?

焱图慧云光伏智能巡检系统主要依托于先进的无人机技术、传感器技术、图像处理技术和智能分析技术。 一、无人机自主飞行与航迹控制 全自主飞行:无人机能够按照预设的飞行路线自主飞行,完成指定的巡检任务,无需人工干预,大大提高了…

图书馆管理系统(三)基于jquery、ajax

任务3.4 借书还书页面 任务描述 这部分主要是制作借书还书的界面,这里我分别制作了两个网页分别用来借书和还书。此页面,也是通过获取books.txt内容然后添加到表格中,但是借还的操作没有添加到后端中去,只是一个简单的前端操作。…

如何使用 WebAssembly 扩展后端应用

1. WebAssembly 简介 随着互联网的发展,越来越多的应用借助 Javascript 转到了 Web 端,但人们也发现,随着移动互联网的兴起,需要把大量的应用迁移到手机端,随着手端的应用逻辑越来越复杂,Javascript 的解析…

《鸿蒙HarmonyOS应用开发从入门到精通(第2版)》简介

《鸿蒙HarmonyOS应用开发从入门到精通(第2版)》已于近日上市,该书由北京大学出版社出版。距离第1版上市已经过去二年半多。本文希望与读者朋友们分享下这本书里面的大致内容。 封面部分 首先是介绍封面部分。 《鸿蒙HarmonyOS应用开发从入门…

Linux -- 线程控制相关的函数

目录 pthread_create -- 创建线程 参数 返回值 代码 -- 不传 args: 编译时带 -lpthread 运行结果 为什么输出混杂? 如何证明两个线程属于同一个进程? 如何证明是两个执行流? 什么是LWP? 代码 -- 传 args&a…

VTK知识学习(26)- 图像基本操作(一)

1、前言 图像处理离不开一些基本的图像数据操作,例如获取和修改图像的基本信息、访问和修改图像像素值、图像显示、图像类型转换等。熟练掌握这些基本操作有助于使用 VTK进行图像处理应用程序的快速开发。 2、图像信息的访问与修改 1)利用vtkIamgeData…

【WPF】把DockPanel的内容生成图像

要在WPF中将一个 DockPanel 的内容生成为图像并保存,可以按照与之前类似的步骤进行,但这次我们将专注于 DockPanel 控件而不是整个窗口。 DockPanel的使用 WPF(Windows Presentation Foundation)中的 DockPanel 是一种布局控件&…

【Linux】处理用户输入

一、基本介绍 1、如何传递参数 向shell脚本传递数据的最基本方法就是通过命令行参数。如下,这条命令会向test.sh脚本传递10和20这两个参数。 ./test.sh 10 20 2、如何读取参数 bash shell会将所有的命令行参数都指派给称作位置参数(positional parame…

SpringBoot+Vue3实现阿里云视频点播 实现教育网站 在上面上传对应的视频,用户开会员以后才能查看视频

要使用阿里云视频点播(VOD)实现一个教育网站,其中用户需要成为会员后才能查看视频,这个过程包括上传视频、设置权限控制、构建前端播放页面以及确保只有付费会员可以访问视频内容。 1. 视频上传与管理 创建阿里云账号&#xff…

POI-TL插件开发-表格分组插件

POI-TL版本:1.12.2 改造于:LoopRowTableRenderPolicy 模板设计: 分组之前: 分组之后: 代码实现: public class LoopRowGroupTableRenderPolicy implements RenderPolicy {private String prefix;privat…

发送webhook到飞书机器人

发送webhook到飞书机器人 参考链接 自定义机器人使用指南 创建自定义机器人 邀请自定义机器人进群。 进入目标群组,在群组右上角点击更多按钮,并点击 设置。 在右侧 设置 界面,点击 群机器人。 在 群机器人 界面点击 添加机器人。 在 添…

36. Three.js案例-创建带光照和阴影的球体与平面

36. Three.js案例-创建带光照和阴影的球体与平面 实现效果 知识点 Three.js基础 WebGLRenderer WebGLRenderer 是Three.js中最常用的渲染器,用于将场景渲染到网页上。 构造器 new THREE.WebGLRenderer(parameters)参数类型描述parametersobject可选参数&#…

Mybatis分页插件的使用问题记录

项目中配置的分页插件依赖为 <dependency><groupId>com.github.pagehelper</groupId><artifactId>pagehelper</artifactId><version>5.1.7</version></dependency>之前的项目代码编写分页的方式为&#xff0c;通过传入的条件…

RIP---路由信息协议

动态路由 自治系统 ---AS 由单一的机构或组织所管理的一系列 IP 网络设备的集合 。 AS 编号&#xff1a; ASN----1-65535----IANA &#xff08;互联网数字分配机构&#xff09; AS 的通讯方式 AS 内部 ---- 运行相同的路由协议 ---- 内部网关协议&#xff08; IGP &#x…

NLP 分词技术浅析

一、NLP 分词技术概述 &#xff08;一&#xff09;定义 自然语言处理&#xff08;NLP&#xff09;中的分词技术是将连续的文本序列按照一定的规则切分成有意义的词语的过程。例如&#xff0c;将句子 “我爱自然语言处理” 切分为 “我”、“爱”、“自然语言处理” 或者 “我…

排序算法:冒泡排序

每一次顺序便遍历&#xff0c;比较相邻的两个元素&#xff0c;交换。 void bubbleSort(vector<int>&v) { int n v.size();//元素个数 //外层j控制的是待排序区间的长度 for (int j n;j > 1;j--) { bool flag 0;//提高效率&#xff0c;判断比较好了就结束 /…

抽象之诗:C++模板的灵魂与边界

引言 在计算机科学的浩瀚长河中&#xff0c;C模板如同一颗璀璨的星辰&#xff0c;以其独特的泛型编程方式为程序设计注入了灵魂。它是抽象的艺术&#xff0c;是类型的舞蹈&#xff0c;是效率与灵活性的交响乐。模板不仅是一种技术工具&#xff0c;更是一种哲学思考&#xff0c…