这里写目录标题
- 树
- 树的概念
- 树的相关概念
- 树的表示
- 二叉树
- 二叉树的概念
- 满二叉树与完全二叉树
- 二叉树的重要性质
- 二叉树的存储结构
- 堆
- 二叉树的顺序存储
- 堆的概念
- 堆的实现
- 堆插入和删除数据
树
树的概念
树的概念: 树是一种非线性的数据结构,它是由n(n>=0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。
1.有一个特殊的结点,称为根结点,根节点没有前驱结点。
2.除根节点外,其余结点被分成M(M>0)个互不相交的集合T1、T2、……、Tm,其中每一个集合Ti(1<= i <= m)又是一棵结构与树类似的子树。每棵子树的根结点有且只有一个前驱,可以有0个或多个后继
3.因此,树是递归定义的。
树的相关概念
节点的度: 一个节点含有的子树的个数称为该节点的度; 如上图:A的为6
叶节点或终端节点: 度为0的节点称为叶节点; 如上图:B、C、H、I…等节点为叶节点
非终端节点或分支节点: 度不为0的节点; 如上图:D、E、F、G…等节点为分支节点
双亲节点或父节点: 若一个节点含有子节点,则这个节点称为其子节点的父节点; 如上图:A是B的父节点
孩子节点或子节点:一个节点含有的子树的根节点称为该节点的子节点; 如上图:B是A的孩子节点
兄弟节点: 具有相同父节点的节点互称为兄弟节点; 如上图:B、C是兄弟节点
树的度: 一棵树中,最大的节点的度称为树的度; 如上图:树的度为6
节点的层次: 从根开始定义起,根为第1层,根的子节点为第2层,以此类推;
树的高度或深度: 树中节点的最大层次; 如上图:树的高度为4
堂兄弟节点: 双亲在同一层的节点互为堂兄弟;如上图:H、I互为兄弟节点
节点的祖先: 从根到该节点所经分支上的所有节点;如上图:A是所有节点的祖先
子孙: 以某节点为根的子树中任一节点都称为该节点的子孙。如上图:所有节点都是A的子孙
森林: 由m(m>0)棵互不相交的树的集合称为森林;
树的表示
树结构相对线性表就比较复杂了,要存储表示起来就比较麻烦了,既然保存值域,也要保存结点和结点之间的关系,实际中树有很多种表示方式如:双亲表示法,孩子表示法、孩子双亲表示法以及孩子兄弟表示法等。我们这里就简单的了解其中最常用的孩子兄弟表示法。
所谓孩子兄弟表示法就是一种可以精确找到每一个节点且相对容易的表示方法。
我们定义一个结构体来存某个节点的最左侧的孩子,和紧挨着的右侧的兄弟,以此类推。
struct Node
{
struct Node* _firstChild1; // 第一个孩子结点
struct Node* _pNextBrother; //指向其右边兄弟结点
DataType _data; //结点中的数据
};
如上图,每个结点都存了自己的左孩子和右兄弟,这样所有的数据都串起来了。
二叉树
二叉树的概念
节点最多只有两个子节点的树,由一个根节点加上两棵别称为左子树和右子树的二叉树组成。
从上图可以看出:
- 二叉树不存在度大于2的结点
- 二叉树的子树有左右之分,次序不能颠倒,因此二叉树是有序树
注意:对于任意的二叉树都是由以下几种情况复合而成的:
满二叉树与完全二叉树
- 满二叉树:一个二叉树,如果每一个层的结点数都达到最大值,则这个二叉树就是满二叉树。也就是说,如果一个二叉树的层数为K,且结点总数是,则它就是满二叉树。
- 完全二叉树:完全二叉树是效率很高的数据结构,完全二叉树是由满二叉树而引出来的。对于深度为K的,有n个结点的二叉树,当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。 要注意的是满二叉树是一种特殊的完全二叉树。
二叉树的重要性质
对于具有n个结点的完全二叉树,如果按照从上至下从左至右的数组顺序对所有节点从0开始编号,则对于序号为i的结点有:
- 若i>0,i位置节点的双亲序号:(i-1)/2;i=0,i为根节点编号,无双亲节点。通过这种方法找双亲节点。
- 若2i+1<n,左孩子序号:2i+1,2i+1>=n否则无左孩子
- 若2i+2<n,右孩子序号:2i+2,2i+2>=n否则无右孩子
二叉树的存储结构
二叉树一般可以使用两种结构存储,一种顺序结构,一种链式结构。
顺序存储: 顺序结构存储就是使用数组来存储,一般使用数组只适合表示完全二叉树,因为不是完全二叉树会有空间的浪费。而现实中使用中只有堆才会使用数组来存储,二叉树顺序存储在物理上是一个数组,在逻辑上是一颗二叉树。
链式存储: 二叉树的链式存储结构是指,用链表来表示一棵二叉树,即用链来指示元素的逻辑关系。 通常的方法是链表中每个结点由三个域组成,数据域和左右指针域,左右指针分别用来给出该结点左孩子和右孩子所在的链结点的存储地址 。
堆
二叉树的顺序存储
普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。
需要注意的是二叉树和堆都是对数据的描述和存储的方式,不同的情况选择不同的存储方式,堆就是其中一种。而数组这种数据类型刚好适合堆这种存储方式。
堆的概念
堆(heap)是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。堆总是满足下列性质:
1.堆中某个结点的值总是不大于或不小于其父结点的值;
2.堆总是一棵完全二叉树。
将根结点最大的堆叫做最大堆或大根堆,根结点最小的堆叫做最小堆或小根堆。
堆的实现
堆的头文件:
#pragma once
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <stdbool.h>
typedef int HPDatetype;
typedef struct {
int size;
int capacity;
HPDatetype* a;
}HP;//结构体管理堆(管理数组)
void HeapInit(HP* pHP);//初始化堆
void HeapDestroy(HP* pHP);//销毁堆
void HeapPush(HP* pHP, HPDatetype x);//在堆中插入数据
void HeapPop(HP* pHP);//删除堆顶
HPDatetype HeapTop(HP* pHP);//返回堆顶数据
bool HeapEmpty(HP* pHP);//判断是否为空
size_t HeapSize(HP* pHP);//返回数组的大小
堆的C文件:
#include "Heap.h"
void HeapInit(HP* pHP)
{
assert(pHP);
pHP->a = NULL;
pHP->capacity = 0;
pHP->size = 0;
}
void HeapDestroy(HP* pHP)
{
assert(pHP);
free(pHP->a);
pHP->a = NULL;
pHP->capacity = 0;
pHP->size = 0;
}
void Swap(HPDatetype* pchild, HPDatetype* pparent)
{
HPDatetype temp = *pchild;
*pchild = *pparent;
*pparent = temp;
}//堆中的数据互换
void AdjustUP(HPDatetype *p, int child)//向上调整
{
int parent = (child - 1) / 2;
while (child > 0)
{
if (p[child] < p[parent])//如果换成大堆的话把<换成>
{
//Swap(p + child, p + parent);
Swap(&p[child], &p[parent]);
child = parent;
parent = (child - 1) / 2;
}
else
{
break;
}
}
}
void AdjustDown(HPDatetype* p, int size, int parent)//向下调整
{
int child = parent * 2 + 1;//左孩子的下标
while (child < size)
{
if (child + 1 < size && p[child] > p[child + 1])//不能保证右孩子一定存在
{//如果换成大堆的话把>换成<
child++;//比较右孩子和左孩子哪个大(大堆)或者哪个小(小堆)
}
if (p[child] < p[parent])//如果换成大堆的话把<换成>
{
Swap(&p[child], &p[parent]);
parent = child;
child = parent * 2 + 1;
}
else
{
break;
}
}
}
void HeapPush(HP* pHP, HPDatetype x)
{
assert(pHP);
if (pHP->size == pHP->capacity)
{
int newcapacity = pHP->capacity == 0 ? 4 : pHP->capacity * 2;
HPDatetype* temp = (HPDatetype*)realloc(pHP->a, sizeof(HPDatetype) * newcapacity);
if (temp == NULL)
{
perror("realloc fail");
exit(-1);
}
pHP->a = temp;
pHP->capacity = newcapacity;
}
pHP->a[pHP->size] = x;
pHP->size++;
AdjustUP(pHP->a, pHP->size - 1);//上一行对size进行了++操作,我们控制的是下表,而size是元素个数,所以要减一
}
void HeapPop(HP* pHP)
{
assert(pHP);
assert(pHP->size);
Swap(&pHP->a[0], &pHP->a[pHP->size - 1]);
pHP->size--;
AdjustDown(pHP->a, pHP->size, 0);
}
HPDatetype HeapTop(HP* pHP)
{
assert(pHP);
assert(pHP->size);
return pHP->a[0];
}
bool HeapEmpty(HP* pHP)
{
assert(pHP);
return pHP->size == 0;
}
size_t HeapSize(HP* pHP)
{
assert(pHP);
return pHP->size;
}
主函数:
#include "Heap.h"
void test1()
{
int arr[] = { 4, 6, 2, 1, 5, 8, 2, 9 };
HP hp;
HeapInit(&hp);
for (int i = 0; i < sizeof(arr) / sizeof(int); i++)
{
printf("%d ", arr[i]);
}
printf("\n");
for (int i = 0; i < sizeof(arr) / sizeof(int); i++)
{
HeapPush(&hp, arr[i]);
}
for (int i = 0; i < sizeof(arr) / sizeof(int); i++)
{
printf("%d ", arr[i]);
}
printf("\n");//修改的不是arr数组,arr只是插入的数据,修改的是结构体中a地址处的数组,所以打印出来全是一样的
}
int main()
{
test1();
return 0;
}
需要注意的是,上述代码并非堆排序,而是创建堆,在堆中插入或删除数据,同样实现大小堆
堆插入和删除数据
上述代码中在堆中插入数据的代码是void HeapPush(HP* pHP, HPDatetype x)
插入数据是在数组尾部插入,然后向上调整,和父亲结点比较大小,然后调整顺序。
上述代码中在堆中删除数据的代码是void HeapPop(HP* pHP)
删除数据采用堆顶和尾部数据交换的方式进行,这样交换过后,根节点的子树还是堆,只需要在向下调整就行,不会打乱数据。
我们向上或者向下调整数据的时候也只需要通过父亲和孩子的关系int child = parent * 2 + 1;
或int parent = (child - 1) / 2;
进行直接调整,并不会影响其他数据。
堆这种数据结构好就好在如果出现大量的数据,调整数据只需要执行高度次,这在出现大量数据的时候可以极大的提升效率。
建堆的时间复杂度:
我们采用也是自顶向下的建堆方式,就是新数据在后面然后向上调整。逻辑上看上去就像是从上面开始建堆,一点一点向下。
这种自顶向下的建堆方式时间复杂度是O(n·logn)。
因为每一次要走当前高度次,也就是h或者log(n)(n表示当前元素个数),这样看来时间复杂度应该是log(n!),因为每一次走的高度并不同。但是时间复杂度本身就是看数量级的,数据近似相等就行,当出现大量的数据时那么O(log1+log2+...+logn)=O(log(n!))=O(nlogn)
具体证明方式可见https://blog.csdn.net/hzh_0000/article/details/80955511