数据结构图

树是无环连通图，是一种特殊的图。

分类

图分为有向图[边是有方向的]和无向图[边是无方向的]。

无向图(a—b)，建立两条有向图(a—>b，b—>a)，无向图是一种特殊的有向图。

存储有向图

邻接矩阵 ——用于存储比较稠密的图【O(n^2)】

开一个二维数组，g[a,b]，a—>b；如果有权重，存权重，如果没有权重，就是布尔值；不能存储重边。

邻接表

n个点，每个点都有一个单链表，每个点的单链表存储该点可以到达的点，单链表内部点的顺序不重要。

//插入a—>b的边，在a所对应的单链表中插入b

void add(int a, int b) {

e[idx] = b;

ne[idx] = h[a];

h[a] = idx++;

}

有向图的遍历

宽度优先遍历

一层一层搜索

框架

queue ＜——　将起始状态插入队列中，即将1号点插入队列

while （queue 不空）{

t 每次取队头元素

拓展 t 所有能到的点 x

if（x 未被遍历）{

　queue <——x 将 x 入队

d[x]=d[t]+1

}

}

例题——图中点的层次

给定一个n个点m条边的有向图，图中可能存在重边和自环。

所有边的长度都是1，点的编号为1~n。

请你求出1号点到n号点的最短距离，如果从1号点无法走到n号点，输出-1。

输入格式

第一行包含两个整数n和m。

接下来m行，每行包含两个整数a和b，表示存在一条从a走到b的长度为1的边。

输出格式

输出一个整数，表示1号点到n号点的最短距离。

数据范围

1≤n,m≤10^5

输入样例

4 5

1 2

2 3

3 4

1 3

1 4

输出样例

代码

#include<iostream>
#include<cstring>
using namespace std;
const int N = 100010;
int n, m;
int h[N], e[N], ne[N], idx;
int d[N], q[N];
void add(int a, int b) {//插入函数
	e[idx] = b;
	ne[idx] = h[a];
	h[a] = idx++;
}
int bfs() {
	int hh = 0, tt = 0;
	q[0] = 1;
	memset(d, -1, sizeof d);//初始化距离，-1代表未被初始化
	d[1] = 0;
	while (hh <= tt) {//判断队列是否为空
		int t = q[hh++];//取队头
		for (int i = h[t];i != -1;i = ne[i]) {//扩展队头
			int j = e[i];
			if (d[j] == -1) {
				d[j] = d[t] + 1;
				q[++tt] = j;
			}
		}
	}
	return d[n];
}
int main() {
	cin >> n >> m;
	memset(h, -1, sizeof h);//初始化表头
	for (int i = 0;i < m;i++) {
		int a, b;
		cin >> a >> b;
		add(a, b);
	}
	cout << bfs() << endl;
}

深度优先遍历

找到一个起点，然后从这个起点开始，一条路走向黑

邻接表的深度优先遍历

主函数：

for(int i=0;i<n;i++) dfs(i); //枚举起点

dfs：

利用图中结点的编号进行搜索，e存图中结点的编号

int h[N], e[M], ne[M], idx;//h存n个链表的链表头，e存每个结点的值是多少，ne存每个结点的next值

bool st[N];

//树和图的深度优先搜索

void dfs(int u) {//u是当前dfs到的点

st[u] = true;//标记一下，已经被搜过了

for (int i = h[u];i != -1;i = ne[i]) {//遍历u的所有出边

int j = e[i];//链表中该点在图中的编号

if (!st[j])//如果j没有被搜过，那么就进行搜索

dfs(j);

}

例题——树的重心

给定一颗树，树中包含n个结点（编号1~n）和n-1条无向边【无向图】。

请你找到树的重心，并输出将重心删除后，剩余各个连通块中点数的最大值。

重心定义：重心是指树中的一个结点，如果将这个点删除后，剩余各个连通块中点数的最大值最小，那么这个节点被称为树的重心。

输入格式

第一行包含整数n，表示树的结点数。

接下来n-1行，每行包含两个整数a和b，表示点a和点b之间存在一条边。

输出格式

输出一个整数m，表示重心的所有的子树中最大的子树的结点数目。

数据范围

1≤n≤10^5

输入样例

1 2

1 7

1 4

2 8

2 5

4 3

3 9

4 6

输出样例

代码

#include<iostream>
#include<cstring>
using namespace std;
const int N = 100010, M = N * 2;
int n;
int h[N], e[M], ne[M], idx;//h存n个链表的链表头，e存每个结点的值是多少，ne存每个结点的next值
bool st[N];
int ans = N;//答案，存最小的最大值
//插入a—>b的边，在a所对应的单链表中插入b
void add(int a, int b) {
	e[idx] = b;
	ne[idx] = h[a];
	h[a] = idx++;
}
//树和图的深度优先搜索
int dfs(int u) {//u是当前dfs到的点,返回以u为根的子树中，点的数量【以u为根的子树的大小】
	st[u] = true;//标记一下，已经被搜过了
	int sum = 1, res = 0;//res存删去重心后，每一个连通块大小的最大值；sum存当前子树的大小
	for (int i = h[u];i != -1;i = ne[i]) {//遍历u的所有初边
		int j = e[i];//链表中该点在图中的编号
		if (!st[j]) {//如果j没有被搜过，那么就进行搜索
			int s = dfs(j);//当前子树的大小
			res = max(res, s);//当前子树是一个连通块，所以与之前连通块的最大值进行比较
			sum += s;//以u的子结点为根结点的子树是以u为根结点子树的一部分
		}
	}
	res = max(res, n - sum);
	ans = min(ans, res);
	return sum;
}
int main() {
	cin >> n;
	memset(h, -1, sizeof h);//邻接表初始化，头指向-1
	for (int i = 0;i < n - 1;i++) {
		int a, b;
		cin >> a >> b;
		add(a, b);
		add(b, a);
	}
	dfs(1);//可以从任意点开始搜
	cout << ans << endl;
	return 0;
}

特殊的图——树[无环连通图]

概念

在计算器科学中，树（英语：tree）是一种抽象数据类型或是实现这种抽象数据类型的数据结构，用来模拟具有树状结构性质的数据集合。它是由n（n>0）个有限节点组成一个具有层次关系的集合。把它叫做“树”是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。

结点

指树中的一个元素；

结点的度

指结点拥有的子树的个数，二叉树的度不大于2；

树的度

指树中的最大结点度数；

叶子

度为0的结点，也称为终端结点；

高度

叶子节点的高度为1，根节点高度最高；

层

根在第一层，以此类推；

特点

一个父结点可以有多个子结点，一个子结点只能有一个父结点，多个子结点对应一个父结点。

①每个节点有零个或多个子节点；

②没有父节点的节点称为根节点；

③每一个非根节点有且只有一个父节点；

④除了根节点外，每个子节点可以分为多个不相交的子树；

二叉树

概念

每个节点最多含有两个子树的树称为二叉树。（我们一般在书中试题中见到的树是二叉树，但并不意味着所有的树都是二叉树。）

性质

1：二叉树的第i层上至多有2^(i-1)个结点

2：深度为k的二叉树，至多有2^k-1个结点

满二叉树

除最后一层无任何子节点外，每一层上的所有节点都有两个子节点。也可以这样理解，除叶子节点外的所有节点均有两个子节点。节点数达到最大值，所有叶子节点必须在同一层上。

完全二叉树

若设二叉树的深度为h，除第h层外，其它各层 (1～(h-1)层) 的节点数都达到最大个数（即节点均满），第h层所有的节点都连续集中在最左边（虽然最下面一层节点不满，但是所有节点在左边连续排列，空位都在右边），这就是完全二叉树。

性质

结点 i 的子结点为 2*i 和 2*i+1 (前提是都小于总结点数)
结点 i 的父结点为 i/2
如果n个节点的完全二叉树的节点按照层次并按从左到右的顺序从0开始编号：

- 序号为0的节点是根
- 对于 i>0，其父节点的编号为（i-1）/2
- 若 2*i+1<n，其左子节点的序号为 2*i+1，否则没有左子节点
- 若 2*i+2<n，其右子节点的序号为 2*i+2，否则没有右子节点

遍历

深度优先遍历

按照一条路径尽可能的向前探索，直至检查完一个叶节点。

先序和中序可以唯一确定一个树【在先序中找父结点，在中序确定位置，得到左子树和右子树】

中序和后序可以唯一确定一个树【在后序中找父结点，在中序确定位置，得到左子树和右子树】

先序和后序不能唯一确定一个树【不能确定左子树和右子树的情况】

这三种遍历方法只是访问结点的时机不同，访问结点的路径都是一样的，时间和空间复杂度皆为O(n)

先序根->左子树->右子树

父左->右

先输出父节点，然后从左到右输出子节点

中序左子树->根->右子树

先输出左节点，然后输出父节点，最后输出右节点

后序左子树->右子树->根

先输出左节点，然后输出右节点，最后输出根节点

宽度优先搜索

在所有路径上齐头并进，按照路径长度由近到远访问节点，即按照二叉树的层数逐层访问树中的节点。

例题

先序：10 6 5 2 7 14 18 17 19

中序：2 5 6 7 10 14 17 18 19

后序：2 5 7 6 17 19 18 14 10

层次：10 6 14 5 7 18 2 17 19

作用

高效地存储和查找字符串集合的数据结构

适用于字符类型不多的字符串

如何存储字符串集合

有一个根节点，但该节点不存放数据。

存储的时候，应该在每个单词的结尾做标记，表示以该字母结尾的结点有一个单词。防止查找时，误以为该树存储了该字符串的子串。例如，树中存储“abcd”，若没有做标记，在查找“abc”是否在树中时，容易误以为该串存在，做标记后，查找到最后一个字符时，应该检测是否有结束标志，若没有则不存在。

如何查找

从根结点开始，挨个字符在对应层上寻找，若找到就继续向下一层找对应的字符，直到找到最后一个字符，观察字符上是否有结束标记，若有则说明该树上存储了该字符串，若是没有则说明该树上没有存储。若是直接没在该层上找到对应的字符，则说明该树上没有存储。

模板

数据含义

整型 idx 用于给所有的存入树的字符进行编号，idx = 0 既表示根节点，又表示空节点（根节点不存数据）
数组 cnt 用于表示以某个 idx 表示的字符为结尾的字符串的个数
二维数组 son 用于存储每个 idx 对应的所有子节点，在 son 中的元素值为0，表示空节点

son 数组中元素的值代表该节点的子节点所在的位置，即 son 数组的高维度的编号。【son[a][b]=c表示该节点的子节点位于son[c]中】例如，先后存入 abc、abcd、abd、bcd。

为什么 son 不能存储每一层的字母，而是使用这种方式存储？

如果 son 存储每一层的字母，则分不清该字母是哪一个节点下的子节点了。

存储

每次存储字符串都是从根节点开始存储。当存储一个字符时，就应该给该字符编号，并根据编号跳到 son 中编号对应的那一层【将一维置为该编号】，该层存储该编号的所有子节点。当存储到字符串的最后一个字符时，应将该字符的编号作为 cnt 数组的下标，令该元素自身数据自增，表示以该编号所表示的字符为结尾的字符串个数+1，即表示该树上存储了多少个相同的字符串。

//存储
void insert(char str[]) {
    int p = 0;//根节点是0
    for (int i = 0;str[i];i++) {//从根节点开始，从前往后遍历
//因为字符串的最后一个字符是空字符，所以可以使用空字符判断该字符串是否到达末尾
        int u = str[i] - 'a';//将“a~z”映射成“0~25”
        if (!son[p][u]){//如果p这个节点不存在u这个儿子，就将其创造出来
            ++idx;
            son[p][u] = idx;//写成son[p][u]=++idx;是未定义行为，一个序列点对应两个副作用
        }
        p = son[p][u];
    }
    cnt[p]++;//表示以p点结尾的单词数多了一个
}

查找——返回字符串出现的次数

查找和存储思路一样，只是发现没存储该字符就直接返回0，表示没存储该字符串，存储该字符时才跳转。

int query(char str[]){
    int p=0;
    for(int i=0;str[i];i++){
        int u=str[i]-'a';
        if(!son[p][u])
            return 0;//不存在该字符串时直接返回0
        p=son[p][u];
    }
    return cnt[p];
}

输出——遍历输出树中所有的字符串

使用 dfs ，将当前的字符编号作为参数传入，表示要遍历该层26个字符，使用一个 string 存储当前遍历所组成的字符串，若遍历到某个字符存在树中，则将其放在 string 的末尾，并检测是否在以该字符编号为结尾的字符串，如果存在则输出。之后以其子节点层数编号作为新的参数执行 dfs 。当26个字符都没有存储在树中，则说明该路径上的所有的字符串遍历完成，应该进行回退，回退到上一层时，应将 string 的最后一个字符删去。之后遍历该层其他字符。

string temp;
void dfs(int p){
    for(int i=0;i<26;i++){
        if(son[p][i]){
            char tp[2]={'a'+i};
            temp.append(tp);
            if(cnt[son[p][i]]){
                cout<<temp<<endl;
            }
            dfs(son[p][i]);
            temp.pop_back();
        }
    }
}

例题——Trie字符串统计

维护一个字符串集合，支持两种操作：

“I x”向集合中插入一个字符串x；

“Q x”询问一个字符串在集合中出现了多少次。

共有N个操作，输入的字符串总长度不超过 10^5，字符串仅包含小写英文字母。

输入格式

第一行包含整数N，表示操作数。

接下来N行，每行包含一个操作指令，指令为”I x”或”Q x”中的一种。

输出格式

对于每个询问指令”Q x”，都要输出一个整数作为结果，表示x在集合中出现的次数。

每个结果占一行。

数据范围

1≤N≤2∗10^4

输入样例

I abc

Q abc

Q ab

I ab

Q ab

输出样例

#include<iostream>

using namespace std;

const int N = 100010;

int son[N][26], cnt[N], idx;//下标是0的点，既是根结点，又是空结点

//cnt 存以当前这个点结尾的单词有多少个

char str[N];

//存储

void insert(char str[]) {

int p = 0;

for (int i = 0;str[i];i++) {

int u = str[i] - 'a';

if (!son[p][u])//如果p这个结点不存在u这个儿子，就将其创造出来

son[p][u] = ++idx;

p = son[p][u];

}

cnt[p]++;

}

//查询

int query(char str[]) {

int p = 0;

for (int i = 0;str[i];i++) {

int u = str[i] - 'a';

if (!son[p][u])

return 0;

p = son[p][u];

}

return cnt[p];

}

int main() {

int n;

scanf("%d", &n);

while (n--) {

char op[2];

scanf("%s%s", op, str);

if (op[0] == 'I')

insert(str);

else

printf("%d\n", query(str));

}

return 0;

}