【数据结构】前缀树的模拟实现

目录

1、什么是前缀树?

2、模拟实现

2.1、前缀树节点结构

2.2、字符串的添加

2.3、字符串的查寻

2.3.1、查询树中有多少个以字符串"pre"作为前缀的字符串

2.3.2、查询某个字符串被添加过多少次 

2.4、字符串的删除

3、完整代码


 

1、什么是前缀树?

前缀树又名字典树,单词查找树,Trie树,是一种多路树形结构,是哈希树的变种,和hash效率有一拼,是一种用于快速检索的多叉树结构,。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词颛统计。

它的优点:最大限度地减少无谓的字符比较,查询效率比哈希表还高。
Trie的核心思想是空间换时间。利用字符串的公共前缀来降低査询时间的开销以达到提高效率的目的。
Trie树的缺点:Trie树的内存消耗非常大。
性质:不同字符串的相同前缀只保存一份。
操作:查找,插入,删除。

注:本文章的前缀树功能都是基于字符串的

举个例子,例1:假设有:“abc”,“adf”,“cf”,“abcf”,“adf” 这五个字符串,则前缀树结构入下所示

2、模拟实现

以下的解析都是以上面的例1作为例子

2.1、前缀树节点结构

解释:创建一个前缀树节点类,前缀树节点中,我们并不放值,也就是并不放字符。我们把值,也就是字符,防止当前节点通往父节点的路上。前缀树节点类中有三个属性:int整形 pass、int整形 end  和  前缀树节点数组 nextS。

pass:pass用于记录当前这个节点经历过多少次,也就是上一级节点到当前节点的这条路通过了几次,这非常有助于查询树中有多少个字符串以某个字符串作为前缀。

end:记录这个节点是多少个字符串的结尾节点,这非常有助于查询某个字符串被加入过多少次。

节点数组 nextS[ ]:这是一个前缀树节点数组,用于记录当前这个节点通向下一个节点的路,比如:nextS[0] == null 没有走向'a’的路;nextS[0] != null 有走向'a’的路;......;nextS[25]!= nu1l 有走向'z’的路。这里数组中下标与字符的对应关系为:0->a; 1->b; 2->c; ......; 24->y; 25->z ,这钟关系在代码中的转换方式为:先定义一个下标变量index,然后每次要访问数组时,先让下标变量index等于要转换的字符减去字符‘a’就可以了,即:比如字符‘c’的转换为 index = 'c' - 'a'; 这条语句执行完后index会等于2,也就成功把字符'c'转换成数字2了。

节点结构代码

//前缀树的节点结构类
    public static class TreeNode {
        public int pass;  //pass用于记录当前这个点经历过多少次
        public int end;  //表示这个节点是多少个字符串的结尾节点
        //nextS是当前节点的下级节点,本实例中数组中的元素个数为26,从a到z
        public TreeNode[] nextS;  // HashMap<Char, TreeNode> nextS; 当字符种类特别多的时候,可以用HashMap

        public TreeNode() {
            pass = 0;
            end = 0;
            // nextS[0] == null 没有走向'a’的路
            // nextS[0] != null 有走向'a’的路
            // ...
            // nextS[25]!= null 有走向'z’的路
            nextS = new TreeNode[26];
        }
    }

2.2、字符串的添加

字符串的添加从root节点开始,先把要添加的字符串转换成字符数组,然后从左往右开始遍历添加。

如当前节点node要添加一个字符,添加的规则为:

注:数组nextS[ ]中的数组元素都是前缀树节点类型,其实就是节点

当node的nextS[ ]中与该字符对应的数组元素为空时:那就要先为这个数组元素初始化,给这个数组元素new一个实例对象,这个实例对象起始就是一个新创建的节点,然后来到这个新建的节点,让这个节点的pass加一,然后看当前添加的这个字符在字符数组是不是最后一个字符:如果是,则还需要让这个节点的end加一;如果不是,则按这种规则继续添加字符数组中后面还没添加的字符。

当node的nextS[ ]中与该字符对应的数组元素不为空时:那就直接来到这个数组元素,也就是这个节点,让这个节点的pass加一,然后看当前添加的这个字符在字符数组是不是最后一个字符:如果是,则还需要让这个节点的end加一;如果不是,则按这种规则继续添加字符数组中后面还没添加的字符。

实现代码: 

//把字符串word加入到树中
        public void insert(String word) {
            if (word == null) {
                return;
            }
            char[] chs = word.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            node.pass++;
            int index = 0;
            for (int i=0; i<chs.length; i++) {  //从左往右遍历字符
                index = chs[i] - 'a';  //由字符对应成要走哪条路
                if (node.nextS[index] == null) {
                    //当node的nextS[ ]中与该字符对应的数组元素为空时
                    node.nextS[index] = new TreeNode();
                }
                node = node.nextS[index];  //来到下一个节点
                node.pass++;
            }
            //当for循环结束了,就说明字符数组中的最后一个字符也添加完了,所以当前节点的end加一
            node.end++;
        }

2.3、字符串的查寻

2.3.1、查询树中有多少个以字符串"pre"作为前缀的字符串

例:比如我们要查询例1中的五个字符串中有多少个字符串以空字符串“ ”作为前缀,我们只需要返回root节点的pass,可以理解为root节点通往上一级节点的路为空,和空字符串对应,所以直接返回root节点的pass;

例:再比如我们要查询例1中的五个字符串中有多少个字符串以字符串“ab”作为前缀,我们先查看root下的a这条路是不是为空,如果为空就直接返回0,不为空就来到a这条路连接的下一个节点,然后我们查看来到的这个节点下的b这条路是不是为空,如果为空就直接返回0,不为空就来到b这条路连接的下一个节点,然后返回b这条路连接的下一个节点的pass,也就是2,这样我们就查询到了例1中的五个字符串中有2个字符串以字符串“ab”作为前缀。

以上两个例子都是在树中存在以字符串"pre"作为前缀的字符串的情况,如果不存在,那么在遍历字符数组时就会遇到有node的nextS[ ]中与当前查询字符对应的数组元素为空的情况,这时候直接返回0,因为这种情况就是表面树中不存在字符串“pre”,那就跟不可能存在以字符串"pre"作为前缀的字符串了

例:比如我们要查询例1中的五个字符串中有多少个字符串以字符串“aec”作为前缀,当我们来到a这条路连接的这个节点时,我们会发现这个节点的nextS数组中与字符‘e’对应的数组元素是空的,所以直接返回0。

实现代码: 

//查询所有加入的字符串中,有多少字符串是以字符串pre作为前缀的
        public int prefixNumber(String pre) {
            if (pre == null) {
                return 0;
            }
            char[] chs = pre.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            int index = 0;
            for (int i=0; i<chs.length; i++) {
                index = chs[i] - 'a';
                if (node.nextS[index] == null) {
                    return 0;
                }
                node = node.nextS[index];  //来到下一个节点
            }
            return node.pass;
        }

2.3.2、查询某个字符串被添加过多少次 

查询某个字符串被添加过多少次 和 查询树中有多少个以字符串"pre"作为前缀的字符串的规则是一样的,只是返回的节点属性不同,这里要返回的是节点的end,当字符数组遍历完后就会来到要查询的字符串的最后一个字符所对应的节点,然后返回这个节点的end就是这个字符串被添加过多少次 的结果了。

实现代码:

//查询word这个字符串加入过几次
        public int search(String word) {
            if (word == null) {
                return 0;
            }
            char[] chs = word.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            int index = 0;
            for (int i=0; i<chs.length; i++) {
                index = chs[i] - 'a';
                if (node.nextS[index] == null) {
                    return 0;
                }
                node = node.nextS[index];  //来到下一个节点
            }
            return node.end;
        }

2.4、字符串的删除

删除字符串和添加字符串规则相似,只是添加时是对节点的pass和end进行加一,而删除时是对节点的pass和end进行减一

实现代码: 

//删除字符串
        public void delete(String word) {
            if (search(word) != 0) {  //确定树中确实加入过word,才去执行删除操作
                char[] chs = word.toCharArray();
                TreeNode node = root;
                node.pass--;  //当前节点的pass减一
                int index = 0;
                for (int i=0; i<chs.length; i++) {
                    index = chs[i] - 'a';
                    if (--node.nextS[index].pass == 0) {
                        //java会自动去释放内存空间,所以java里可以直接把node下级的路直接标空
                        node.nextS[index] = null;
                        return;
                    }
                    node = node.nextS[index];
                }
                node.end--;  //node已经来到了字符串word中的最后一个字符,然后这个node的end减一
            }
        }

3、完整代码

public class Code01_TrieTree {

    //前缀树的节点结构类
    public static class TreeNode {
        public int pass;  //pass用于记录当前这个点经历过多少次
        public int end;  //这个节点是多少个字符串的结尾节点
        //nextS是当前节点的下级节点,本实例中数组中的元素个数为26,从a到z
        public TreeNode[] nextS;  // HashMap<Char, TreeNode> nextS; 当字符种类特别多的时候,可以用HashMap

        public TreeNode() {
            pass = 0;
            end = 0;
            // nextS[0] == null 没有走向'a’的路
            // nextS[0] != null 有走向'a’的路
            // ...
            // nextS[25]!= null 有走向'z’的路
            nextS = new TreeNode[26];
        }
    }

    //前缀树的类,内涵前缀树的构造方法和字符串的加入、删除、查找字符串加入了几次和以字符串pre作为前缀的字符串有多少个
    public static class Tree {
        private TreeNode root;

        public Tree() {
            root = new TreeNode();
        }

        //把字符串word加入到树中
        public void insert(String word) {
            if (word == null) {
                return;
            }
            char[] chs = word.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            node.pass++;
            int index = 0;
            for (int i=0; i<chs.length; i++) {  //从左往右遍历字符
                index = chs[i] - 'a';  //由字符对应成要走哪条路
                if (node.nextS[index] == null) {
                    //当node的nextS[ ]中与该字符对应的数组元素为空时
                    node.nextS[index] = new TreeNode();
                }
                node = node.nextS[index];  //来到下一个节点
                node.pass++;
            }
            //当for循环结束了,就说明字符数组中的最后一个字符也添加完了,所以当前节点的end加一
            node.end++;
        }

        //删除字符串
        public void delete(String word) {
            if (search(word) != 0) {  //确定树中确实加入过word,才去执行删除操作
                char[] chs = word.toCharArray();
                TreeNode node = root;
                node.pass--;  //当前节点的pass减一
                int index = 0;
                for (int i=0; i<chs.length; i++) {
                    index = chs[i] - 'a';
                    if (--node.nextS[index].pass == 0) {
                        //java会自动去释放内存空间,所以java里可以直接把node下级的路直接标空
                        node.nextS[index] = null;
                        return;
                    }
                    node = node.nextS[index];
                }
                node.end--;  //node已经来到了字符串word中的最后一个字符,然后这个node的end减一
            }
        }

        //查询word这个字符串加入过几次
        public int search(String word) {
            if (word == null) {
                return 0;
            }
            char[] chs = word.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            int index = 0;
            for (int i=0; i<chs.length; i++) {
                index = chs[i] - 'a';
                if (node.nextS[index] == null) {
                    return 0;
                }
                node = node.nextS[index];  //来到下一个节点
            }
            return node.end;
        }

        //查询所有加入的字符串中,有多少字符串是以字符串pre作为前缀的
        public int prefixNumber(String pre) {
            if (pre == null) {
                return 0;
            }
            char[] chs = pre.toCharArray();  //把字符串word转换成字符数组
            TreeNode node = root;
            int index = 0;
            for (int i=0; i<chs.length; i++) {
                index = chs[i] - 'a';
                if (node.nextS[index] == null) {
                    return 0;
                }
                node = node.nextS[index];  //来到下一个节点
            }
            return node.pass;
        }

    }
    
}

 

推荐:

java数据结构(哈希表—HashMap)含LeetCode例题讲解-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/m0_65277261/article/details/134712832?spm=1001.2014.3001.5501【计算机组成原理】存储器知识-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/m0_65277261/article/details/134770339?spm=1001.2014.3001.5501【计算机网络】(网络层)定长掩码和变长掩码_定长子网掩码和变长子网掩码-CSDN博客icon-default.png?t=N7T8https://blog.csdn.net/m0_65277261/article/details/134606175?spm=1001.2014.3001.5501

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/380090.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Flink 2.0 状态存算分离改造实践

本文整理自阿里云智能 Flink 存储引擎团队兰兆千在 FFA 2023 核心技术&#xff08;一&#xff09;中 的分享&#xff0c;内容关于 Flink 2.0 状态存算分离改造实践的研究&#xff0c;主要分为以下四部分&#xff1a; Flink 大状态管理痛点 阿里云自研状态存储后端 Gemini 的存…

Linux下的crontab定时执行任务命令详解

在LINUX中&#xff0c;周期执行的任务一般由cron这个守护进程来处理[ps -ef|grep cron]。cron读取一个或多个配置文件&#xff0c;这些配置文件中包含了命令行及其调用时间。 cron的配置文件称为“crontab”&#xff0c;是“cron table”的简写。 一、cron服务   cron是一个…

为什么要进行FTP替代?专业的FTP替代方案了解一下!

FTP&#xff08;File Transfer Protocol&#xff0c;文件传输协议&#xff09;的历史可以追溯到20世纪70年代&#xff0c;这是一个由美国国防部资助的早期计算机网络&#xff0c;后来发展成为互联网的前身。随着时间的推移&#xff0c;FTP经历了多次迭代和改进&#xff0c;以适…

有关网络安全的课程学习网页

1.思科网络学院 免费学习skillsforall的课程 课程链接&#xff1a;Introduction to Cybersecurity by Cisco: Free Online Course (skillsforall.com) 2.斯坦福大学计算机和网络安全基础 该证书对于初学者来说最有价值&#xff0c;它由最著名的大学之一斯坦福大学提供。您可…

【动态规划】【C++算法】2518. 好分区的数目

作者推荐 【动态规划】【前缀和】【C算法】LCP 57. 打地鼠 本文涉及知识点 动态规划汇总 LeetCode:2518. 好分区的数目 给你一个正整数数组 nums 和一个整数 k 。 分区 的定义是&#xff1a;将数组划分成两个有序的 组 &#xff0c;并满足每个元素 恰好 存在于 某一个 组中…

AVR 328pb ADC基本介绍和使用

AVR 328pb ADC基本介绍和使用 &#x1f4cd;结合参考同架构lgt8f328p中文文档&#xff1a;http://www.prodesign.com.cn/wp-content/uploads/2023/03/LGT8FX8P_databook_v1.0.4.pdf &#x1f4d8;328pb ADC特性 • 10-bit Resolution 10位分辨率 • 0.5 LSB Integral Non-lin…

猫头虎分享已解决Bug || JavaScript语法错误(Syntax Error):SyntaxError: Unexpected token

博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff01;《IDEA开发秘籍》 — 提升你的IDEA技能&#xff01;《100天精通鸿蒙》 …

leetcode(哈希表)49.字母异位词分组(C++详细解释)DAY5

文章目录 1.题目示例提示 2.解答思路3.实现代码结果 4.总结 1.题目 给你一个字符串数组&#xff0c;请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。 字母异位词 是由重新排列源单词的所有字母得到的一个新单词。 示例 示例 1: 输入: strs [“eat”, “tea”…

Golang的for循环变量和goroutine的陷阱,1.22版本的更新

先来看一段golang 1.22版本之前的for循环的代码 package mainimport "fmt"func main() {done : make(chan bool)values : []string{"chen", "hai", "feng"}for _, v : range values {fmt.Println("start")go func() {fmt.P…

Elasticsearch(四)

是这样的前面的几篇笔记&#xff0c;感觉对我没有形成知识体系&#xff0c;感觉乱糟糟的&#xff0c;只是大概的了解了一些基础知识&#xff0c;仅此而已&#xff0c;而且对于这技术栈的学习也是为了在后面的java开发使用&#xff0c;但是这里的API学的感觉有点乱&#xff01;然…

JavaScript 入门 完整版

目录 第一个知识点&#xff1a;引入js文件 内部引用: 外部引用: 第二个知识点&#xff1a;javascript的基本语法 定义变量&#xff1a; 条件控制(if - else if - else) 第三个知识点&#xff1a;javascript里的数据类型、运算符&#xff1a; 数字类型 字符串类型 布尔…

前端JavaScript篇之对执行上下文的理解

目录 对执行上下文的理解创建执行上下文 对执行上下文的理解 当我们在执行JavaScript代码时&#xff0c;JavaScript引擎会创建并维护一个执行上下文栈来管理执行上下文。执行上下文有三种类型&#xff1a;全局执行上下文、函数执行上下文和eval函数执行上下文。 在写代码的时…

FRP内网穿透需要注意的事情

安全性 SSH设置好密钥后&#xff0c;一定要关闭密码登陆。现在暴力破解策略往往是先派小鸡端口扫描看看谁可以密码访问&#xff0c;如果可以&#xff0c;然后定点爆破就开始了。不允许root登陆。FRP使用token验证。FRP服务端要输出配置文件&#xff0c;info等级就能显示访问ip…

mac docker 宿主机和容器间网络打通

动因 是这样&#xff0c;笔者最近满怀欣喜入手Docker&#xff0c;看着各种文章命令都是不断点头称道&#xff1a;“嗯嗯&#xff0c;不错不错”,在接下来终于准备大干一场的时候碰壁了&#xff0c;主要情况是说在Mac中跑了第一把的时候发现碰到&#xff0c;虚拟机和宿主机居然…

C语言笔试题之两数相加(多次反转链表实现)

实例要求&#xff1a; 1、给定两个非空链表&#xff08;l1和l2&#xff09;来代表两个非负整数&#xff1b;2、数字最高位位于链表开始位置&#xff1b;3、它们的每个节点只存储一位数字&#xff1b;4、将这两数相加会返回一个新的链表&#xff1b; 案例展示&#xff1a; 实例…

Leetcode刷题笔记题解(C++):面试题 08.07. 无重复字符串的排列组合

思路&#xff1a;因为字符之间互不相同&#xff0c;故使用全排列的方式去解题&#xff1b; 字符串长度为n&#xff0c;将第一个字母分别与后面每一个字母进行交换&#xff0c;生成n种不同的全排列&#xff1b;再用第二个元素与后面每一个元素进行交换&#xff0c;生成n - 1种不…

K8S之运用亲和性设置Pod的调度约束

亲和性 Node节点亲和性硬亲和实践软亲和性实践 Pod节点亲和性和反亲和性pod亲和性硬亲和实践 pod反亲和性 Pod 的yaml文件里 spec 字段中包含一个 affinity 字段&#xff0c;使用一组亲和性调度规则&#xff0c;指定pod的调度约束。 kubectl explain pods.spec.affinity 配置…

c语言实现io多路复用(select),进程,线程并发服务器

io多路复用&#xff08;select&#xff09;代码 #include<myhead.h> #include <sys/select.h> #define PORT 8888 #define IP "192.168.250.100" int main(int argc, char const *argv[]) { //创建套接字int sfd socket(AF_INET, SOCK_STREAM, 0…

Leetcode—60. 排列序列【困难】

2024每日刷题&#xff08;113&#xff09; Leetcode—60. 排列序列 算法思想 实现代码 class Solution { public:string getPermutation(int n, int k) {vector<int> nums(n);// f[i] i!vector<int> f(n 1, 1); string ans;iota(nums.begin(), nums.end(), 1…

Blazor入门100天 : 自做一个支持长按事件的按钮组件

好长时间没继续写这个系列博客了, 不知道大家还记得我吗? 话不多说,直接开撸. 配套源码 demo https://blazor.app1.es/b19LongPressButton ####1. 新建 net8 blazor 工程 b19LongPressButton 至于用什么模式大家各取所需, 我创建的是ssr单工程, 如果大家不小心建立错了按页…