Python - 深夜数据结构与算法之 Map Set

目录

一.引言

二.Map 与 Set

1.Hash Table

2.Hash Function

3.Hash Collisions

4.Java/Python Code

三.经典算法实战

1.Two-Sum [1]

2.Group-Anagrams [49]

3.Valid-Anagram [242]

四.总结


一.引言

前面介绍了列表 List 及其衍生的栈 Stack 与队列 Queue,接下来我们介绍常见的数据结构 Map 与 Set,这两个数据结构底层结构很多都是通过 Hash Table 实现,当然也有使用二叉树的案例。下面我们简单学习下 Hash Table 及其相关的 Map & Set。

二.Map 与 Set

1.Hash Table

通过 Hash 函数我们可以将我们需要存储的值映射到一个下标 index 并存储到数组中。因为其是一一对应的关系,所以天然的也可以实现去重。

2.Hash Function

下面是 Hash Function 映射的示例,这里我们存储的 key 是一个 String,存储的 Value 是 Int,我们通过获取每个字符 Char 的 ASCII 码并相加 mod 10,最终得到 9,从而将 value=20 存储在数组中 9 的位置。

3.Hash Collisions

Hash 碰撞,对于一个 Hash Table 而言,好的 Hash Function 可以使得到的元素存储索引尽可能的分散,但实际情况中难免出现不同字符 Hash 到相同为止的情况。当使用 ASCII + mod 的 Hash Function 时,就会出现碰撞的情况,此时一种做法是直接覆盖,这样做会造成数据的丢失或异常,还有一种做法就是做一条 '拉链',我们在索引 9 处构造一个链表,每当碰撞时都会给链表添加一个新的 Node,以此类推。使用 Hash Table 寻找索引的时间复杂度为 o(1),但是如果索引处出现多次重复将会导致查询的复杂度升级为 o(n),所以对于 Hash Table 而言,一个好的 Hash Function 很关键。

4.Java/Python Code

◆ Java

由 Hash Table 衍生而来最常用的数据结构就是 Map 与 Set,其中 Map 的 key 不重复,value 可以重复,其存储 k-v 对;而 Set 则是只存储不重复的元素。 最常用的就是 HashMap、HashSet,可以在 Collections 库中找到实现。

◆ Python

Python 使用 dict{} 与 set{} 实现,相比 Java 会更加简洁一点,但其存储特性和功能是一致的。 

三.经典算法实战

1.Two-Sum [1]

两数之和: https://leetcode-cn.com/problems/two-sum/

◆ 题目分析

算法的经典老大哥,在数组遍历的同时,我们引入 HashMap 记录遍历的值与索引,空间换时间提高算法效率。

◆ 索引缓存

class Solution(object):
    def twoSum(self, nums, target):
        """
        :type nums: List[int]
        :type target: int
        :rtype: List[int]
        """
        re = {}

        for i in range(len(nums)):
            cur_val = target - nums[i]
            # 寻找与 target 的差值是否在 re 中
            if cur_val in re:
                # 在的话直接返回索引
                return [i, re[cur_val]]
            else:
                re[nums[i]] = i

通过 HashMap 存储对应元素的值与索引,如果找到匹配的值,返回二者的下标,没有找到匹配则存储继续向后遍历。 

2.Group-Anagrams [49]

字母异位词分组: https://leetcode.cn/problems/group-anagrams/

◆ 题目分析

字母异位词是指两个字符串字符与数量相同,但是位置不同的字符,例如 "abc"、"bca"、"cba" 等等。这里一个简单的方法就是对字符串进行排序即 sort,排序后的字符串有序,这样我们根据 key 构造 HashMap 存储即可。

◆ 字符排序

class Solution(object):

    def groupAnagrams(self, strs):
        """
        :type strs: List[str]
        :rtype: List[List[str]]
        """
        re = {}

        for text in strs:
            # 排序后的字符作为 key
            sorted_text = ''.join(sorted(text))
            if sorted_text not in re:
                re[sorted_text] = []
            # 添加结果
            re[sorted_text].append(text)
        
        return re.values()

这个题目和后面第 242 题的有效的字母异位词比较类似,都是借助 HashTable 实现去重和比较。 

3.Valid-Anagram [242]

有效的字母异位词: https://leetcode.cn/problems/valid-anagram

◆ 题目分析

有效的字母异位词,这里 Anagram 就是英文里异位词的意思,给定两个字符串,如果二者的每个字符出现次数一样,则认为二者互为异位词。因为是针对每个字符 Char 其出现次数一样,这里我们可以很快想到使用 WordCount,而最简单的办法就是构造 HashMap。

◆ WordCount

class Solution(object):
    def isAnagram(self, s, t):
        """
        :type s: str
        :type t: str
        :rtype: bool
        """
        # 长度不一致直接返回
        if len(s) != len(t):
            return False

        # 统计字符数量是否相等
        word_count = {}
        
        # 遍历 s 的 char
        for char in s:
            if char not in word_count:
                word_count[char] = [0, 0]
            word_count[char][0] += 1
        
        # 遍历 t 的 char
        for char in t:
            # 情况1: 不满足包含相同字符
            if char not in word_count:
                return False
            word_count[char][1] += 1

        for listValue in word_count.values():
            # 情况2: 不满足字符数量相同
            if listValue[0] != listValue[1]:
                return False
        
        return True
            

使用 dict 记录 key 是否相同,key 不同直接返回 False;key 相同的情况下判断数组中 s、t 的 char 数量是否相同即可。 

◆ WordCount Plus

class Solution(object):
    def isAnagram(self, s, t):
        """
        :type s: str
        :type t: str
        :rtype: bool
        """
        if len(s) != len(t):
            return False

        # 统计字符数量是否相等
        word_count = {}
        for i in range(len(s)):

            # 加减抵消
            if t[i] not in word_count:
                word_count[t[i]] = 0
            if s[i] not in word_count:
                word_count[s[i]] = 0

            word_count[s[i]] += 1
            word_count[t[i]] -= 1

        for count in word_count.values():
            if count != 0:
                return False

        return True

上面这个方法使用 [0, 0] 的计数数组进行 Char 的比较,还有一个省事的办法是使用一个变量,s 使用 +,t 使用 - ,如果遍历完该变量为 0,则代表 Char 数量一致。内存

◆ WordCount Pro Max

class Solution(object):
    def isAnagram(self, s, t):
        """
        :type s: str
        :type t: str
        :rtype: bool
        """
        if len(s) != len(t):
            return False

        # 统计字符数量是否相等
        word_count = [0] * 26

        for char in s:
            word_count[ord(char) - ord('a')] += 1

        for char in t:
            word_count[ord(char) - ord('a')] -= 1

        # 判断 0
        for count in word_count:
            if count != 0:
                return False

        return True

这里使用 ASCII 码 + List 实现了上面简介里最朴素的 Hash Function,这里使用 ord 获取 ASCII 码,使用 - ord('a') 获取相对位置,虽然用了 [0] x 26 限制了空间,但是空间复杂度还是不好。这里主要是引入 ord ASCII 码的思想,而上面的 Plus 则是引入抵消的思想。

四.总结

这里 HashMap 和 Set 的题目相比 ArrayList、Stack 和 Queue 要少一些,但是其核心思想需要掌握,那就是去重以及其空间换时间的操作。除此之外,这里我们学到了字符串的排序与字符串的 ASCII 码,这些辅助办法在后续的题目中也会需要。Keep Fighting!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/260118.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

VR全景技术在政务服务中有哪些应用,为政务服务带来什么便利

引言: 随着科技的不断发展,虚拟现实(VR)全景技术正逐渐成为政务服务领域的一项重要工具。其独特的沉浸式体验为政务服务带来了全新的便利,提升了公众参与的积极性。 一、VR全景技术在政务服务中的应用 1.虚拟实景政务…

多表插入、删除操作(批量)——后端

多表插入 场景:当添加一个菜品时,还需要记录菜品的口味信息,因此需要对菜品表(dish)和口味表(dish_flavor)同时进行插入操作。 两个表的字段: 代码思路:由DishControll…

市场全局复盘 20231220

短线核心:不参与任何级别的调整 昨日回顾: SELECT CODE,成交额排名,净流入排名,代码,名称,DDE大单金额,涨幅,主力净额,DDE大单净量,CONVERT(DATETIME, 最后封板, 120) AS 最后封板,涨停分析,_3日涨幅百分比,连板天,封单额,封单额排名,DDE散户数量,总金额…

Android Studio使用Genymotion

1. Genymotion介绍 GenyMotion速度之快令人发指,模拟效果堪比真机调试,支持绝大部分的模拟器功能,甚至包括语音,Google Now,支持eclipse, android studio。非常适合用来开发和演示效果。 2. Genymotion下载 Genymotio…

CentOS操作学习(二)

上一篇学习了CentOS的常用指令CentOS指令学习-CSDN博客 现在我们接着学习 一、Vi编辑器 这是CentOS中自带的编辑器 三种模式 进入编辑模式后 i:在光标所在字符前开始插入a:在光标所在字符串后开始插入o:在光标所在行的下面另起一新行插入…

Java操作Word修订功能:启用、接受、拒绝、获取修订

Word的修订功能是一种在文档中进行编辑和审阅的功能。它允许多个用户对同一文档进行修改并跟踪这些修改,以便进行审查和接受或拒绝修改。修订功能通常用于团队合作、专业编辑和文件审查等场景。 本文将从以下几个方面介绍如何使用免费工具Free Spire.Doc for Java在…

使用包、Crate 和模块管理项目(下)

1、使用 use 关键字将路径引入作用域 在之前的示例中我们引用模块中的函数或者结构体之类的,都是需要用到相对路径或者绝对路径去引用,然尔在这里,有一种方法可以简化这个过程。我们可以使用 use 关键字创建一个短路径,然后就可以…

创建Maven Web工程

目录下也会有对应的生命周期。其中常用的是:clean、compile、package、install。 比如这里install ,如果其他项目需要将这里的模块作为依赖使用,那就可以 install 。安装到本地仓库的位置: Java的Web工程,所以我们要选…

Ubuntu上安装MySQL以及hive

Ubuntu上安装MySQL以及hive 一、安装MySQL1、更新软件源2、安装 MySQL3、启动 MySQL,并登录 MySQL4、关闭 MySQL 指令:5、修改登录密码6、关闭 mysql,然后重新进入 二、安装hive1、创建 hive 的数据库2、下载压缩包3、修改环境配置文件并激活…

【ECharts】折线图

文章目录 折线图1折线图2折线图3示例 参考: Echarts官网 Echarts 配置项 折线图1 带X轴、Y轴标记线,其中X轴是’category’ 类目轴,适用于离散的类目数据。 let myChart echarts.init(this.$refs.line_chart2); let yList [400, 500, 6…

使用postman时,报错SSL Error: Unable to verify the first certificate

开发中使用postman调用接口,出现以下问题,在确认路径、参数、请求方式均为正确的情况下 解决方法 File - Settings -> SSL certification verification 关闭 找到图中配置,这里默认是打开状态,把它关闭即可:ON …

智能化制造与工业自动化:发展历程、问题与解决、未来趋势及全球应用

导言 智能化制造与工业自动化正成为全球制造业的主要趋势。本文将深入研究其发展历程、遇到的问题及解决过程、未来的可用范围,以及在各国的应用和未来的研究趋势。同时,将讨论在哪些方面能够取得胜利,并在哪些方面发力,实现自身价…

JavaWeb笔记之前端开发HTML

一、引言 1.1HTML概念 网页,是网站中的一个页面,通常是网页是构成网站的基本元素,是承载各种网站应用的平台。通俗的说,网站就是由网页组成的。通常我们看到的网页都是以htm或html后缀结尾的文件,俗称 HTML文件。 …

Docker 网络模式 -day05

docker 启动时候还会有&#xff0c;名为docker0的虚拟网桥&#xff0c;注意网址为 127.0.0.1 [rootiZuf6hxabqikytnrumsi4gZ ~]# ifconfig docker0: flags4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500inet 172.17.0.1 netmask 255.255.0.0 broadcast 172.17.255.2…

ChatGPT如何计算token数?

GPT 不是适用于某一门语言的大型语言模型&#xff0c;它适用于几乎所有流行的自然语言。所以 GPT 的 token 需要 兼容 几乎人类的所有自然语言&#xff0c;那意味着 GPT 有一个非常全的 token 词汇表&#xff0c;它能表达出所有人类的自然语言。如何实现这个目的呢&#xff1f;…

RK3568平台开发系列讲解(Linux系统篇)GPIO接口介绍

🚀返回专栏总目录 文章目录 一、GPIO 子系统接口二、GPIO描述符相关结构体沉淀、分享、成长,让自己和他人都能有所收获!😄 📢在目前的 Linux 内核主线中,GPIO(通用输入/输出)子系统存在两个版本,这里将两个版本区分为新版本和旧版本。新版本 GPIO 子系统接口是基于…

【项目管理】redmine

Redmine是用Ruby开发的基于web的项目管理软件&#xff0c;是用ROR框架开发的一套跨平台项目管理系统&#xff0c;据说是源于Basecamp的ror版而来&#xff0c;支持多种数据库&#xff0c;有不少自己独特的功能&#xff0c;例如提供wiki、新闻台等&#xff0c;还可以集成其他版本…

nodejs微信小程序+python+PHP购物商城网站-计算机毕业设计推荐

目 录 摘 要 I ABSTRACT II 目 录 II 第1章 绪论 1 1.1背景及意义 1 1.2 国内外研究概况 1 1.3 研究的内容 1 第2章 相关技术 3 2.1 nodejs简介 4 2.2 express框架介绍 6 2.4 MySQL数据库 4 第3章 系统分析 5 3.1 需求分析 5 3.2 系统可行性分析 5 3.2.1技术可行性&#xff1a;…

防反接电路与MOS管防反接深入解析

一、经典防反接电路 1、二极管防反接 这种电路使用一个二极管将电源的正极与负极相连&#xff0c;当电源的极性正确时&#xff0c;二极管处于正向导通状态&#xff0c;电流可以正常流过&#xff1b;而当电源的极性反接时&#xff0c;二极管处于反向截止状态&#xff0c;电流无…

函数(C++)

1.7 函数1.7.1 函数缺省参数1.7.2 哑元1.7.3 引用参数1.7.4 返回引用1.7.5 函数重载 1.7 函数 1.7.1 函数缺省参数 在C中&#xff0c;函数的形参列表中的形参是可以有默认值的。有默认值的参数即为默认参数。 在函数调用时&#xff0c;有默认参数可以缺省。 语法&#xff1…