Java-数据结构-Map和Set-(二)-哈希表 |ू・ω・` )

文本目录:

❄️一、哈希表:

   ☑ 1、概念:

       ☑ 2、冲突-概念:

       ☑ 3、冲突-避免:

         ☞ 1)、避免冲突-哈希函数的设计:

          ☞ 2)、避免冲突-负载因子调节(重点):

        ☑ 4、冲突-解决:

            ➷ 1)、解决冲突-闭散列:

             ➷ 2)、解决冲突-开散列 / 哈希桶(重点):

         ☑ 5、哈希表的实现:

         ▶ 1)、put(int key,int value)方法:

          ▶ 2)、getVal(int key)方法:

         ☑ 6、性能分析:

        ☑ 7、和Java类集的关系:

❄️总结:


❄️一、哈希表:

   ☑ 1、概念:

      顺序结构以及平衡树中,元素存储码与其存储位置之间没有对应的关系,因此在我们查找一个元素的时候呢,必需要根据关键码的多次比较。

      顺序查找的时间复杂度为O(N),在平衡树中查找的话就是树的高度为O(logN)。搜索效率取决于搜索过程中元素的比较次数。

       我们理想的搜索方法是:可以不经过任何的比较,一次直接从表中搜索到我们要查找的元素。如果构造一种数据结构,通过某种函数使元素的存储位置与它关键码之间能够建立一一映射关系,那么在查找中可以通过该函数快速查找到该函数。

实现:当向该结构中:

1、插入元素的时候:

         可以根据待插入的关键码,以此函数计算出该元素的存储位置并按照此位置进行存放。

2、查找元素的时候:

         对元素的关键码进行同样的函数计算,把得到的函数值。

     该方法呢就是 哈希(散列)方法,哈希方法的使用的转换函数称为 哈希(散列)函数,其构造出来的结构称为 哈希(散列)表。

我们来举一个例子来看看: 数据为{1,7,6,4,9,5};

      哈希函数设置为:hash = key % capacity,其中capacity 是总空间的大小。

    使用这个方法呢,进行搜索的时候呢,不需要进行多次关键字的比较,这直接可以找到,所以搜索效率比较高。 但是还是有些问题的,我们如果插入 11 的话呢,11 % 10 = 1,但是 1 下标的位置呢,已经有元素了,这样呢就会产生所谓的 —— 冲突,那么我们要如何解决并且降低这种冲突呢?我们往后来看:


       ☑ 2、冲突-概念:

       对于两个数据元素的关键字有 ki 和 kj (i != j),有 ki != kj,但是呢 hash(ki) == hash(kj),就是相当于 1 和 11 但是呢 hash(1) == hash(11),在 capacity 为10 的情况下。

       就是不同的 关键字 通过 哈希函数 计算相同的 哈希地址,该种现象称为 哈希冲突 或者 哈希碰撞。

       我们呢把不同的关键码而具有相同的 哈希地址 的数据元素称之为 “同义词”


       ☑ 3、冲突-避免:

      我们呢要知道一个点,由于我们的哈希表底层数组的容量往往是小于实际要存储的关键字的数量的,这就导致我们的 冲突是必然要发生的,但是我们能做的就是尽量 降低冲突率。


         ☞ 1)、避免冲突-哈希函数的设计:

      引起哈希冲突的可能的一个原因是:哈希函数设计不合理。

设计规则:

 1、哈希函数的定义域必须包括存储的关键字码,而如果哈希表有 m 个地址,其值域必须在0-m-1之间。

2、哈希函数设计出来的地址能够均匀的分布在整个空间中。

3、哈希函数比较简单。

常见的哈希函数:

     1、直接定制法(常用):

     取关键字的某个线性函数为散列地址:Hash(Key) = A * Key + B,优点:简单、均匀。

缺点:需要实现知道关键字的分布情况。使用场景:适合查找比较小并且连续的情况。


     2、除留余数法(常用): 

     设散列表中允许的地址数为 m,取一个不大于 m,但接近或者等于 m 的质数 p 作为除数。

按照 哈希函数:Hash(Key) = key % p(p <= m),将关键码转换成 哈希地址。


      3、平方取中法(了解):

     这个用于 不知道关键字的分布,而位数又不是很大的情况下。

比如:存放1234这个关键字,其平方为 1522756 ,抽取中间的三位数 227 作为哈希地址。


      4、折叠法(了解):

     这个方法是关键字从左到右分割成位数相等的几个部分(最后一个部分可以短些),然后将这几部分叠加求和,并按照散列表的表长,取后几位作为 哈希地址。

      折叠法适合事先不需要知道关键字的分布,适合关键字位数比较多的情况


      5、随机取数法(了解):

      选择一个随机函数,取关键字的随机函数值为它的哈希地址,即 H(key) = random(key),其中random 为随机数函数。
      通常应用于关键字长度不等时。


      6、数学分析法(了解):

     数字分析法通常适合处理关键字位数比较大的情况,如果事先知道关键字的分布且关键字的若干位分布较均匀的情况。


我们要注意:我们 哈希函数 设计的越好,其产生的 哈希冲突呢就越小,但是呢还是无法解决冲突


          ☞ 2)、避免冲突-负载因子调节(重点):

     负载因子就是: 填入表中的元素个数 / 散列表的长度 = 负载因子

     我们的 负载因子 和 填入表中的元素个数 是成正比的,所以当我们的 负载因子越大,可以填入的元素个数就越多,冲突发生的概率就越小,所以我们可以改变 负载因子来调节冲突。

     所以我们就可以 提高散列表的长度 来使 复杂因子 降低,就可以使填入的元素个数增加了。

我们的 负载因子 要控制在 0.7~0.8 之间。

我们了解了如何才能尽量避免冲突,接下来我们来看看如何才能解决冲突。


        ☑ 4、冲突-解决:

   解决冲突的常见的两种方法就是:闭散列 和 开散列


            ➷ 1)、解决冲突-闭散列:

      闭散列:也叫开放定址法,当发生哈希冲突时,如果哈希表未被装满,说明在哈希表中必然还有空位置,那么可以把 key 存放到冲突位置中的 “下一个”  空位置中去。

那么我们如何才能找到这个下一个位置呢? 对于这个我们呢有两种方法可以找到:

1、线性探测:

    就比如我们的上面的那个例子,如果我们想要插入 11 的话呢,就是根据 哈希函数 计算出我们的 哈希地址 之后呢我们查看 这个地址是否有元素,如果有就放到其下一个位置,就可以了。

我们来看看这个例子: 

缺点呢就是:这个方法呢会使冲突的元素集中到了一起。

我们的目的是把其芬分布的均匀一点,这个就有很大的缺陷。


2、二次探测:

       我们的二次探测的方法呢,有一个公式可以找到要插入的位置:Hi = (H0 + i^2) % m 或者是 Hi = (H0 - i^2) % m ,其中呢 i = 1,2,3,4,5......... ,H0 是根据 哈希函数 计算出的 key 的哈希地址,m 呢是我们表的长度

       我们一上面的例子为例,来看看如何实现的:

      但是呢对于 闭散列 呢有一个很大的缺陷,就是 空间的利用率 很低 ,这就是一个缺陷了,所以呢我们就有了两一种方法了——开散列/哈希桶。


             ➷ 2)、解决冲突-开散列 / 哈希桶(重点):

     开散列法又叫链地址法(开链法),首先对关键码集合用散列函数计算散列地址,具有相同地址的关键码归于同一子集合,每一个子集合称为一个桶,各个桶中的元素通过一个单链表链接起来,各链表的头结点存储在哈希表中。

 其实就是 数组+链表的一个组合方式。我们把每一个数据设为一个节点,放到我们的地址后面:

开散列 可以看成是把每一个大集合中的搜索问题转化为 小集合中的搜索问题。 


         ☑ 5、哈希表的实现:

     我们的 HashSet 的底层呢是 HashMap ,和我们上次介绍的 TreeSet 和 TreeMap 是差不多的,所以呢,这里我们自实现的 哈希表 呢就是 key-value 的,并且我们的 哈希表 是一个节点数组,所以我们来看看 哈希表的 的节点的代码,并且还要有我们的一个 负载因子

public class HashBuck {
    //节点
    static class Node {
        public int key;
        public int value;
        public Node next;

        public Node(int key,int value) {
            this.key = key;
            this.value = value;
        }
    }
    //哈希桶是一个节点数组,所以我们使用节点来创建一个数组
    public Node[] array = new Node[10];
    //有效的数据长度
    public int usedSize;

    //负载因子
    public static final double DEFAULT_LOAD_FACTOR = 0.75f;
}

         ▶ 1)、put(int key,int value)方法:

1、先使用 哈希函数 计算出 key 的 哈希地址

2、我们检查一下我们的这个 哈希地址 下的数组中时候有 key 这个值。如果有就要 更新 value。

3、如果没有和 key 相同的值,我们使用 头插法 进行把 key 值插入进去。(jdk1.8是尾插法)

4、usedSize++

5、我们的usedSize++,之后呢要检查我们的 负载因子 是否比我们的定义的大,如果大,我们就需要扩容。

 对于这里的扩容方法呢,不是简单的直接把原数组扩大 2 倍就可以的,如果这样写就是不对的。

扩容的注意:

        注意:就比如上面的例子,我们的扩大 2 倍之后呢,我们的长度是不是变成了 20,而我们的上面的 11 这个数据是不是就不是放到 1 这个地址的位置了,应该放到 11 这个位置了,所以我们的扩容方法呢,要遍历一遍我们的所有数据,对其进行重新计算 哈希地址 来放入我们的数据

       1、我们要把 cur.next 的位置记录下来,因为当我们把 11 放到 新的位置之后呢,我们的cur这个的 next 节点就找不到了,所以我们需要记录下来。

来看看这个扩容的代码:

private void resize() {
        
        Node[] newarray = new Node[2 * array.length];
        for (int i = 0; i < array.length; i++) {
            Node cur = array[i];
            while (cur != null) {
                int newindex = cur.key % newarray.length;
                Node curN = cur.next;
                cur.next = newarray[newindex];
                newarray[newindex] = cur;
                cur = curN;
            }
        }

        array = newarray;
    }

这样之后呢,我们来看看对于 put 这个方法是如何编写的:

public void put(int key,int value) {
        //计算地址
        int index = key % array.length;

        //检查是否出现相同的 key 值
        Node cur = array[index];
        while (cur != null) {
            if (cur.key == key) {
                cur.value = value;
                return;
            }
            cur = cur.next;
        }

        //如果没有key值的话,使用头插法把新的节点插入到 哈希表中
        Node newNode = new Node(key,value);
        newNode.next = array[index];
        array[index] = newNode;

        //插入之后有效长度增加
        usedSize++;

        //判断负载因子
        if (loadFactor() >= DEFAULT_LOAD_FACTOR) {
            //扩容
            resize();
        }
    }

    //计算负载因子
    private double loadFactor() {
        return usedSize * 1.0 / array.length;
    }

          ▶ 2)、getVal(int key)方法:

     对于这个呢就很简单了,我们同样先计算出我们的 哈希地址 之后呢,根据这个地址再来寻找我们传入的 key 所对应的 value 值。

      我们呢来直接看代码如何编写的:

public int getVal(int key) {
        int index = key % array.length;
        Node cur = array[index];
        while(cur != null) {
            if (cur.key == key) {
                return cur.value;
            }
            cur = cur.next;
        }

        return -1;
    }

到这里我们的 哈希表 就结束了,对于 哈希表 就只实现这两个方法就可以了。


         ☑ 6、性能分析:

     我们呢一般把每个桶中的链表的长度是一个常数,所以呢,通常我们的 哈希表的 插入/删除/查时间复杂度为 O(1)。  


        ☑ 7、和Java类集的关系:

1. HashMap 和 HashSet 即 java 中利用哈希表实现的 Map 和 Set
2. java 中使用的是哈希桶方式解决冲突的
3. java 会在冲突链表长度大于一定阈值后,将链表转变为搜索树(红黑树)

   这个阈值是:数组长度大于 64 && 链表的长度超过了 8 
4. java 中计算哈希值实际上是调用的类的 hashCode 方法,进行 key 的相等性比较是调用 key 的 equals 方法。所以如果要用自定义类作为 HashMap 的 key 或者 HashSet 的值,必须覆写 hashCode 和 equals 方法,而且要做到 equals 相等的对象,hashCode 一定是一致的。


❄️总结:

    OK,我们这次对于 哈希表 的介绍和简单的实现原理呢到这里也就结束了,我们接下来呢,来解决几道关于 哈希表 相关的题吧!!!让我们尽情期待吧~拜拜~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/884870.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

cloud-(Nacos)--注册中心原理-服务注册-服务发现

并且通过(RestTemplate)Http请求实现了跨微服务的远程调用。不过这种手动发送Http请求的方式存在一些问题 在大型微服务项目中,服务提供者的数量会非常多,为了管理这些服务就引入了注册中心的概念。注册中心、服务提供者、服务消费者三者间关系如下: 流程如下: 服务启动…

Mac安装Manim并运行

1.在macOS上创建Python虚拟环境&#xff0c;可以使用venv模块&#xff0c;这是Python自带的库&#xff0c;也可以使用conda。以下是使用venv创建和使用Python虚拟环境的步骤&#xff1a; 打开终端。 创建一个新的目录来存放你的项目&#xff0c;并进入该目录&#xff1a; mk…

15.安卓逆向-frida基础-HOOK类方法1

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 内容参考于&#xff1a;图灵Python学院 本人写的内容纯属胡编乱造&#xff0c;全都是合成造假&#xff0c;仅仅只是为了娱乐&#xff0c;请不要盲目相信。 工…

WEB服务器——Tomcat

服务器是可以使用java完成编写&#xff0c;是可以接受页面发送的请求和响应数据给前端浏览器的&#xff0c;而在开发中真正用到的Web服务器&#xff0c;我们不会自己写的&#xff0c;都是使用目前比较流行的web服务器。 如&#xff1a;Tomcat 1. 简介 Tomcat 是一个开源的轻量…

【CAM350】使用总结 <二>{ 光绘Gerber 比较 }

一、 比较两份版本不同的光绘文件&#xff1a; //Analysis-Compare layers// 二、参数默认&#xff0c;比较完成给出结果 三、也可以直接在一份文件上选择“Draw on top” 四、对比差距直观可见

家中浮毛太多怎么办?希喂、米家、安德迈更推荐哪款?

在现代养宠家庭生活中&#xff0c;宠物空气净化器已经成为不可或缺的家电之一。 而在众多空气净化器类型中&#xff0c;宠物空气净化器以其独特的设计和卓越的净化效果&#xff0c;逐渐赢得了越来越多养宠家庭的青睐。 它不仅能有效地吸附空中飞舞的浮毛&#xff0c;还能高效…

基于SSM+小程序的在线课堂微信管理系统(在线课堂1)(源码+sql脚本+视频导入教程+文档)

&#x1f449;文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 &emsp1、管理员实现了首页、个人中心、用户管理、课程分类管理、课程信息管理、课程订阅管理、课程视频管理、公告栏管理、留言板管理、系统管理。 2、用户实现了首页、课程信息、公…

此连接非私人连接

当你手机浏览器输入网站打开提示“此连接非私人连接&#xff0c;此网站可能在冒充来窃取你的个人或财务信息。你应回到之前的页面”这是因为该网站的SSL数字证书到期导致&#xff0c;需要此网站的管理员重新申请数字证书替换之前的文件才可以实现。 注意&#xff1a;如果你不是…

实用SQL小总结

WHERE 条件 column 为纯英文字符 或 不包含任何字符 语法&#xff1a; SELECT * FROM your_table WHERE REGEXP(your_column,^[A-Za-z]$); SELECT * FROM your_table WHERE NOT REGEXP(your_column,^[A-Za-z]$);例&#xff1a; SELECT DISTINCT t.pldlibho FROM kibb_pldlyw…

LLM - 使用 vLLM 部署 Qwen2-VL 多模态大模型 (配置 FlashAttention) 教程

欢迎关注我的CSDN&#xff1a;https://spike.blog.csdn.net/ 本文地址&#xff1a;https://spike.blog.csdn.net/article/details/142528967 免责声明&#xff1a;本文来源于个人知识与公开资料&#xff0c;仅用于学术交流&#xff0c;欢迎讨论&#xff0c;不支持转载。 vLLM 用…

02-ZYNQ linux开发环境安装,基于Petalinux2022.2和Vitis2022.2

petalinux安装 Petalinux 工具是 Xilinx 公司推出的嵌入式 Linux 开发套件&#xff0c;包括了 u-boot、Linux Kernel、device-tree、rootfs 等源码和库&#xff0c;以及 Yocto recipes&#xff0c;可以让客户很方便的生成、配置、编译及自定义 Linux 系统。Petalinux 支持 Ver…

uniapp EChars图表

1. uniapp EChars图表 &#xff08;1&#xff09;Apache ECharts 一个基于 JavaScript 的开源可视化图表库   https://echarts.apache.org/examples/zh/index.html &#xff08;1&#xff09;官网图例 &#xff08;2&#xff09;个人实现图例 1.1. 下载echart 1.1.1. 下…

docker - 迁移和备份

文章目录 1、docker commit1.1、查询 容器 docker ps1.2、docker commit zookeeper zookeeper:3.4.13 2、docker save -o2.1、宿主机 切换到 /opt 目录下2.2、将镜像保存到 宿主机/opt目录下 3、docker load -i 对某一个容器修改完毕以后&#xff0c;我们可以把最新的容器部署到…

【文心智能体 | AI大师工坊】如何使用智能体插件,完成一款旅游类智能体的开发,来体验一下我的智能体『​​​​​​​厦门CityWalk』

目录 1.1、智能体运行效果 1.2、创作灵感来源 1.3、如何制作智能体 1.4、可能会遇到的几个问题 1.5、快速调优指南 『厦门CityWalk&#x1f680;』我的优质智能体&#xff1a;https://0nxj3k.smartapps.baidu.com/?_swebfr1&_swebScene3621000000000000 在当今这个全…

Bytebase 2.22.3 - 一键回滚 PostgreSQL DML 变更

&#x1f680; 新功能 支持一键回滚 PostgreSQL DML 变更。 &#x1f384; 改进 优化 DML 事前备份和回滚体验&#xff1a; 引导用户创建 bbdataarchive 数据库。如果没有 bbdataarchive 数据库&#xff0c;无法开启备份功。用户现在可以在创建工单之后开启或关闭备份功能&a…

Python | Leetcode Python题解之第437题路径总和III

题目&#xff1a; 题解&#xff1a; class Solution:def pathSum(self, root: TreeNode, targetSum: int) -> int:prefix collections.defaultdict(int)prefix[0] 1def dfs(root, curr):if not root:return 0ret 0curr root.valret prefix[curr - targetSum]prefix[cu…

ROS学习笔记(四):使用 `ros2 run usb_cam usb_cam_node_exe` 启动 USB 摄像头

文章目录 前言1 安装 usb_cam 包2 启动 USB 摄像头3 订阅相机发布的节点信息并进行可视化3.1 使用 rqt_image_view3.2 使用 image_view3.3 使用 rviz 4 常见问题与解决方案4.1 摄像头未被识别4.2 相机显示异常4.3 如何指定不同的相机4.4 摄像头参数调整 5. 调试信息 5. 结论 前…

9.5K Star,开源在线网盘

Hi&#xff0c;骚年&#xff0c;我是大 G&#xff0c;公众号「GitHub 指北」会推荐 GitHub 上有趣有用的项目&#xff0c;一分钟 get 一个优秀的开源项目&#xff0c;挖掘开源的价值&#xff0c;欢迎关注。 随着云存储的广泛应用&#xff0c;越来越多的人和企业需要一个简单、…

用Promise实现前端并发请求

/** * 构造假请求 */ async function request(url) {return new Promise((resolve) > {setTimeout(() > {resolve(url);},// Math.random() * 500 800,1000,);}); }请求一次&#xff0c;查看耗时&#xff0c;预计应该是1s&#xff1a; async function requestOnce() {c…

docker安装Portainer CE

docker安装Portainer CE 教程 1、简介 Portainer 是一款开源的容器管理工具&#xff0c;旨在帮助用户更轻松地管理 Docker 环境。无论您是 Docker 新手还是经验丰富的开发人员&#xff0c;Portainer 都提供了直观的用户界面&#xff0c;使您能够方便地创建、部署和监控容器。…