哈希冲突的常见解决方法【附C++代码】

        在C++中,哈希表是一种常用的数据结构,用于实现快速的插入、删除和查找操作。

哈希表的核心在于哈希函数,它将输入的关键字转换为一个数组索引。然而,不同的关键字可能映射到相同的索引,这种情况称为哈希冲突。

有效地解决哈希冲突是确保哈希表性能的关键。

1. 开放地址法

概念:开放地址法是指当一个关键字映射的位置已经被占用时,会寻找下一个空闲的位置进行存放。查找时,若原位置没有找到,则按照同样的规则继续查找下一个可能的位置。

优点:实现简单,无需额外的数据结构。

缺点:可能会导致某些区域过于密集,影响性能;删除操作复杂

代码示例

#include <iostream>
#include <vector>

class OpenAddressingHashTable {
public:
    explicit OpenAddressingHashTable(size_t size) : table(size, -1), used(size, false) {}

    void insert(int key) {
        size_t index = key % table.size();
        while (used[index]) {
            index = (index + 1) % table.size(); // 线性探测法
        }
        table[index] = key;
        used[index] = true;
    }

    bool search(int key) {
        size_t index = key % table.size();
        while (used[index]) {
            if (table[index] == key) return true;
            index = (index + 1) % table.size();
        }
        return false;
    }

private:
    std::vector<int> table;
    std::vector<bool> used;
};

2. 链地址法(哈希桶)

概念:链地址法是在每个数组位置上挂接一个链表,所有映射到该位置的元素都存储在这个链表中。

优点:冲突少时效率高,支持动态扩容,删除操作简单。

缺点:链表过长时,查找效率降低。

代码示例(基于之前提供的哈希桶示例):

#include <iostream>
#include <list>
#include <vector>

class HashBucket {
public:
    explicit HashBucket(size_t size = 10) : buckets(size) {}

    void insert(int key, std::string value) {
        size_t index = hashFunction(key);
        buckets[index].push_back({key, value});
    }

    std::string search(int key) {
        size_t index = hashFunction(key);
        for (const auto& pair : buckets[index]) {
            if (pair.first == key) {
                return pair.second;
            }
        }
        return "Not Found";
    }

    void remove(int key) {
        size_t index = hashFunction(key);
        auto& bucket = buckets[index];
        bucket.erase(std::remove_if(bucket.begin(), bucket.end(),
                                    [key](const auto& p){ return p.first == key; }),
                     bucket.end());
    }

private:
    std::size_t hashFunction(int key) const {
        return key % buckets.size(); // 简单的取模哈希函数
    }

    std::vector<std::list<std::pair<int, std::string>>> buckets;
};

int main() {
    HashBucket hashTable;

    hashTable.insert(10, "Apple");
    hashTable.insert(25, "Banana");
    hashTable.insert(20, "Cherry");

    std::cout << "Search 10: " << hashTable.search(10) << std::endl; // 应输出 Apple
    std::cout << "Search 30: " << hashTable.search(30) << std::endl; // 应输出 Not Found

    hashTable.remove(20);
    std::cout << "Search 20 after removal: " << hashTable.search(20) << std::endl; // 应输出 Not Found

    return 0;
}

3. 再哈希法

概念:当发生冲突时,使用第二个哈希函数计算另一个位置,如果仍冲突,则继续使用第三个或更多哈希函数,直到找到空位。

优点:可以减少聚集现象。

缺点:需要设计多个哈希函数,增加了实现复杂度。

代码示例(简略示例):

class RehashHashTable {
public:
    void insert(int key) {
        size_t index = primaryHash(key);
        if (isOccupied(index)) {
            index = secondaryHash(key); // 假设这是第二个哈希函数
            // 可能需要更多的检查和重哈希直到找到空位
        }
        // 实际插入逻辑省略
    }

private:
    size_t primaryHash(int key) { /* 主哈希函数实现 */ }
    size_t secondaryHash(int key) { /* 辅助哈希函数实现 */ }
    bool isOccupied(size_t index) { /* 检查位置是否已被占用 */ }
};

4. 建立公共溢出区(使用率低)

概念:当主表满时,额外分配一块区域作为溢出区,所有冲突的元素都放入这个区域,并以某种顺序(如链表)链接起来。

优点:实现简单。

缺点:查找效率较低,因为可能需要遍历整个溢出区。

        解决哈希冲突的策略各有优劣,选择哪种方法取决于具体的应用场景和性能要求。开放地址法适合内存有限且数据量不大的情况;链地址法则更适合数据量大且需要频繁插入删除的场景;再哈希法和建立公共溢出区则是针对特定需求的解决方案,可能在某些特殊场景下更为合适。

        在实际应用中,还需要考虑哈希函数的设计、哈希表的动态扩容机制等因素,以进一步优化性能。C++标准库中的std::unordered_mapstd::unordered_set就是使用了类似链地址法的实现,结合了动态扩容机制,提供了高效的哈希表操作接口。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/655198.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

k8s中的集群调度

文章目录 k8s中的集群调度Pod 创建流程 通过指定节点来创建pod所在的node节点通过标签来指定pod创建在哪个节点上pod 的亲和性Pod的亲和性和反亲和性亲和性&#xff08;Affinity&#xff09;反亲和性&#xff08;Anti-Affinity&#xff09; 污点与容忍污点&#xff08;Taint&am…

2024年,史上最强的数据库资料集合

&#x1f4a8;&#x1f3f9;&#x1f300; 2024年&#xff0c;史上最强的数据库资料集合 N种数据库的全方位整理&#xff1a; mysql&#xff0c;mariaDB&#xff0c;Percona Server&#xff0c;Redis&#xff0c;RocksDB&#xff0c;Cassandra&#xff0c;CouchDB&#xff0c…

【LeeCode算法】第67题:二进制求和

目录 一、题目描述 二、初次解答 三、官方解法 四、总结 一、题目描述 二、初次解答 1. 思路&#xff1a;将a和b两个字符串转换成十进制&#xff0c;然后将相加的结果转换回文本的二进制。 2. 代码&#xff1a; char* addBinary(char* a, char* b) {int a_len strlen(a);i…

保障餐饮场所安全:可燃气体报警器专业检测的必要性

在餐饮行业&#xff0c;火灾隐患一直是备受关注的问题。为了有效预防和及时发现可燃气体泄漏&#xff0c;可燃气体报警器的专业检测周期显得尤为重要。 今天&#xff0c;佰德和大家一起来深入了解一下可燃气体报警器的专业检测周期&#xff0c;若您对此有不同的观点或其他的问…

鸿蒙ArkUI-X跨语言调用说明:【平台桥接开发指南(Android)BridgePlugin】

BridgePlugin (平台桥接) 本模块提供ArkUI端和Android平台端消息通信的功能&#xff0c;包括数据传输、方法调用和事件调用。需配套ArkUI端API使用&#xff0c;ArkUI侧具体用法请参考[Bridge API]。 说明&#xff1a; 开发前请熟悉鸿蒙开发指导文档&#xff1a; gitee.com/li-…

OSPF优化——OSPF减少LSA更新量2

二、特殊区域——优化非骨干区域的LSA数量 不是骨干区域、不能存在虚链路 1、不能存在 ASBR 1&#xff09;末梢区域 该区域将拒绝 4、5LSA的进人&#xff0c;同时由该区域连接骨干0区域的ABR 向该区域&#xff0c;发布一条3类的缺省路由; 该区域内每台路由器均需配置&#xf…

1---Linux下进程的概念(逻辑推导,全干货无废话)

一、进程和程序&#xff1a; 1.1什么是程序&#xff1f; 程序由代码、数据、逻辑、接口和文档组成的一组按特定顺序执行的计算机指令&#xff0c;用于实现特定功能或解决问题。程序存储在磁盘上。 1.2什么是进程&#xff1f; 进程是一个正在执行的程序实例&#xff0c;包含程…

LLM提示工程的技巧

1. 从简单开始&#xff08;Start Simple&#xff09; 避免在一开始就增加太多的复杂性。 从简单的提示开始&#xff0c;然后在后续提示中添加更多信息和上下文。 这样&#xff0c;提示就是一个迭代过程&#xff0c;提示在此过程中进一步发展。 从简单的开始&#xff0c;就有足…

Matplotlib绘图指南:从基础绘图到多子图展示

目录 前言 导入模块 第一点&#xff1a;绘制图像 第二点&#xff1a;保存图像 第三点&#xff1a;多图形的绘制 第四点&#xff1a;绘制多子图 总结 前言 在数据可视化中&#xff0c;Matplotlib是一款强大的Python库&#xff0c;提供了丰富的功能来绘制各种类型的图表。…

【Linux】自己实现一个bash进程

bash就是命令行解释器&#xff0c;就是Linux操作系统让我们看到的&#xff0c;与用户进行交互的一种外壳&#xff08;shell&#xff09;&#xff0c;当然了bash也是一个进程&#xff0c;它有时候就是通过创建子进程来执行我们输入的命令的。这无疑就离不开我们上篇博客所说的进…

Python零基础一天丝滑入门教程(非常详细)

目录 第1章 初识python 第1节 python介绍 1.为什么要学习Python&#xff1f; 2.python排名 3.python起源 4.python 的设计目标 第2节 软件安装 第2章 快速上手&#xff1a;基础知识 第1节 Python3 基础语法 Python 变量 字面量 数据类型转换 Python3 注释 数据类…

《java数据结构》--队列详解

一.认识队列&#x1f431; 初识队列&#x1f638; 队列和栈类似都对数据的存取有着严格的要求&#xff0c;不同的是栈遵循先进后出的原则&#xff0c;而队列遵循先进先出的原则&#xff0c;栈是只有一端可以存取&#xff0c;队列是一端存&#xff0c;一端取。这里我来画一个图…

Java的类路径究竟是什么?

回答 问了chatgpt这个问题&#xff0c;首先类路径的定义是&#xff1a; 是指一组路径&#xff0c;这些路径告诉Java虚拟机&#xff08;JVM&#xff09;和类加载器在哪里可以找到应用程序所需的类和资源文件。说白了就是在运行java程序的时候需要先将java源代码编译成class文件…

Layui 项目打开左侧菜单空白解决方案

home/index.html 页面中 替换 navigation 为 menu

网络安全行为可控定义以及表现内容简述

在数字化快速发展的今天&#xff0c;网络安全已成为国家和企业不可或缺的防线。据统计&#xff0c;网络攻击事件频发&#xff0c;给全球经济带来了巨大损失。因此&#xff0c;确保网络安全行为可控显得尤为重要。今天我们来聊聊网络安全行为可控定义以及表现内容。 网络安全行为…

【Rust日报】Rust 中的形式验证

文章 - 未来的愿景&#xff1a;Rust 中的形式验证 这篇文章回顾了形式化验证的基本概念&#xff0c;作者展示了如何使用 Hoare triples 来描述和推理程序的正确性&#xff0c;以及如何使用分离逻辑来解决验证的复杂性。文章还解释了为什么 Rust 适用于形式化验证&#xff0c;以…

Java程序员必备技能之MySQL数据库 图解整理/快速入门

恭喜大家来到全新的篇章——MySQL数据库,这一篇我们将学会MySQL数据库的原理、使用sql对数据库的增删改查操作、以及对MySQL数据库的权限管理和用户管理等内容。请大家耐心看下去,相信大家在看完这篇文章后,一定可以学会MySQL数据库(不会Java也可以学会!)。 ps:想要补充…

Shell脚本基本命令

文件名后缀.sh 编写shell脚本一定要说明一下在#&#xff01;/bin/bash在进行编写。命令选项空格隔开。Shell脚本是解释的语言&#xff0c;bash 文件名即可打印出编写的脚本。chmod给权限命令。如 chmod 0777 文件名意思是给最高权限。 注意:count赋值不能加空格。取消变量可在变…

菜鸟学dubbo 2.x配置笔记(更新中)

一、标签示例 provider.xml 示例 <beans xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xmlns:dubbo"http://dubbo.apache.org/schema/dubbo"xmlns"http://www.springframework.org/schema/beans"xsi:schemaLocation"http://w…

树莓派开箱

1.树莓派4B配置 CPU&#xff1a;64位1.5GHZ四核处理器。 GPU:Broadcom VideoCore VI500MHZ 蓝牙5.0 电源Type C(5V 3A),也可以使用排针链接5V锂电池最大放电电流必须达到3A。 还有千兆以太网等以后用到再说。 接下来进入文章重点 2.镜像文件烧录 前期准备&#xff1a;1…