Python-3.12.0文档解读-内置函数hash()详细说明+记忆策略+常用场景+巧妙用法+综合技巧


一个认为一切根源都是“自己不够强”的INTJ

个人主页:用哲学编程-CSDN博客
专栏:每日一题——举一反三
Python编程学习
Python内置函数

Python-3.12.0文档解读

目录

详细说明

功能描述

参数

返回值

特性

使用示例

注意事项

记忆策略

常用场景

使用场景一:字典键的哈希值计算

使用场景二:集合元素的唯一性验证

使用场景三:密码学和数据完整性验证

巧妙用法

技巧一:使用 hash() 进行数据分片

技巧二:使用 hash() 进行数据加密

技巧三:使用 hash() 进行对象标识

综合技巧

技巧一:使用 hash() 和 set() 进行高效的数据去重

技巧二:使用 hash() 和 dict() 进行快速查找和数据分组

技巧三:使用 hash() 和 functools.lru_cache() 进行函数结果缓存


详细说明

功能描述

hash(object) 是Python中的一个内置函数,用于返回对象的哈希值。哈希值是一个整数,它在字典查找元素时用于快速比较字典的键。哈希值的主要目的是为了提高数据结构的查找效率。

参数

  • object:需要计算哈希值的对象。这个对象必须支持哈希操作,即它必须定义了 __hash__() 方法。

返回值

返回一个整数,即对象的哈希值。如果对象不支持哈希操作(没有定义 __hash__() 方法),则抛出 TypeError。

特性

  1. 一致性:对于同一个对象,在同一解释器会话中多次调用 hash() 将始终返回相同的哈希值。然而,在不同的Python解释器会话或不同的计算机上,同一个对象的哈希值可能不同。
  2. 比较性:相同大小的数字变量(如整数和浮点数)即使类型不同,也可能有相同的哈希值。例如,hash(1) 和 hash(1.0) 返回相同的哈希值。
  3. 截断:对于自定义的 __hash__() 方法,hash() 函数会根据主机的位数来截断返回值。这意味着如果 __hash__() 方法返回一个非常大的整数,hash() 可能会返回一个截断后的值。

使用示例

# 示例1: 基本使用
print(hash(1))  # 输出: 1
print(hash(1.0))  # 输出: 1

# 示例2: 自定义类的哈希值
class MyClass:
    def __hash__(self):
        return 1234567890

obj = MyClass()
print(hash(obj))  # 输出: 1234567890

# 示例3: 不可哈希的对象
try:
    hash([1, 2, 3])  # 列表是不可哈希的
except TypeError as e:
    print(e)  # 输出: unhashable type: 'list'
注意事项
  • 哈希值的生成通常依赖于对象的内部状态,因此如果对象的状态改变,其哈希值也可能改变。这通常不适用于作为字典键的对象,因为字典键的哈希值在字典的生命周期内应该是恒定的。
  • 对于可变对象(如列表、字典和集合),通常不建议作为字典的键,因为它们是不可哈希的。

记忆策略

函数名与功能关联:将“hash”这个词与“哈希值”的概念联系起来。在计算机科学中,“hash”通常指的是将任意长度的输入(又称为预映射,pre-image)通过散列算法转换成固定长度的输出,该输出就是哈希值。因此,看到 hash 这个词,就可以联想到它与生成或获取哈希值有关。


常用场景

使用场景一:字典键的哈希值计算

在创建字典时,字典的键必须是可哈希的。使用 hash(object) 函数可以验证一个对象是否适合作为字典的键。

# 检查一个对象是否可以作为字典的键
class MyKey:
    def __init__(self, value):
        self.value = value

    def __hash__(self):
        return hash(self.value)  # 返回值的哈希值

    def __eq__(self, other):
        return self.value == other.value  # 比较值是否相等

# 创建一个自定义键对象
key1 = MyKey(10)
key2 = MyKey(10)

# 检查键对象的哈希值
print(hash(key1))  # 输出: 哈希值,例如 -2234472024582173133
print(hash(key2))  # 输出: 哈希值,应该与 key1 的哈希值相同,因为它们代表相同的值

# 使用自定义键创建字典
my_dict = {key1: "Value for key1"}
print(my_dict[key2])  # 输出: Value for key1,因为 key1 和 key2 被认为是相等的

使用场景二:集合元素的唯一性验证

在集合中,元素必须是唯一的。使用 hash(object) 函数可以帮助验证对象是否可以作为集合的元素。

# 创建一个自定义类,用于集合元素
class MyElement:
    def __init__(self, value):
        self.value = value

    def __hash__(self):
        return hash(self.value)  # 返回值的哈希值

    def __eq__(self, other):
        return self.value == other.value  # 比较值是否相等

# 创建两个元素
element1 = MyElement(20)
element2 = MyElement(20)

# 检查元素的哈希值
print(hash(element1))  # 输出: 哈希值,例如 -2234472024582173133
print(hash(element2))  # 输出: 哈希值,应该与 element1 的哈希值相同

# 创建一个集合
my_set = {element1}
print(element2 in my_set)  # 输出: True,因为 element1 和 element2 被认为是相等的

使用场景三:密码学和数据完整性验证

在密码学和数据完整性验证中,经常需要计算数据的哈希值以确保数据未被篡改。

import hashlib

# 创建一个简单的字符串
data = "This is a secret message"

# 使用 hashlib 计算字符串的哈希值
hash_object = hashlib.sha256(data.encode())
hash_hex = hash_object.hexdigest()

# 使用 hash() 函数计算字符串的哈希值(虽然不是最佳实践,但可以用于简单比较)
hash_value = hash(data)

print("SHA-256 Hash:", hash_hex)  # 输出: SHA-256 哈希值
print("Built-in Hash:", hash_value)  # 输出: Python 内置哈希值

这些场景展示了 hash(object) 函数在不同情况下的应用,包括验证对象是否适合作为字典键、集合元素以及在密码学中的应用。通过这些示例,可以更好地理解哈希值在实际编程中的重要性和用途。


巧妙用法

hash() 函数在Python中通常用于为对象生成一个整数哈希值,这个哈希值在对象的生命周期内保持不变,除非对象的内容发生改变。这个特性使得 hash() 在某些特定场景下可以有非常巧妙的使用技巧,尤其是结合其他数据结构和算法。以下是一些可能不那么显而易见的使用技巧:

技巧一:使用 hash() 进行数据分片

在处理大型数据集时,可以使用 hash() 来决定数据应该存储在哪个分片中。这种方法可以用于分布式数据库或缓存系统中,以实现数据的均匀分布。

# 假设有一个大型数据集,需要将其均匀分布到多个分片中
data = ["apple", "banana", "cherry", "date", ...]
shards = 10  # 分片数量

# 使用 hash() 决定每个元素应该存储在哪个分片中
shard_map = {i: [] for i in range(shards)}
for item in data:
    # 计算哈希值,并使用模运算决定分片
    shard_index = hash(item) % shards
    shard_map[shard_index].append(item)

# 每个分片现在包含了一部分数据
for i, shard_data in shard_map.items():
    print(f"Shard {i}: {shard_data}")

技巧二:使用 hash() 进行数据加密

虽然 hash() 不是为加密设计的,但在某些情况下,它可以用于简单的数据混淆或加密。例如,可以使用 hash() 来生成一个简单的加密密钥,尽管这种方法的安全性非常有限。

# 使用 hash() 生成一个简单的加密密钥
def generate_key(data):
    return hash(data)

# 示例:使用生成的密钥进行简单的加密
data = "sensitive information"
key = generate_key(data)
encrypted_data = "".join(chr(ord(c) ^ key) for c in data)

# 解密
decrypted_data = "".join(chr(ord(c) ^ key) for c in encrypted_data)
print(decrypted_data)  # 输出: sensitive information

技巧三:使用 hash() 进行对象标识

在某些情况下,可以使用 hash() 来生成对象的唯一标识符,尤其是在对象没有内置的唯一标识符时。

# 假设有一个自定义类,没有内置的唯一标识符
class CustomObject:
    def __init__(self, value):
        self.value = value

# 使用 hash() 生成对象的唯一标识符
obj1 = CustomObject("example1")
obj2 = CustomObject("example2")

# 使用哈希值作为对象的唯一标识符
obj_id1 = hash(obj1)
obj_id2 = hash(obj2)

print(obj_id1, obj_id2)  # 输出两个不同的哈希值

这些技巧展示了 hash() 函数在不同场景下的巧妙应用,尤其是在处理数据分布、简单加密和对象标识时。然而,需要注意的是,hash() 函数的使用应谨慎,特别是在安全性要求高的场景中,因为它不是为加密或安全目的设计的。


综合技巧

hash() 函数在Python中通常用于为对象生成一个哈希值,这个哈希值可以用于多种巧妙的数据结构和算法中。以下是一些结合 hash() 和其他函数或方法的巧妙用法:

技巧一:使用 hash() 和 set() 进行高效的数据去重

在处理大型数据集时,可以使用 hash() 结合 set() 来快速去重。这种方法利用了哈希表的高效查找特性。

# 假设有一个大型数据集,需要快速去重
data = ["apple", "banana", "cherry", "date", "apple", "banana", ...]

# 使用 hash() 和 set() 去重
unique_data = set()
for item in data:
    # 使用哈希值作为集合的键
    unique_data.add(hash(item))

# unique_data 现在是一个去重后的集合
print(unique_data)

技巧二:使用 hash() 和 dict() 进行快速查找和数据分组

在需要根据某些属性快速查找或分组数据时,可以使用 hash() 结合字典来实现。

# 假设有一个数据集,需要根据某个属性快速查找或分组
data = [("apple", "fruit"), ("banana", "fruit"), ("cherry", "fruit"), ("date", "fruit"), ...]

# 使用 hash() 和 dict() 进行数据分组
grouped_data = {}
for item, category in data:
    # 使用哈希值作为字典的键
    category_hash = hash(category)
    if category_hash not in grouped_data:
        grouped_data[category_hash] = []
    grouped_data[category_hash].append(item)

# grouped_data 现在是一个根据类别分组的字典
for category_hash, items in grouped_data.items():
    print(f"Category {category_hash}: {items}")

技巧三:使用 hash() 和 functools.lru_cache() 进行函数结果缓存

在编写计算密集型或I/O密集型函数时,可以使用 hash() 结合 functools.lru_cache() 装饰器来缓存函数结果,以减少重复计算。

import functools

# 假设有一个计算密集型函数
def expensive_function(arg):
    # 模拟耗时操作
    import time
    time.sleep(2)  # 假设这是一个耗时的计算
    return hash(arg)

# 使用 functools.lru_cache() 和 hash() 进行结果缓存
@functools.lru_cache()
def cached_expensive_function(arg):
    return expensive_function(arg)

# 现在调用 cached_expensive_function 将利用缓存,避免重复计算
print(cached_expensive_function("example"))

这些技巧展示了如何将 hash() 函数与其他Python内置函数和库结合使用,以实现高效的数据处理和算法优化。这些方法通常利用了哈希值的唯一性和哈希表的高效查找特性,从而在处理大型数据集时提供显著的性能提升。


感谢阅读。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/638997.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【数学建模】储药柜的设计

2014高教社杯全国大学生数学建模竞赛D题目 题目描述 储药柜的结构类似于书橱,通常由若干个横向隔板和竖向隔板将储药柜分割成若干个储药槽(如图1所示)。为保证药品分拣的准确率,防止发药错误,一个储药槽内只能摆放同一种药品。药品在储药槽…

SpringBoot实现增量部署

目录: 1、使用背景2、实现流程3、部署增量包到项目中并启动4、说明 1、使用背景 最近发现公司发布版本时候,很齐全,接口文档,部署方式等都很好,其中有个增量部署包,有点兴趣,不清楚怎么生成增量…

vue3+ts+vant4 实现购物车 前端代码

一、功能效果 二、前端代码 购物车的vue代码 <template><van-nav-bar left-text"返回" title"购物车" click-left"onClickLeft"><template #right><van-popover v-model:show"showPopover" placement"bot…

SQLite数据库免改造透明加密解决方案:给数据加把锁

在数字化时代&#xff0c;信息安全和隐私保护显得尤为重要。TDE透明加密技术&#xff0c;是一种在用户无感知的情况下对数据进行加密和解密的技术。它能够在数据生成、存储、传输和使用过程中自动进行加密处理&#xff0c;无需用户手动操作。透明加密技术的核心在于其透明性&am…

登录接口测试

登录接口测试 数据驱动

java spring cloud 企业工程管理系统源码+二次开发+定制化服务 em

在建筑行业中&#xff0c;工程项目管理软件&#xff08;工程项目管理系统&#xff09;扮演着至关重要的角色&#xff0c;它为建设工程项目管理提供了全方位、全过程的综合管理支持。从项目组织建设、策划决策、规划设计&#xff0c;到施工建设、竣工交付、总结评估&#xff0c;…

丰田精益生产的模板

丰田精益生产&#xff0c;也被称为丰田生产方式&#xff08;Toyota Production System, TPS&#xff09;&#xff0c;是一套完整的生产和管理系统&#xff0c;其核心目标是最大化效率、消除浪费&#xff0c;并通过持续改进来提升产品质量。 学习优秀企业 学习福特 丰田精益生产…

Java对象大小计算与MAT内存泄露分析

文章目录 JVM内存布局对象头实例数据对齐填充 计算实例数组占用内存大小String占用内存大小对象占用内存计算 使用jmap的方式查看Instrumentation计算对象内存方式MAT内存分析示例 JVM内存布局 一个对象主要包含下面3个部分&#xff1a; 对象头(Header)实例数据(Instance Dat…

WAF绕过(下)

过流量检测 这里的流量检测就是在网络层的waf拦截到我们向webshell传输的数据包&#xff0c;以及webshell返回的数据 包&#xff0c;检测其中是否包含敏感信息的一种检测方式。如果是大马的情况下&#xff0c;可以在大马中添加多处判断代码&#xff0c;因此在执行大马提供的功…

最新FinalShell专业版激活

支持的版本 可以激活任意版本的FinalShell为专业版&#xff0c;包括最新版4.3.10 激活方式 打开FinalShell&#xff0c;点击左下角 激活/升级。 账号密码任意输入几个字符&#xff0c;点离线激活。 复制机器码&#xff0c;将机器码发送给微信公众号【小白学算法】见文章末…

如何解决Nginx反向代理不生效?

目录 背景 过程 日志 检查配置文件 重启服务 检查容器内的配置文件 容器和宿主机 其他 背景 用了两年的nginx新加的反向代理不生效 Docker挂载的配置文件启动的Nginx&#xff0c;配置一切正常&#xff0c;但是反向代理不生效&#xff0c;???先自查一波 过程 日志 …

Function Calling 介绍与实战

functions 是 Chat Completion API 中的可选参数&#xff0c;用于提供函数定义。其目的是使 GPT 模型能够生成符合所提供定义的函数参数。请注意&#xff0c;API不会实际执行任何函数调用。开发人员需要使用GPT 模型输出来执行函数调用。 如果提供了functions参数&#xff0c;…

创新指南|利用电商产品视频进行渠道营销的最佳策略,不断提升销售额

无论企业的利基市场如何&#xff0c;电商产品视频都已被证明是非常可靠的资产&#xff0c;可以让目标受众了解您所提供的产品——关键功能、展示重要的差异化优势甚至改变大多数营销活动的游戏规则。阅读本文&#xff0c;全面了解电商产品视频如何融入营销推广&#xff0c;以最…

【保姆级教程】基于OpenCV+Python的人脸识别上课签到系统

【保姆级教程】基于OpenCVPython的人脸识别上课签到系统 一、软件安装及环境配置1. 安装IDE&#xff1a;PyCharm2. 搭建Python的环境3. 新建项目、安装插件、库 二、源文件编写1. 采集人脸.py2. 训练模型.py3. 生成表格.py4. 识别签到.py5. 创建图形界面.py 三、相关函数分析1.…

浅谈分布式系统

目录 一、单机架构二、分布式架构1、应用服务与数据库分离2、负载均衡3、数据库读写分离4、引入缓存5、数据库分库分表6、引入微服务 一、单机架构 单机架构&#xff0c;只有一台服务器&#xff0c;这个服务器负责所有工作。 绝大多数公司的产品&#xff0c;都是这种单机架构。…

思科模拟器--06.单臂路由升级版--多端路由互连实验--24.5.20

实验图纸如下: 第0步: 先放置六台个人电脑,一台交换机和一台2911路由器(千兆路由器(G0开头的)) 接着,用直通线将 PC0的F0,PC1的F0分别和交换机的F0/0, F0/1连接 交换机的F0/3和路由器的G0/0连接 PC2的F0,PC3的F0分别和交换机的F0/4, F0/5连接 交换机的F0/6和路由器的G0/1…

【施磊】C++语言基础提高:深入学习C++语言先要练好的内功

课程总目录 文章目录 一、进程的虚拟地址空间内存划分和布局二、函数的调用堆栈详细过程三、程序编译链接原理1. 编译过程2. 链接过程 一、进程的虚拟地址空间内存划分和布局 任何的编程语言 → \to → 产生两种东西&#xff1a;指令和数据 编译链接完成之后会产生一个可执行…

【传知代码】Modnet 人像抠图-论文复现

文章目录 概述原理介绍核心逻辑ModNet 的结构 环境配置WebUI 小结 论文地址 论文GitHub 本文涉及的源码可从Modnet 人像抠图该文章下方附件获取 概述 人像抠图技术在多个领域有着广泛的应用场景&#xff0c;包括但不限于&#xff1a; 展馆互动拍照&#xff1a;展馆中使用的抠…

K8S认证|CKA题库+答案| 11. 创建PVC

11、创建PVC 您必须在以下Cluster/Node上完成此考题&#xff1a; Cluster Master node Worker node ok8s master …

玩转OpenHarmony智能家居:如何实现开发版“碰一碰”设备控制

一、简介 “碰一碰”设备控制&#xff0c;依托NFC短距通信协议&#xff0c;通过碰一碰的交互方式&#xff0c;将OpenAtom OpenHarmony&#xff08;简称“OpenHarmony”&#xff09;标准系统设备和全场景设备连接起来&#xff0c;解决了应用与设备之间接续慢、传输难的问题&…