python zip()函数(将多个可迭代对象的元素配对,创建一个元组的迭代器)zip_longest()

文章目录

  • Python `zip()` 函数深入解析
    • 基本用法
      • 函数原型
      • 基础示例
    • 处理不同长度的迭代器
    • 高级用法
      • 多个迭代器
      • 使用 `zip()` 与 `dict()`
      • 解压序列
    • 注意事项
      • 内存效率:`zip()` 返回的是一个迭代器,这意味着直到迭代发生前,元素不会被消耗。这使得 `zip()` 特别内存效率。
        • 迭代器和内存效率
        • `zip()` 函数的工作原理
          • 延迟计算:`zip()` 并不会预先计算出所有的元组。它仅在迭代到某个位置时,才会生成那个位置的元组。这就是所谓的“惰性计算”(lazy evaluation)。
          • 内存使用:因为数据是按需生成的,`zip()` 在任何给定时间点不需要将所有组合的元组存储在内存中。这样可以避免在处理大量数据时占用大量内存。
        • 实际例子
      • 一次性使用:由于 `zip()` 返回的是一个迭代器,所以迭代过后,它将无法再次使用。
    • 使用技巧
      • 与 `enumerate` 结合使用
      • 处理不等长序列的替代方法(需要处理不等长的序列而又不想在最短序列结束时停止,可以使用 `itertools.zip_longest` 方法)
      • 与列表推导式结合
    • 应用场景
      • 数据科学中的应用
      • 多语言数据处理
    • 结论

Python zip() 函数深入解析

Python 的 zip() 函数是一个内置函数,用于将多个可迭代对象的元素配对,创建一个元组的迭代器。这个功能在处理并行数据时非常有用。本文将深入探讨 zip() 函数的使用方法、高级应用场景以及一些注意事项。

基本用法

函数原型

zip() 函数的基本语法如下:

zip(*iterables)
  • *iterables:一个或多个可迭代对象,如列表、元组或字典。

基础示例

开始之前,先看一个简单的例子,演示如何使用 zip() 将两个列表中的相对应元素组合在一起:

list1 = [1, 2, 3]
list2 = ['a', 'b', 'c']
zipped = zip(list1, list2)
print(list(zipped))

输出:

[(1, 'a'), (2, 'b'), (3, 'c')]

在这里插入图片描述

这里,zip() 函数接受两个列表作为输入,并返回一个迭代器。迭代器中的每个元素都是一个元组,包含来自所有输入可迭代对象的对应元素。

处理不同长度的迭代器

当输入的可迭代对象长度不一致时,zip() 会根据最短的对象结束。看下面的例子:

numbers = [1, 2, 3, 4]
letters = ['a', 'b', 'c']
zipped = zip(numbers, letters)
print(list(zipped))

输出:

[(1, 'a'), (2, 'b'), (3, 'c')]

在这里插入图片描述

可以看到,虽然 numbers 列表有四个元素,但输出只包含三个元组,因为 letters 只有三个元素。

高级用法

多个迭代器

zip() 可以同时处理多于两个的迭代器。例如,将三个列表组合在一起:

list1 = [1, 2, 3]
list2 = ['a', 'b', 'c']
list3 = [0.1, 0.2, 0.3]
zipped = zip(list1, list2, list3)
print(list(zipped))

输出:

[(1, 'a', 0.1), (2, 'b', 0.2), (3, 'c', 0.3)]

在这里插入图片描述

使用 zip()dict()

zip()dict()结合使用,常用于将两个列表转换成字典,其中一个列表包含键,另一个列表包含值:

keys = ['name', 'age', 'gender']
values = ['Alice', 25, 'Female']
dictionary = dict(zip(keys, values))
print(dictionary)

输出:

{'name': 'Alice', 'age': 25, 'gender': 'Female'}

在这里插入图片描述

解压序列

使用 zip(*iterable) 可以实现解压,即反向操作,将配对的数据序列解开成多个独立的序列:

pairs = [(1, 'a'), (2, 'b'), (3, 'c')]
numbers, letters = zip(*pairs)
print(list(numbers))
print(list(letters))

输出:

[1, 2, 3]
['a', 'b', 'c']

在这里插入图片描述

这里,*pairs 将列表中的每个元组解包,然后 zip() 将所有第一项组合成一个元组,所有第二项组合成另一个元组。

注意事项

内存效率:zip() 返回的是一个迭代器,这意味着直到迭代发生前,元素不会被消耗。这使得 zip() 特别内存效率。

当谈到 zip() 函数的内存效率时,关键在于它返回的是一个迭代器(iterator),而不是直接返回整个数据集合。这一点非常重要,因为它涉及到如何在内存中处理和存储数据。

迭代器和内存效率

迭代器是一种访问集合元素的方式,但它不会在内存中同时存储所有元素。相反,迭代器会一个接一个地生成元素,仅在迭代过程中才处理每个元素。这意味着,与直接生成并存储整个数据列表相比,使用迭代器可以显著减少内存的使用。

zip() 函数的工作原理

当使用 zip() 函数时,如果传入多个可迭代对象,zip() 会创建一个迭代器,这个迭代器会组合这些对象中相对应的元素形成一个个元组。关键点在于:

延迟计算:zip() 并不会预先计算出所有的元组。它仅在迭代到某个位置时,才会生成那个位置的元组。这就是所谓的“惰性计算”(lazy evaluation)。
内存使用:因为数据是按需生成的,zip() 在任何给定时间点不需要将所有组合的元组存储在内存中。这样可以避免在处理大量数据时占用大量内存。
实际例子

假设有两个非常大的列表,如果使用传统的方法(如列表推导或循环)来组合这些列表,将会创建一个包含所有组合的新列表,这需要足够的内存来一次性存储所有的元组。

list1 = range(1000000)  # 大列表1
list2 = range(1000000, 2000000)  # 大列表2

# 传统方法,占用大量内存
combined_list = [(x, y) for x, y in zip(list1, list2)]

相比之下,使用 zip()

# 使用 zip() 创建迭代器
zipped = zip(list1, list2)

# 可以逐个处理元组,不必存储整个组合列表
for item in zipped:
    process(item)  # 处理每个元组

在第二种方法中,zipped 迭代器会一个接一个地生成每个元组,只有当前的元组会占用内存。这对于内存管理来说是非常有效的,特别是在处理大数据集时。

总之,zip() 通过生成迭代器来实现内存效率,使得即使是处理大规模数据集,也不会导致大量的内存消耗,这对于资源有限的环境非常关键。这种按需访问数据的方式也帮助程序员写出更加高效和可扩展的程序。

一次性使用:由于 zip() 返回的是一个迭代器,所以迭代过后,它将无法再次使用。

使用技巧

enumerate 结合使用

在处理数据时,往往不仅需要元素值,还需要元素的索引。结合使用 enumeratezip 可以同时获得索引和来自多个序列的元素。下面是一个示例,展示如何在循环中同时获取索引和来自两个列表的元素:

names = ['Alice', 'Bob', 'Charlie']
ages = [25, 30, 35]
for index, (name, age) in enumerate(zip(names, ages)):
    print(f"Index {index}: {name} is {age} years old.")

输出:

Index 0: Alice is 25 years old.
Index 1: Bob is 30 years old.
Index 2: Charlie is 35 years old.

在这里插入图片描述

处理不等长序列的替代方法(需要处理不等长的序列而又不想在最短序列结束时停止,可以使用 itertools.zip_longest 方法)

如果需要处理不等长的序列而又不想在最短序列结束时停止,可以使用 itertools.zip_longest 方法。这个方法在 itertools 模块中,它允许用一个填充值填充短序列的缺失部分。例如:

from itertools import zip_longest

numbers = [1, 2, 3, 4, 5]
letters = ['a', 'b', 'c']
zipped_longest = zip_longest(numbers, letters, fillvalue='?')
print(list(zipped_longest))

输出:

[(1, 'a'), (2, 'b'), (3, 'c'), (4, '?'), (5, '?')]

在这里插入图片描述

与列表推导式结合

zip() 函数与列表推导式结合使用可以更加便捷地创建列表。这在数据处理和数据转换中尤为有用。例如,可以快速创建一个元组列表,每个元组包含不同列表中相应位置的元素:

numbers = [1, 2, 3, 4]
squares = [x**2 for x in numbers]
cubes = [x**3 for x in numbers]
combined = [(n, s, c) for n, s, c in zip(numbers, squares, cubes)]
print(combined)

输出:

[(1, 1, 1), (2, 4, 8), (3, 9, 27), (4, 16, 64)]

在这里插入图片描述

应用场景

数据科学中的应用

在数据科学和机器学习中,经常需要将多个数据集(通常是特征列表)组合起来进行进一步处理。zip() 函数在这种情况下非常有用,因为它可以轻松地将多个数据列表合并为一个列表,每个列表元素都是一个包含所有对应特征的元组。

多语言数据处理

在处理多语言文本数据时,zip() 同样非常有用。比如在翻译系统中,原始文本和翻译文本可能存储在两个列表中,使用 zip() 可以方便地将它们对齐,进而处理对应的文本对。

结论

zip() 是 Python 中一个强大而灵活的内置函数,适用于多种数据处理场景。它不仅能够简化代码,还能提高代码效率。在日常编程或数据处理工作中合理利用 zip() 可以大大提高开发效率和数据处理能力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/668777.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

浅谈SpringBoot配置文件

文章目录 一、配置文件作用二、配置文件分类三、SpringBoot内置的配置文件格式3.1、.properties3.1.1、.properties配置语法3.1.2、.properties读取方式 3.2、.yml/.yaml3.2.1、.yml配置语法3.2.2、.yml读取形式 四、两种配置文件优缺点4.1、.properties4.2、.yml4.2.1、.yml支…

多门店小程序如何给各个门店进行结算

​有些商家业务扩张,会开设多个门店。其中有些门店是直营,有些门店是加盟。如果用一个小程序来涵盖所有门店的业务,那将有助于商家进行统一管理和建立品牌效应。但如何给各个门店进行资金结算,是一个重要的问题,本文将…

探索JavaScript函数---基础篇

目录 函数 声明和调用 声明(定义) 调用 参数 形参和实参 形参(Formal Arguments) 实参(Actual Arguments) 形参与实参的关系 返回值 作用域 全局作用域 局部作用域 匿名函数 函数表达式 立…

无限可能LangChain——开启大模型世界

什么是大语言模型? 大语言模型是一种人工智能模型,通常使用深度学习技术(如神经网络)来理解和生成人类语言。这些模型拥有非常多的参数,可以达到数十亿甚至更多,使得它们能够处理高度复杂的语言模式。 我…

【网络安全】Web安全基础 - 第二节:前置基础知识- HTTP协议,握手协议,Cookie及Session

本章节主要介绍一些基础知识 d(^_^o) HTTP协议 什么是HTTP 超文本传输协议(HyperText Transfer Protocol)是一种用于分布式、协作式和超媒体信息系统的应用层协议。 HTTP是一个基于请求与响应,无状态的,应用层协议,…

30 分钟内掌握 Mainnet、Testnet 和 Devnet。Devnet是什么??

在区块链技术领域,Mainnet、Testnet 和 Devnet 等术语经常被使用,但也经常被误解。 这三种环境在区块链应用的开发和部署中起着至关重要的作用,但它们的区别和目的却常常被混淆。 让我们踏上探索之旅,揭开 Mainnet、Testnet 和 De…

HTML5+CSS3回顾总结

一、HTML5新特性 1.语义化标签 <header> 头部标签<nav> 导航标签<article> 内容标签<section> 定义文档某个区域<aside> 侧边栏标签<footer> 尾部标签 2.多媒体标签 2.1视频标签vedio 》常规写法&#xff08;尽量都使用mp4&#xff0…

google的chromedriver最新版下载地址

Chrome for Testing availability (googlechromelabs.github.io) 复制对应的地址跳转进去即可下载&#xff0c;下载前先看下自己google浏览器版本&#xff0c;找到对应的版本号去下载&#xff0c;把解压缩的exe放到google浏览器目录下。

3D软件开发的相关技术

3D开发涉及到广泛的技术和工具&#xff0c;涵盖了多个领域&#xff0c;包括计算机图形学、编程、设计、物理模拟等。以下是3D开发中常用的技术和工具&#xff0c;掌握这些技术需要广泛的知识和实践&#xff0c;项目的成功依赖于对这些技术的有效整合和应用。北京木奇移动技术有…

写大型C工程makefile构建~

正文 最开始学习linux应用开发编写的时候&#xff0c;估计大部分伙伴们都是在一个目录里面编译整个工程&#xff0c;主要是linux通常没有非常合适的集成开发环境。 以前单目录的方式实在太过捡漏&#xff0c;在linux环境中进行C代码工程开发很多时候需要编写一个相对比较通用的…

海康 面阵相机命名规则

海康 面阵相机命名规则 https://www.v-club.com/vCollage/vCollageDetail/516?subjectIdRMse6nPiyo

Nginx(openresty) 开启gzip压缩功能 提高web网站传输速度

1 开启nginx gzip压缩后&#xff0c;网页的图片&#xff0c;css、js等静态资源的大小会减少&#xff0c;节约带宽&#xff0c;提高传输效率&#xff0c;给用户快的体验,给用户更好的体验. 2 安装 #centos 8.5 yum install gzip 3 配置 #建议统一配置在http段 vim /usr/loca…

汇舟问卷:兼职做国外问卷三小时挣200

在繁忙的都市生活中&#xff0c;许多人为了生计而日夜奔波。对于大多数人来说&#xff0c;白天的工作已经足够充实&#xff0c;但依然有很多人选择在下班时间&#xff0c;多做些什么&#xff0c;为自己带来一份额外​的收入。 目前下班做的兼职工作不是跑滴滴&#xff0c;就是…

发表《Science Advances》!量子近似优化算法实现再突破

内容来源&#xff1a;量子前哨&#xff08;ID&#xff1a;Qforepost&#xff09; 文丨慕一/娴睿 排版丨沛贤 深度好文&#xff1a;1500字丨6分钟阅读 摘要&#xff1a;摩根大通、美国能源部&#xff08;DOE&#xff09;阿贡国家实验室和 Quantinuum 的研究人员证明了量子近似…

NetApp财季报告亮点:全闪存阵列需求强劲,云计算收入增长放缓但AI领域前景乐观

在最新的财季报告中&#xff0c;NetApp的收入因全闪存阵列的强劲需求而显著增长。截至2024年4月26日的2024财年第四季度&#xff0c;NetApp的收入连续第三个季度上升&#xff0c;达到了16.7亿美元&#xff0c;较前一年同期增长6%&#xff0c;超出公司指导中值。净利润为2.91亿美…

MySQL-事务日志

事务的隔离性由 锁机制 实现 事务的原子性、一致性、隔离性 由事务的 redo日志 和 undo 日志来保证 redo log 称为 重做日志&#xff0c;提供再写入操作&#xff0c;恢复提交事务修改的页操作&#xff0c;用来保证事务的持久性。undo log 称为 回滚日志&#xff0c;回滚行记录…

揭秘c语言作用域

前言 欢迎来到我的博客 个人主页:北岭敲键盘的荒漠猫-CSDN博客 本文主要整理c语言中 与作用域相关的知识点 本文适合对象:无编程基础&#xff0c;因为解释的比较多&#xff0c;所以不适合有基础的人快速掌握了 作用域描述 其实就是起作用的区域。比如个变量&#xff0c;函数…

System-Verilog 实现DE2-115倒车雷达模拟

System-Verilog 实现DE2-115倒车雷达模拟 引言&#xff1a; 随着科技的不断进步&#xff0c;汽车安全技术也日益成为人们关注的焦点。在众多汽车安全辅助系统中&#xff0c;倒车雷达以其实用性和高效性脱颖而出&#xff0c;成为现代汽车不可或缺的一部分。倒车雷达系统利用超声…

轻松拿捏C语言——【内存函数】

&#x1f970;欢迎关注 轻松拿捏C语言系列&#xff0c;来和 小哇 一起进步&#xff01;✊ &#x1f389;创作不易&#xff0c;请多多支持&#x1f389; &#x1f308;感谢大家的阅读、点赞、收藏和关注&#x1f495; &#x1f339;如有问题&#xff0c;欢迎指正~~ 目录&#x1…

简单说说我对集成学习算法的一点理解

概要 集成学习&#xff08;Ensemble Learning&#xff09;是一种机器学习技术框架&#xff0c;它通过构建并结合多个学习器&#xff08;也称为个体学习器或基学习器&#xff09;来完成学习任务。 集成学习旨在通过组合多个基学习器的预测结果来提高整体模型的性能。每个基学习…