Python集合的基本概念和使用方法

目录

集合(Set)

基本概念

基本特性

基本操作

集合运算

成员测试

高级操作

集合推导式

总结


集合(Set)

Python集合(Set)是Python语言中一个非常实用且强大的数据结构,它用于存储多个不重复的元素。集合中的元素可以是任何不可变类型的数据,如整数、浮点数、字符串等,但不能是可变数据类型,如列表或字典。集合提供了一种高效执行集合操作(如并集、交集、差集)的方式,这对于数据处理和分析任务尤为有用。

基本概念

在Python中,集合用set关键字来创建,可以通过花括号{}直接定义,或者使用内置函数set()将其他可迭代对象转换为集合。集合中的元素自动去重,这意味着每个元素在集合中只会出现一次。

# 直接定义集合
>>> my_set = {1, 2, 3, 4}
>>> print(my_set)
{1, 2, 3, 4}

# 使用set()函数转换列表为集合
>>> my_list = [1, 2, 2, 3, 4]
>>> my_set_from_list = set(my_list)
>>> print(my_set_from_list)
{1, 2, 3, 4}

注意:空集合只能用set()创建,因为{}代表的是空字典。

>>> type({})
<class 'dict'>
>>> type(set())
<class 'set'>

基本特性

在数学中,集合是由不同元素组成的一个整体,这些元素是无序的,且不重复。Python 的集合类型(set)正是基于这一概念实现的。与列表(list)、元组(tuple)等其他数据结构相比,集合有以下几个显著特性:

  1. 无序性:集合中的元素没有固定的顺序。
  2. 元素唯一性:集合中的所有元素都是唯一的,不会有重复的元素。
  3. 可变:集合是可变的,可以添加或删除元素。
  4. 动态性:集合的大小可以根据需要动态变化。

基本操作

  1. add(element):向集合中添加一个元素。
  2. remove(element):从集合中移除指定元素,如果元素不存在则抛出KeyError异常。
  3. discard(element):与remove相似,但当元素不存在时不会抛出错误。
  4. pop():随机移除并返回集合中的一个元素,集合为空时会抛出KeyError。
  5. clear():移除集合中所有元素,使其成为空集。
  6. copy():集合的复制拷贝。
>>> a = {1,2,3}
>>> a.add(4)
>>> a
{1, 2, 3, 4}
>>> a.remove(4)
>>> a
{1, 2, 3}
>>> a.remove(4)
Traceback (most recent call last):
  File "<pyshell#11>", line 1, in <module>
    a.remove(4)
KeyError: 4
>>> a.discard(4)
>>> a.discard(3)
>>> a
{1, 2}
>>> a.pop()
1
>>> a
{2}
>>> a.clear()
>>> a
set()
>>> t = {2,3,4}
>>> t
{2, 3, 4}
>>> s = t.copy()
>>> s
{2, 3, 4}

集合运算

  1. union(other_set) :返回两个集合的并集
  2. intersection(other_set) :返回两个集合的交集
  3. difference(other_set) :返回两个集合的差集
  4. symmetric_difference(other_set) :返回两个集合中不重复的元素集合,也称对称差集

集合运算也能使用运算符操作,以上四种运算分别对应重载运算符: | 、 &、 -、 ^

>>> s = {1,2,3}
>>> t = {2,3,4}
>>> s.union(t)
{1, 2, 3, 4}
>>> s | t
{1, 2, 3, 4}
>>> s.intersection(t)
{2, 3}
>>> s & t
{2, 3}
>>> s.difference(t)
{1}
>>> s - t
{1}
>>> s.symmetric_difference(t)
{1, 4}
>>> s ^ t
{1, 4}

另外对应四个update函数,功能对应相同,但改变当前集合。

  1. update(other_set) :返回两个集合的并集
  2. intersection_update(other_set) :返回两个集合的交集
  3. difference_update(other_set) :返回两个集合的差集
  4. symmetric_difference_update(other_set) :返回两个集合中不重复的元素集合,也称对称差集
>>> s = {1,2,3}
>>> t = {2,3,4}
>>> s.update(t)
>>> s
{1, 2, 3, 4}
>>> t
{2, 3, 4}
>>> s = {1,2,3}
>>> s.intersection_update(t)
>>> s
{2, 3}
>>> s = {1,2,3}
>>> s.difference_update(t)
>>> s
{1}
>>> s = {1,2,3}
>>> s.symmetric_difference_update(t)
>>> s
{1, 4}

注:改变的是原集合的值,四个函数的返回值都是None。

成员测试

  • in 和 not in:检查元素是否属于集合。
>>> s = {1,2,3}
>>> 1 in s
True
>>> 4 in s
False
>>> 1 not in s
False
>>> 4 not in s
True

高级操作

  1. 子集与超集:可以使用 issubset() 和 issuperset() 方法来判断一个集合是否是另一个集合的子集或超集(父集)。
  2. isdisjoint():判断当前集合与另一个集合,是否交集为空。
  3. 幂集:幂集是指一个集合所有可能子集的集合,可以通过递归或迭代的方式生成。
  4. 笛卡尔积:两个集合的笛卡尔积可以通过 itertools.product() 函数实现。

注:比较运算符==、  >、 >=、 < 、<= 也被重载用于父集、子集的比较。

注:笛卡尔积的概念

假设有两个集合 A = {a1, a2, ..., an} 和 B = {b1, b2, ..., bm},它们的笛卡尔积是所有可能的有序对 (ai, bj) 的集合,记作 A×B。

>>> import itertools
>>> s = {1,2,3}
>>> t = {2,3,4}
>>> list(itertools.product(s,t))
[(1, 2), (1, 3), (1, 4), (2, 2), (2, 3), (2, 4), (3, 2), (3, 3), (3, 4)]

集合推导式

类似于列表推导式,集合也可以通过集合推导式快速生成。集合推导式语法简洁,适用于根据已有集合或其他可迭代对象生成新集合。

>>> squares = {x**2 for x in range(10)}
>>> print(squares)
{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

总结

Python集合是一种无序、不重复元素的集合数据类型,它提供了丰富的操作方法,包括元素的添加、删除、集合运算等。集合在数据处理、算法设计等方面具有广泛的应用,特别是对于需要去重、集合运算的场景,集合的效率和简洁性使其成为首选工具。通过掌握集合的基本操作和高级特性,开发者可以更加灵活高效地处理数据,提升代码的性能和可读性。随着Python在数据分析、机器学习、Web开发等领域的广泛应用,深入理解并有效利用集合功能,已成为Python程序员的一项重要技能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/697584.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python实现删除Word文档中带有“指定内容”的段落文本(7)

前言 本文是该专栏的第7篇,后面会持续分享Python办公自动化干货知识,记得关注。 在处理word文档内容的时候,有时候我们需要一个干净整洁的文本内容。比如说,如下图所示的情况: 在处理上述word文档内容的时候,我们希望将文本底部的“下载链接”以及“附件信息”两个段落,…

力扣199. 二叉树的右视图

给定一个二叉树的 根节点 root&#xff0c;想象自己站在它的右侧&#xff0c;按照从顶部到底部的顺序&#xff0c;返回从右侧所能看到的节点值。 示例 1: 输入: [1,2,3,null,5,null,4] 输出: [1,3,4]示例 2: 输入: [1,null,3] 输出: [1,3]示例 3: 输入: [] 输出: [] /*** Def…

二叉树顺序结构——堆的结构与实现

二叉树顺序结构——堆的结构与实现 一、二叉树的顺序结构二、堆的概念及结构三、堆的实现堆向下调整算法堆的创建建堆时间复杂度堆的插入(堆向上调整算法)堆的删除堆的代码实现(使用VS2022的C语言)初始化、销毁构建、插入、删除返回堆顶元素、判空、返回有效元素个数 四、完整 …

【Python教程】4-字符串、列表、字典、元组与集合操作

在整理自己的笔记的时候发现了当年学习python时候整理的笔记&#xff0c;稍微整理一下&#xff0c;分享出来&#xff0c;方便记录和查看吧。个人觉得如果想简单了解一名语言或者技术&#xff0c;最简单的方式就是通过菜鸟教程去学习一下。今后会从python开始重新更新&#xff0…

7.高级纹理

前面的基础纹理包括法线纹理、渐变纹理和遮罩纹理等。这些纹理都属于低纬&#xff08;一维或二维&#xff09;纹理。 立方体纹理&#xff08;Cubemap&#xff09;实现环境映射 渲染纹理&#xff08;Render Texture&#xff09; 程序纹理&#xff08;Procedure Texture&#…

java线程生命周期介绍

Java线程的生命周期包含以下几个状态&#xff1a; 1.新建(New)&#xff1a;线程对象被创建&#xff0c;但是还没有调用start()方法。 1.运行(Runnable)&#xff1a;线程正在运行或者是就绪状态&#xff0c;等待CPU时间片。 1.阻塞(Blocked)&#xff1a;线程暂时停止执行&…

每日5题Day21 - LeetCode 101 - 105

每一步向前都是向自己的梦想更近一步&#xff0c;坚持不懈&#xff0c;勇往直前&#xff01; 第一题&#xff1a;101. 对称二叉树 - 力扣&#xff08;LeetCode&#xff09; class Solution {public boolean isSymmetric(TreeNode root) {if(root null){return true;}Stack<…

已解决Error || KeyError: ‘The truth value of a Series is ambiguous‘

已解决Error || KeyError: ‘The truth value of a Series is ambiguous’ &#x1f680; 原创作者&#xff1a; 猫头虎 作者微信号&#xff1a; Libin9iOak 作者公众号&#xff1a; 猫头虎技术团队 更新日期&#xff1a; 2024年6月6日 博主猫头虎的技术世界 &#x1f3…

第十篇——等价性:信息是如何压缩的?

目录 一、背景介绍二、思路&方案三、过程1.思维导图2.文章中经典的句子理解3.学习之后对于投资市场的理解4.通过这篇文章结合我知道的东西我能想到什么&#xff1f; 四、总结五、升华 一、背景介绍 基于信息是如何进行压缩的&#xff0c;引出来等价信息的概念&#xff1b;…

如何制定工程战略

本文介绍了领导者如何有效制定工程战略&#xff0c;包括理解战略核心、如何收集信息并制定可行的策略&#xff0c;以及如何利用行业最佳实践和技术债务管理来提升团队效能和产品质量。原文: How to Build Engineering Strategy 如果你了解过目标框架&#xff08;如 OKR&#xf…

某药监局后缀(第一部分)

声明 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01; 本文章未经许可禁止转载&#xff…

Unity编辑器扩展,快捷键的使用

代码部分 编辑器界面 使用方法&#xff1a; 使用方法和如图1一样&#xff0c;只需要在Menuitem的路径后面加上标识符号就行。 "#"对应的是shift "&"对应的是Alt "%"对应的是ctrl 比如我图中的是&#xff0c;%#s对应的是CtrlShifts&…

ReentrantLock底层原理

ReentrantLock public ReentrantLock() {sync new NonfairSync(); }public ReentrantLock(boolean fair) {sync fair ? new FairSync() : new NonfairSync(); }ReentrantLock 的默认实现是非公平锁&#xff0c;实际上 ReentrantLock 中的方法&#xff0c;几乎都让 sync 实现…

【C语言】11.字符函数和字符串函数

文章目录 1.字符分类函数2.字符转换函数3.strlen的使用和模拟实现4.strcpy的使用和模拟实现5.strcat的使用和模拟实现6.strcmp的使用和模拟实现7.strncpy函数的使用8.strncat函数的使用9.strncmp函数的使用10.strstr的使用和模拟实现11.strtok函数的使用12.strerror函数的使用 …

买CPU怕买到假货?这担忧属实有点……

这担忧属实有点多了 前段时间有朋友问小白&#xff1a;买CPU会买到假的吗&#xff1f; 啥&#xff1f;CPU还有假的&#xff1f; 这个问题让这几天闷闷不乐的小白笑得根本停不下来。 如果有哪个小伙伴能手搓个CPU出来&#xff0c;那这位小伙伴估计就不愁财富不到家了。 正文…

爬虫工具yt-dlp

yt-dlp是youtube-dlp的一个fork&#xff0c;youtube-dlp曾经也较为活跃&#xff0c;但后来被众多网站屏蔽&#xff0c;于是大家转而在其基础上开发yt-dlp。yt-dlp的github项目地址为&#xff1a;GitHub - yt-dlp/yt-dlp: A feature-rich command-line audio/video downloaderA …

入侵报警系统的智慧核心——ARMxy工控机深度应用

智能安防领域高清视频监控、人脸识别门禁系统以及入侵报警系统的智能化升级&#xff0c;正以前所未有的速度推动着行业的变革。在这场变革中&#xff0c;ARMxy工业计算机以其卓越的性能、高度的灵活性及强大的集成能力&#xff0c;成为了众多安防解决方案中的核心组件。 高清视…

IIR滤波器的结构比较(Direct I and Direct II Form)

在 IIR 滤波器的设计和实现中&#xff0c;直接 I 型和直接 II 型结构的主要区别在于计算顺序和存储延迟项的方式。 直接I型结构 特点&#xff1a; 级联形式&#xff1a;直接I型结构的传递函数可以表示为两个级联部分&#xff1a;一个由分子系数组成的部分和一个由分母系数组…

MySQL高性能(MySQL锁)

MySQL性能系列 MySQL锁 前言1. 死锁机制2. 思维导图与锁划分介绍3. 粒度划分锁3.1. 全局锁3.2. 页级锁&#xff08;Page-level locking&#xff09;3.3. 表级锁&#xff08;Tables-level lock&#xff09;○ 共享锁&#xff08;表级&#xff09;○ 排他锁&#xff08;表级&…

字节面试:CPU100% 如何处理?

尼恩说在前面 在40岁老架构师 尼恩的读者交流群(50)中&#xff0c;最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团的面试资格&#xff0c;遇到很多很重要的线上问题的场景题&#xff1a; 1.CPU100%&#xff0c;你是怎么处理的&…