【数据分析面试】44.分析零售客户群体(Python 集合Set的用法)

在这里插入图片描述

题目

假设你是一家在线零售商的数据库管理员,需要分析两类客户的数据。一个集合 purchased_customers 包含在最近一次促销活动中购买了商品的客户ID,另一个集合 newsletter_subscribers 包含订阅了新闻通讯的客户ID。编写一个函数 analyze_customers,返回一个包含以下内容的字典:

  • 既购买了商品又订阅了新闻通讯的客户ID集合
  • 只购买了商品但没有订阅新闻通讯的客户ID集合
  • 只订阅了新闻通讯但没有购买商品的客户ID集合
  • 购买商品和订阅新闻通讯的所有唯一客户ID集合

示例:

输入:

purchased_customers = {1001, 1002, 1003, 1004}
newsletter_subscribers = {1003, 1004, 1005, 1006}

输出:

def analyze_customers(purchased_customers, newsletter_subscribers) 
-> 
{
    'both': {1003, 1004},
    'only_purchased': {1001, 1002},
    'only_subscribed': {1005, 1006},
    'all_customers': {1001, 1002, 1003, 1004, 1005, 1006}
}

答案

解题思路

考虑使用python中关于集合的操作。注意题目要求生成一个字典,想想字典和集合有什么不同。

答案代码

def analyze_customers(purchased_customers, newsletter_subscribers):
    return {
        "both": purchased_customers & newsletter_subscribers,
        "only_purchased": purchased_customers - newsletter_subscribers,
        "only_subscribed": newsletter_subscribers - purchased_customers,
        "all_customers": purchased_customers | newsletter_subscribers
    }


purchased_customers = {1001, 1002, 1003, 1004}
newsletter_subscribers = {1003, 1004, 1005, 1006}
result = analyze_customers(purchased_customers, newsletter_subscribers)
print(result)

集合(Set)的用法

集合(Set)用于存储多个不重复的元素。集合是无序的,并且元素不能重复。集合支持各种数学集合操作,如并集、交集和差集。

  1. 创建集合:使用花括号 {}或者 set()函数 。注意,空集合只能使用 set() 创建,因为 {} 被用来创建空字典。
  2. 集合的操作
    • 添加元素 使用 add() 方法
    • 移除元素:使用 remove()discard() 方法移除元素。区别是 remove() 在元素不存在时会引发 KeyError,而 discard() 不会
fruits = {"apple", "banana"}

# 添加元素
fruits.add("cherry")
print(fruits)  # 输出: {'apple', 'banana', 'cherry'}

# 移除元素
fruits.remove("banana")
print(fruits)  # 输出: {'apple', 'cherry'}

fruits.discard("banana")  # 不引发错误
  1. 集合的运算
    • 并集:使用 union() 方法或 | 运算符
    • 交集:使用 intersection() 方法或 & 运算符
    • 差集:使用 difference() 方法或 - 运算符
    • 对称差集:使用 symmetric_difference() 方法或 ^ 运算符。(对称差集是所有属于一个集合但不属于另一个集合的元素。)
A = {1, 2, 3}
B = {3, 4, 5}

# 并集
print(A.union(B))  # 输出: {1, 2, 3, 4, 5}
print(A | B)       # 输出: {1, 2, 3, 4, 5}

# 交集
print(A.intersection(B))  # 输出: {3}
print(A & B)              # 输出: {3}

# 差集
print(A.difference(B))  # 输出: {1, 2}
print(A - B)            # 输出: {1, 2}

# 对称差集
print(A.symmetric_difference(B))  # 输出: {1, 2, 4, 5}
print(A ^ B)                      # 输出: {1, 2, 4, 5}

更多详细答案可关注公众号查阅。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/629189.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++类与对象基础探秘系列(三)

目录 再谈构造函数 构造函数体赋值 初始化列表 explicit关键字 static成员 概念 特性 友元 友元函数 友元类 内部类 概念 特性 匿名对象 再次理解类和对象 再谈构造函数 构造函数体赋值 在创建对象时,编译器会通过调用构造函数,给对象中的各个成员…

Echarts使用

介绍 ECharts 是一个强大的,基于 JavaScript 的开源数据可视化库,适用于创建多种类型的图表,满足广泛的业务需求。它由百度团队开发并维护,后来捐赠给了 Apache 软件基金会,并已在2021年从孵化项目毕业,成…

【刷题(2)】矩阵

一、矩阵问题基础 遍历: for i in range(len(matrix)): for j in range(len(matrix[0]): while 倒序遍历: for i in range(right,left,-1) 临时存储:temp w,h:len(matrix[0])-1 len(matrix)-1 left,right,top,bottom:0 len(matrix[0])-1 0 len(matrix)-1 索引: width = le…

2024最新互联网公司工作时长排行榜出炉!

“工作时长”,是选择公司的一个非常重要的参考指标。 我们在选择一个公司的时候,除了需要关注总收入package 以外,还需要考虑这家公司的加班时长是否人性化。 我们的工作时长是周工作小时数。法定工作时间是40小时(955)。大小周通常折算为周…

企业大模型如何成为自己数据的“百科全书”?

作者 | 郭炜 编辑 | Debra Chen 在当今的商业环境中,大数据的管理和应用已经成为企业决策和运营的核心组成部分。然而,随着数据量的爆炸性增长,如何有效利用这些数据成为了一个普遍的挑战。 本文将探讨大数据架构、大模型的集成&#xff0…

数据结构篇3—《龙门客“栈”》

文章目录 🚩前言1、栈的概念2、栈的实现框架3、栈的代码实现3.1、栈的初始化和销毁3.2、入栈\出栈\返回栈顶元素\元素个数\判空3.3、栈定义注意事项 4、栈的应用实例——《括号匹配问题》 🚩前言 前面记录了关于顺序表和链表的数据结构,这一篇…

容器安全在云原生的安全上有什么大作为

进入后云计算时代,云原生正在成为企业数字化转型的潮流和加速器。云原生安全相关的公司雨后春笋般建立起来,各个大云厂商也积极建立自己云原生的安全能力,保护云上客户的资产。 与之相对的,黑产组织为了牟利,也在不断…

低功耗设计

设计电路谁都会,但是设计低功耗电路,降低芯片功耗却是难题 - 哔哩哔哩 (bilibili.com) 一个产品的低功耗设计,并不仅仅只是采用一个低功耗的MCU就能解决的问题。产品的低功耗,不久取决于MCU的低功耗,也取决于低功耗的…

QT状态机4-使用并行状态来避免组合爆炸

#include "MainWindow.h" #include "ui_MainWindow.h"MainWindow::MainWindow(QWidget *parent):

别再找了!吐血整理ChatGPT 3.5/4.0新手使用手册

引领科技潮流的ChatGPT早已名声在外,如今获取ChatGPT已变得触手可及,但很多人还多次提问如何使用chatgpt,为了避免陷入误区,本文旨在为广大ChatGPT爱好者提供一份实用的指南。 因此,帮助大家更好地掌握其使用技巧&…

Leecode热题100---11:盛最多水的容器

题目: 给定一个长度为 n 的整数数组 height 。有 n 条垂线,第 i 条线的两个端点是 (i, 0) 和 (i, height[i]) 。 找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。 返回容器可以储存的最大水量。 说明:你不能倾…

linux使用教程(命令介绍、命令格式和命令的使用技巧)

一、命令的格式 1.1 打开终端的方式 ubuntu中的命令基本都是在终端执行的 打开终端的方式: 第一种方法:在ubuntu桌面中鼠标右键选择“打开终端” 第二种方法:使用快捷键ctrl alt t 1.2 终端提示符 stuqfedu:~$ 对于这个提示符 stu&…

PSAI超强插件来袭:一键提升设计效率!

无需魔法,直接在PS中完成图生图、局部重绘、线稿上色、无损放大、扩图等操作。无论你是Windows还是Mac用户,都能轻松驾驭这款强大的AI绘图工具,这款PSAI插件让你的设计工作直接起飞! 在之前的分享中,我为大家推荐过两…

大白话!大模型(LLMs)私有化的三种方式:Prompts、Embeddings、Fine-tuning

私有化大模型的三种方式 随着我们使用大模型的深入呢,我们会发现这样一个现象,我们正常情况下问大模型的问题,会得到一个非常普适的回答,就是大模型会根据自己的训练的这个过往的一些知识的积累,然后告诉我们他认为最…

webpack优化构建速度示例-externals:

externals 配置项主要用于防止将某些 import 的包(package)打包到 bundle 中,而是在运行时(runtime)再从外部获取这些扩展依赖(external dependencies)。这样做的主要目的是为了解决打包文件过大…

抖店商品退货率比较高,怎么解决?

我是王路飞。 抖店的退货率高,怎么解决呢? 当然是看情况,然后换产品、换厂家啊,不然换店铺吗? 要知道,做电商,产品可以死,店铺不能死,不然做起来太累了,也…

揭秘未来工厂核心:智慧大屏引领可视化管理新潮流

在数字化浪潮席卷全球的今天,智慧工厂已不再是科幻小说中的概念,而是成为了现代工业发展的新引擎。 智慧工厂可视化大屏,不仅仅是一块显示屏,更是工厂运行的“大脑”。通过这块屏幕,我们可以实时掌握工厂的每一个角落、…

(规格参考)ADP5360ACBZ-1-R7 电量计 电池管理IC,ADP5072ACBZ 双通道直流开关稳压器,ADL5903ACPZN 射频检测器

1、ADP5360ACBZ-1-R7:具有超低功耗电量计、电池保护功能的先进电池管理PMIC 功能:电池保护 电池化学成份:锂离子/聚合物 电池数:1 故障保护:超温,过压 接口:I2C 工作温度:-40C ~ 85…

Java 插入数据到Elasticsearch中进行各种类型文档的内容检索

源码下载&#xff1a;链接&#xff1a;https://pan.baidu.com/s/1D3yszkTzjwQz0vFRozQl2g?pwdz6kb 提取码&#xff1a;z6kb 实现思路 1.搭建一个新的springboot项目&#xff0c;不会的请看我这篇博客&#xff1a;springboot项目搭建 2.添加maven依赖 <dependency><…

【嵌入式大赛应用赛道】机械手臂

电机 进步电机&#xff1a;它的转动是以确定的步数进行的&#xff0c;只要计算好脉冲数量和频率&#xff0c;就可以准确预测和控制电机的转动角度、速度以及停止的位置 伺服电机&#xff1a;将输入的电信号&#xff08;如电压或电流指令&#xff09;转换成轴上的精确旋转运动…