Python复合型数据避坑指南

目录

前言

列表(Lists)

 1. 修改可变对象

 2. 浅拷贝和深拷贝

元组(Tuples)

集合(Sets)

字典(Dictionaries)

 1. 键值唯一性

 2. 键的类型

实际应用场景

 1. 数据分析与清洗

 2. 网络爬虫与数据提取

 3. 软件开发与数据结构设计

 4. 数据库操作与ORM框架

总结


前言

在Python中,复合型数据(例如列表、元组、集合和字典)是非常常用的数据类型,它们可以以结构化的方式组织和操作数据。然而,由于其灵活性和特性,使用复合型数据时常常容易出现一些陷阱和问题。本指南将深入探讨Python复合型数据的常见陷阱,并提供一些避免这些问题的实用建议和技巧,以帮助更好地利用Python的复合型数据。

列表(Lists)

 1. 修改可变对象

列表是可变的数据类型,因此在对列表中的可变对象(如列表、字典等)进行操作时要格外小心。在修改列表中的可变对象时,很容易影响到原始列表。

# 修改可变对象会影响原始列表
original_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
modified_list = original_list
modified_list[0][0] = 100
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]

 2. 浅拷贝和深拷贝

当需要复制列表时,应该了解浅拷贝和深拷贝的区别。浅拷贝只会复制列表的顶层元素,而深拷贝会递归复制所有嵌套的对象。

import copy

original_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

# 浅拷贝
shallow_copy = copy.copy(original_list)
shallow_copy[0][0] = 100
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]

# 深拷贝
deep_copy = copy.deepcopy(original_list)
deep_copy[0][0] = 1000
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]

元组(Tuples)

元组是不可变的数据类型,因此不能对其进行修改。但需要注意,如果元组中包含可变对象,则可变对象的内容是可以被修改的。

# 元组中包含可变对象
tuple_with_list = ([1, 2, 3], [4, 5, 6])
tuple_with_list[0][0] = 100
print(tuple_with_list)  # 输出: ([100, 2, 3], [4, 5, 6])

集合(Sets)

集合是一种无序且不重复的数据类型,常用于去重和集合运算。然而,由于其不可索引的特性,有时可能会导致意外的结果。

# 集合不支持索引
my_set = {1, 2, 3}
print(my_set[0])  # 报错: 'set' object is not subscriptable

字典(Dictionaries)

 1. 键值唯一性

字典的键必须是唯一的,如果尝试使用相同的键来添加新的键值对,则会覆盖原有的键值对。

my_dict = {'a': 1, 'b': 2}
my_dict['a'] = 100
print(my_dict)  # 输出: {'a': 100, 'b': 2}

 2. 键的类型

字典的键可以是不可变的数据类型,如字符串、整数、元组等,但不能是可变的数据类型,如列表、集合、字典等。

# 字典的键不能是列表
my_dict = {[1, 2]: 'value'}  # 报错: unhashable type: 'list'

实际应用场景

复合型数据在Python中有着广泛的应用,从数据分析到软件开发,都可以见到它们的身影。通过一些实际的应用场景来进一步了解如何在实践中避免坑并正确地使用复合型数据。

 1. 数据分析与清洗

在数据分析中,经常需要处理来自各种数据源的复合型数据,比如JSON格式的数据、嵌套的字典和列表等。

下面是一个简单的示例,演示了如何从JSON文件中读取数据,并进行清洗和处理。

import json

# 读取JSON文件
with open('data.json', 'r') as f:
    data = json.load(f)

# 提取数据并清洗
cleaned_data = []
for item in data:
    if 'name' in item and 'age' in item:
        cleaned_data.append({'name': item['name'], 'age': item['age']})

# 打印清洗后的数据
print(cleaned_data)

在这个示例中,首先读取了一个JSON文件,然后遍历数据并进行了清洗,只保留了包含'name'和'age'字段的数据。

 2. 网络爬虫与数据提取

在网络爬虫开发中,经常需要处理HTML页面中的复合型数据,比如提取表格数据、链接和文本内容等。

看一个示例,演示如何使用BeautifulSoup库从网页中提取表格数据。

from bs4 import BeautifulSoup
import requests

# 发送HTTP请求获取网页内容
url = 'https://example.com'
response = requests.get(url)
html_content = response.text

# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')

# 提取表格数据
table = soup.find('table')
if table:
    rows = table.find_all('tr')
    data = []
    for row in rows:
        cells = row.find_all('td')
        if cells:
            row_data = [cell.text.strip() for cell in cells]
            data.append(row_data)

# 打印提取的表格数据
print(data)

在这个示例中,使用了requests库发送HTTP请求获取网页内容,然后使用BeautifulSoup库解析HTML内容,并提取了表格数据。

 3. 软件开发与数据结构设计

在软件开发中,合理设计和使用复合型数据结构可以提高代码的可读性、可维护性和性能。

看一个示例,演示如何设计一个简单的数据结构来表示学生信息。

class Student:
    def __init__(self, name, age, courses):
        self.name = name
        self.age = age
        self.courses = courses

    def __repr__(self):
        return f"Student(name={self.name}, age={self.age}, courses={self.courses})"

# 创建学生对象
student1 = Student('Alice', 20, ['Math', 'Physics', 'Chemistry'])
student2 = Student('Bob', 22, ['History', 'Literature', 'Geography'])

# 打印学生信息
print(student1)
print(student2)

在这个示例中,定义了一个Student类来表示学生信息,包括姓名、年龄和所修课程。然后,创建了两个学生对象,并打印它们的信息。

 4. 数据库操作与ORM框架

在数据库操作和使用ORM(对象关系映射)框架时,也经常需要处理复合型数据,比如查询结果集、模型对象和关联数据等。

下面是一个简单的示例,演示了如何使用SQLAlchemy ORM框架来定义模型和查询数据。

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker

# 创建数据库引擎和会话
engine = create_engine('sqlite:///:memory:')
Base = declarative_base()
Session = sessionmaker(bind=engine)
session = Session()

# 定义模型类
class Product(Base):
    __tablename__ = 'products'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    price = Column(Integer)

# 创建数据表
Base.metadata.create_all(engine)

# 创建产品对象并插入数据
product1 = Product(name='Product 1', price=100)
product2 = Product(name='Product 2', price=200)
session.add(product1)
session.add(product2)
session.commit()

# 查询数据
products = session.query(Product).all()

# 打印查询结果
for product in products:
    print(product.name, product.price)

在这个示例中,使用了SQLAlchemy ORM框架来定义一个简单的产品模型,然后创建了两个产品对象并插入数据,最后查询了所有产品数据并打印出来。

总结

本文介绍了在使用Python复合型数据时常见的陷阱和问题,并提供了一些避免这些问题的实用建议和技巧。通过深入了解列表、元组、集合和字典的特性,以及如何正确地使用它们,可以更好地利用Python的复合型数据,编写出更加健壮和高效的代码。希望本文能够帮助大家避免在使用复合型数据时遇到的常见问题,并提高Python编程的水平和效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/419982.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SDR架构 (一)为什么基带有I和Q路?

我之前做过自己的RTL-SDR。一直有一个疑惑。为啥rtl2832u芯片有一对差分I路,还有一对差分Q路。差分很好理解是为了抗干扰,但为啥要I和Q呢?并且我也知道不少人在自己修改的时候,保留I路对接在r820t2(跟原版一样&#xf…

CentOS8 同步时间chrony ntpdate已无法使用

CentOS8系统中,原有的时间同步服务 ntp/ntpdate服务已经无法使用,使用yum安装,提示已不存在。 [rootlocalhost ~]# cat /etc/redhat-release CentOS Linux release 8.1.1911 (Core) [rootlocalhost ~]# yum install ntp 上次元数据过期检查…

深入理解Linux线程(LWP):概念、结构与实现机制(2)

🎬慕斯主页:修仙—别有洞天 ♈️今日夜电波:会いたい—Naomile 1:12━━━━━━️💟──────── 4:59 🔄 ◀️ ⏸ ▶️ ☰ &a…

2024年经典【自动化面试题】附答案

一、请描述一下自动化测试流程? 自动化测试流程一般可以分为以下七步: 编写自动化测试计划; 设计自动化测试用例; 编写自动化测试框架和脚本; 调试并维护脚本; 无人值守测试; 后期脚本维…

LeetCode 2581.统计可能的树根数目:换根DP(树形DP)

【LetMeFly】2581.统计可能的树根数目:换根DP(树形DP) 力扣题目链接:https://leetcode.cn/problems/count-number-of-possible-root-nodes/ Alice 有一棵 n 个节点的树,节点编号为 0 到 n - 1 。树用一个长度为 n - 1 的二维整数数组 edges…

基于springboot实现图书馆管理系统项目【项目源码+论文说明】

基于springboot实现图书馆管理系统演示 摘要 电脑的出现是一个时代的进步,不仅仅帮助人们解决了一些数学上的难题,如今电脑的出现,更加方便了人们在工作和生活中对于一些事物的处理。应用的越来越广泛,通过互联网我们可以更方便地…

C++用临时对象构造新对象

C用临时对象构造新对象 //用临时对象构造同类型的新对象&#xff0c;该临时对象不产生&#xff1b; // 直接用生成临时对象的方法构造新对象&#xff0c;这是编译器对代码的优化&#xff0c;效率更高 #include<iostream> using namespace std; class MyClass { public:…

2024最新性能测试面试题(带答案)

一、性能测试开展过程&#xff1a; 答&#xff1a;第一步&#xff1a;找产品沟通哪些接口需要压测&#xff0c;需要达到什么样的预期值(TPS和响应时间) 第二步&#xff1a;编写测试计划&#xff0c;人员、时间周期、工具 第三步&#xff1a;环境搭建 第四步&#xff1a;造数…

若依前后端分离版本-自动生成代码

听说若依挺好用的&#xff0c;所以来学习一下。 1.下载项目&#xff0c;配置redis,配置mysql,安装npm&#xff08;版本一定要低于16&#xff09; 2.执行sql脚本数据库相关信息 3.启动后端ruoyi-admin的ruoyiApplication 4启动前端 选择terminal 进入ruoyi-ui&#xff0c;执…

数据结构从入门到精通——算法的时间复杂度和空间复杂度

算法的时间复杂度和空间复杂度 前言一、算法效率1.1 如何衡量一个算法的好坏1.2 算法的复杂度 二、时间复杂度2.1 时间复杂度的概念2.2 大O的渐进表示法2.3常见时间复杂度计算举例2.4等差数列计算公式2.5等比数列计算方法 三、空间复杂度四、 常见复杂度对比五、 复杂度的oj练习…

今日arXiv最热大模型论文:点击即可播放!港中文发布大模型写歌神器!

一首歌&#xff0c;包含作词作曲两个部分。擅长作词or作曲就已经很牛了。比如方文山是周杰伦的御用作词人&#xff0c;而周杰伦写过很多耳熟能详的曲子。而兼具作词作曲才华的全能创作人却是难得一见。 最近港中文发布了一款歌曲创作大模型SongComposer&#xff0c;作词作曲都…

R语言安装和简单入门HelloWorld用法

R语言安装和简单入门HelloWorld用法 #R语言安装地址 https://www.r-project.org/ click->CRAN mirror->选择China下列表&#xff1a; https://mirrors.tuna.tsinghua.edu.cn/CRAN/ 选择Download R for Windows 选择base Download R-4.3.2 for Windows 下载文件R-4.3.2-…

SQL-Labs靶场“26-28”关通关教程

君衍. 一、二十六关 基于GET过滤空格以及注释报错注入1、源码分析2、绕过思路3、updatexml报错注入 二、二十六a关 基于GET过滤空格注释字符型注入1、源码分析2、绕过思路3、时间盲注 三、二十七关 基于union及select的过滤单引号注入1、源码分析2、绕过思路3、联合查询注入4、…

springcloud alibaba组件简介

一、Nacos 服务注册中心/统一配置中心 1、介绍 Nacos是一个配置中心&#xff0c;也是一个服务注册与发现中心。 1.1、配置中心的好处&#xff1a; &#xff08;1&#xff09;配置数据脱敏 &#xff08;2&#xff09;防止出错&#xff0c;方便管理 &#xff08;3&#xff…

精品ssm的社区团购系统购物商城小程序

《[含文档PPT源码等]精品基于ssm的社区团购系统[包运行成功]》该项目含有源码、文档、PPT、配套开发软件、软件安装教程、项目发布教程、包运行成功&#xff01; 软件开发环境及开发工具&#xff1a; Java——涉及技术&#xff1a; 前端使用技术&#xff1a;HTML5,CSS3、Jav…

从前端JS逆向到发现后端越权漏洞的渗透测试之旅

前言 本篇文章首发先知社区&#xff0c;作者为本公众号。 前端分析 首先搜索请求接口&#xff0c;未发现关键加密点 根据请求参数进行搜索 在js文件中找到aes加密key、iv eval(function(p, a, c, k, e, r) { e function(c) { return c.toString(36) } ; if…

什么是MTU(Maximum Transmission Unit)?

热门IT课程【视频教程】-华为/思科/红帽/oraclehttps://xmws-it.blog.csdn.net/article/details/117297837?spm1001.2014.3001.5502 最大传输单元MTU&#xff08;Maximum Transmission Unit&#xff0c;MTU&#xff09;&#xff0c;是指网络能够传输的最大数据包大小&#x…

禁止涉密电脑插U盘

某国家机关在日常工作中发现&#xff0c;一台涉密电脑受到了不明攻击&#xff0c;大量机密文件被非法访问和复制。 经过调查&#xff0c;原来是一名工作人员在不知情的情况下&#xff0c;将感染病毒的U盘插入涉密电脑&#xff0c;导致机密数据被窃取。 事件发生后&#xff0c…

【软考】UML中的图之通信图

目录 1. 说明2. 图示3. 特性4. 例题4.1 例题1 1. 说明 1.通信图强调收发消息的对象的结构组织2.早期版本叫做协作图3.通信图强调参加交互的对象和组织4.首先将参加交互的对象作为图的顶点&#xff0c;然后把连接这些对象的链表示为图的弧&#xff0c;最后用对象发送和接收的消…

【Mars3d】进行水平测量measure.area({的时候,会被模型遮挡的处理方法

问题&#xff1a; 1.thing/analysis/measure 水平面积 measure.area({ 在模型上测量的时候会被遮挡 2. 通过 addHeight:10000,增加高度也不可以实现这种被遮挡的效果&#xff0c;都增加到10000了&#xff0c;还是会被遮挡 export function measureArea() { measure.area({ s…