Python AI库 Pandas的常见操作的扩展知识

Python AI库 Pandas的常见操作的扩展知识

本文默认读者具备以下技能:

  • 熟悉python基础知识,vscode或其它编辑工具
  • 熟悉表格文件的基本操作
  • 具备自主扩展学习能力
    在这里插入图片描述

前文中对Pandas的数据结构以及基础操作做了介绍,本文中会在前文的基础上,对常见的操作进行拓展,并举例说明。

一、数据读取与查看

Pandas提供了多种方法读取不同格式的数据文件,例如CSV、Excel等。读取数据后,可以通过简单的函数查看数据的整体情况。

import pandas as pd

# 读取CSV文件
df = pd.read_csv('data.csv')

# 查看数据的前5行
print(df.head())

# 查看数据的基本信息,包括列名、数据类型、非空值数量等
print(df.info())

扩展信息read_csv函数支持多种参数,如header指定列名所在的行,delimiter指定分隔符等。head函数默认显示前5行,但可以通过传递参数来指定显示的行数。

二、数据筛选

Pandas提供了灵活的条件筛选功能,可以根据条件过滤出满足特定条件的数据行。

# 筛选年龄大于30的数据行
filtered_df = df[df['age'] > 30]

# 使用逻辑运算符进行复合条件筛选
filtered_df_complex = df[(df['age'] > 30) & (df['gender'] == 'male')]

print(filtered_df_complex)

扩展信息:除了使用列名和比较运算符进行筛选,Pandas还支持使用isin函数进行多值筛选,以及使用query函数进行更复杂的查询。

三、数据排序

Pandas允许我们根据一列或多列对数据进行排序。

# 根据年龄列进行升序排序
sorted_df = df.sort_values(by='age', ascending=True)

# 根据多列进行排序,先按年龄升序,再按姓名降序
sorted_df_multi = df.sort_values(by=['age', 'name'], ascending=[True, False])

print(sorted_df_multi)

扩展信息sort_values函数支持ascending参数指定排序方式(升序或降序),默认为升序。同时,也可以通过inplace参数选择是否直接修改原DataFrame。

四、数据分组与聚合

Pandas提供了groupby功能,可以对数据进行分组,并对每个组执行聚合操作。

# 根据性别列分组,并计算每组的平均年龄
grouped_df = df.groupby('gender')['age'].mean()

# 展示分组后的结果
print(grouped_df)

扩展信息:除了计算平均值,groupby还可以与许多聚合函数一起使用,如sumcountmaxmin等。同时,还可以使用agg函数执行多个聚合操作。

五、缺失数据处理

Pandas提供了处理缺失数据(NaN)的功能,包括检测、填充和删除等操作。

# 检测缺失值
print(df.isnull().sum())

# 填充缺失值,例如使用列的平均值填充年龄列的缺失值
df['age'].fillna(df['age'].mean(), inplace=True)

# 删除含有缺失值的行
df_dropna = df.dropna()

print(df_dropna)

扩展信息fillna函数支持多种填充方式,如使用固定值、前一个有效值、后一个有效值等。同时,dropna函数还支持指定轴(行或列)进行删除操作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/580648.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python自动化系统6

元素的特征:根据页面设计规则,有些特征是唯一 开发遵循了这个规则 id :类比身份证号―仅限于当前页面 username username 注意:如果id 不是固定的话,就不能使用来定位! xpath: 1、绝对路径:/html/body/div/div/div[1]/a/b --根节点&#xff…

2024公共管理与社会发展国际学术会议(ICPMSD 2024)

2024公共管理与社会发展国际学术会议(ICPMSD 2024) 2024 International Conference on Public Management and Social Development 一、【会议简介】 2024公共管理与社会发展国际学术会议,将汇集全球顶尖学者,展开一场学术盛宴。 在这次会议上&#xff0…

【UE C++】设置游戏模式

问题 我们都知道如何使用蓝图创建一个游戏模式并且在这个游戏模式蓝图中去设置“默认pawn类”、“HUD类”、“玩家控制器类”、“游戏状态类”、“玩家状态类”、“旁观者类”。那么如何使用C完成该操作呢? 步骤 1. 首先创建“GameMode”、“GameState”、“HUD”…

如何用二维码实现现代仓库管理?

随着科技的进步,二维码技术逐渐应用与各个领域,其中在仓库管理中的应用也日益广泛。 那话不多说,我们直接来看如何用二维码实现现代仓库管理 简道云仓库管理模板,可以点击安装配合阅读:https://www.jiandaoyun.com 二…

Oracle集群ORA-03113:end-of-file on communication channel

一、问题场景描述 今天Oracle集群要更新各数据库的数据,折腾的启动不了了: --》数据量比较大,数据泵方式导出的dmp文件 准备导入集群 --》由于之前的生产数据库数据比较少,需要增大表空间。 --》于是在sqlplus命令窗口&#xff0c…

暗区突围端游海外版|暗区突围免费加速器有吗 免费加速器推荐

游戏中玩家可以创建男性或女性角色,可以通过选择脸型、发型、发色对人物形象进行调整;在进入游戏后,除人物性别不能修改,脸型、发型、发色都可以进行调整。除此之外可以在衣橱中对角色的上衣、手套、裤子、鞋子、帽子进行更换。游…

Leetcode—1017. 负二进制转换【中等】(string列表初始化、反向迭代器)

2024每日刷题(120) Leetcode—1017. 负二进制转换 实现代码 class Solution { public:string baseNeg2(int n) {string ans;while(n ! 0) {ans to_string(n & 1);n -(n >> 1);}return ans.empty() ? "0": string{ans.rbegin(),…

R语言详解二

一&#xff0c;列表详解 创建一个列表 > myList<-list(id2,name"张三",age20) > myList $id [1] 2$name [1] "张三"$age [1] 20 获取第一个元素 > myList[[2]] [1] "张三" 获取第一个子列表 > myList[2] $name [1] "张…

百度 测试|测试开发 面试真题|面经 汇总

百度测开 开发测试工程师 提前批一二三面面经 事业群&#xff1a;MEG base&#xff1a;北京 一面&#xff1a;2023.8.12 时长&#xff1a;50min 自我介绍 个人项目&#xff0c;我的项目是围绕着学校课程的项目来的&#xff0c;面试官就让我介绍这门课讲了些什么 &#xff…

信息化项目总体计划书(Word)

项目开发计划包括项目描述、项目组织、成本预算、人力资源估算、设备资源计划、沟通计划、采购计划、风险计划、项目过程定义及项目的进度安排和里程碑、质量计划、数据管理计划、度量和分析计划、监控计划和培训计划等。 软件全套精华资料包清单部分文件列表&#xff1a; 工作…

03-JAVA设计模式-模板方法模式

模板方法模式 什么是模板方法 模板方法模式&#xff08;Template Method Pattern&#xff09;在Java中是一种行为型设计模式&#xff0c;它定义了一个操作中的算法骨架&#xff0c;而将一些步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重新定义该算法的某…

7-34 通讯录的录入与显示

题目链接&#xff1a;7-34 通讯录的录入与显示 一. 题目 1. 题目 2. 输入输出格式 3. 输入输出样例 4. 限制 二、代码 1. 代码实现 #include <iostream> using namespace std;// 单条记录的信息 class infoContext { private:char name[11];char date[11];char man;c…

七、OSPF特殊区域及其特性

目录 OSPF区域分类 hello报文中option字段 1.末节区域&#xff08;Stub区域&#xff09; 2.完全末节区域&#xff08;Toally Stub区域&#xff09; 3.七类LSA 4.非完全末节区域&#xff08;NSSA区域&#xff09; 5.完全非完全末节区域&#xff08;Toally NSSA区域&#…

计算机服务器中了helper勒索病毒怎么办,helper勒索病毒解密流程工具

在网络技术飞速发展的今天&#xff0c;越来越多的企业离不开网络&#xff0c;网络可以为企业带来更高的生产效率&#xff0c;提供更多的便捷服务&#xff0c;但网络是一把双刃剑&#xff0c;在为人们提供便利的同时&#xff0c;也为企业的数据安全带来严重威胁。近日&#xff0…

微服务架构与SOA架构

SOA架构和微服务架构的区别 SOA关注的是服务重用&#xff0c;微服务在关注服务重用的同时&#xff0c;也同时关注快速交付&#xff1b; 微服务架构 80%的SOA服务架构思想 100%的组件化架构思想 80%的领域建模思想 首先SOA和微服务架构一个层面的东西&#xff0c;而对于ESB和…

Python_AI库 Numpy常用的统计函数介绍

Python_AI库 Numpy常用的统计函数介绍 本文默认读者具备以下技能&#xff1a; 熟悉python基础知识&#xff0c;vscode或其它编辑工具 熟悉表格文件的基本操作 具备基本的高等数学常识,能看得懂矩阵运算 具备自主扩展学习能力 本文涉及的函数主要包含&#xff1a; np.sum(arr…

自动化爬虫工具:you-get安装与使用

Windows下的安装命令&#xff1a; pip install you-get linux下的安装命令&#xff1a; pip3 install you-get 下载完成后&#xff0c;我们可以看到如下的警告&#xff0c;意思就是这个工具并未被添加到环境变量中&#xff0c;如果我们想在命令行中直接调用&#xff0c;需要…

人机介面、工业自动化、工业控制、机器人、充电站、智能家庭、可编程逻辑控制器 ( PLC ) 、远程终端单元 ( RTU )

影像输入支持 CCIR656 / CCIR601 输入接口最高分辨率&#xff1a;3 百万像素•双 SD Host 介面-支持 SD / SDIO / eMMC•模拟数字转换器 ( ADC )-支持 12-bit 8 通道-800 k 采样率 ( SPS )-支持四线或五线式电阻式触摸板•周边-支持 SPI / IC / PWM / CAN / ISO-7816

【推荐】程序员的免费羊毛!!!

还剩下最后两天了&#xff0c;最后这两天抽奖命中率特别高&#xff0c;基本中奖99.99% 有大量日历、数码电子产品。 点击链接参与「通义灵码 体验 AI 编码&#xff0c;开 AI 盲盒」 https://developer.aliyun.com/topic/lingma/activities/202403?taskCode14508&recor…

振弦采集仪在岩土工程监测中的误差分析及提高措施探讨振弦

振弦采集仪在岩土工程监测中的误差分析及提高措施探讨 振弦采集仪是岩土工程监测中常用的一种测量设备&#xff0c;广泛应用于地基沉降、岩土体固结、地下水位变化等监测工作中。然而&#xff0c;在实际应用中&#xff0c;振弦采集仪可能存在一些误差&#xff0c;影响监测结果…