Python pandas数据分析

Python pandas数据分析:

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


文章目录

  • Python pandas数据分析:
    • @[TOC](文章目录)
  • Python pandas数据分析:
  • 总结

Python pandas数据分析:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
语言这行
df[内部控制字段的条件]
在这里插入图片描述
大小写有问题
在这里插入图片描述
在这里插入图片描述
包含Python的哪些列揪出来

简单方法多好啊,搞那么多锤子作甚

直接输出columns
在这里插入图片描述
修改列名字
rename
把字段score改为这个population
在这里插入图片描述
value_counts()
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
中间是控制条件
去重
drop_diplicates
在这里插入图片描述
在这里插入图片描述
list转呗
.tolist()

在这里插入图片描述
数据.to_excel(路径)
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
交换两个列的位置
在这里插入图片描述
max
在这里插入图片描述
拿最大行
在这里插入图片描述
删除最后那个位置
在这里插入图片描述
增加一行
写个字典
然后append吧
在这里插入图片描述
sort_values()
在这里插入图片描述
在这里插入图片描述
lambda的目的是定义x
然后f(x)处理返回值,放到新的字段中

读取数据
在这里插入图片描述
查看数据的前几行
head()
在这里插入图片描述
中间可以加参数
切割split
转数字为int
把字符去掉strip(‘k’)
最大最小值拿到后,求取平均

apply是合并,用函数func去合并了,但是func是一条一条去处理
在这里插入图片描述
这个合并的用法,相当于单独处理那一列,懂???

这些应该学学
根据学历分组
算平均薪资
分组聚合
groupby关键字
mean求均值
在这里插入图片描述
把月日格式输出
.format?
一个个循环
for i in range(len(df)):
ix是啥?底i行?第0列
转为pydatetime
.strftime(“%m-%d”)月日
在这里插入图片描述
查看索引,数据类型和内存信息
info
在这里插入图片描述
数值型列的汇总
在这里插入图片描述
新增一列,将薪水分为三组
bins搞三个区间
然后分组仨名字,用啥函数来搞可能
新启动一列,cut切割,谁?薪水,按bins切割,然后名字的labels挂上

在这里插入图片描述
sort_values(字段,ascending=False),降序
True是升序
在这里插入图片描述
按照salary来排序

取出行
loc
在这里插入图片描述
中位数
np能,
np.median(df中salary数据)
pandas也能
在这里插入图片描述
绘制薪资的频率分布直方图
有matplotlib.pyplot

plt
df.salary.plot(kind=‘hist’)
直接用它自带的属性
在这里插入图片描述

df.salary.plot(kind=‘kde’, xlim=(0,8000))水平密度线
在这里插入图片描述
水平的密度
薪资有多人?

删除列
drop
在这里插入图片描述
合并两列
在这里插入图片描述
在这里插入图片描述
最值只差
apply:
lambda x:x.max()-x.min()
在这里插入图片描述
中间多了[]这个是啥意思

总之就似乎它的最大小之差
在这里插入图片描述
第8行加到末尾
append
在这里插入图片描述
好像loc和iloc都能获取行
在这里插入图片描述
数据的类型
dtypes

设置索引
setindex
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
减法,继续增加一列
直接干字段,后面跟着数据
在这里插入图片描述

在这里插入图片描述
包含缺失值吗

在这里插入图片描述
在这里插入图片描述
大于10000的次数
在这里插入图片描述
在这里插入图片描述
调取
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
df[里面是条件]

遍历每个字段,如果有缺失,则统计一波
然后照这个列,如果有null,就给他的values设定为True,把index弄出来,变tolist
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
收盘价
折现图
matplotlib
用seaborn-darkgrid画质
rc设置字体大小
fig出一个句柄画布

在这里插入图片描述
直接plot也行
你需要时间轴
在这里插入图片描述
俩都画
把数据整俩
在这里插入图片描述
在这里插入图片描述
hist
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
换手率
每行换手率
iloc行列
在这里插入图片描述
在这里插入图片描述
删除所有
非数字的行
for循环

定位i行13列
如果不是数字,做成列表
挨个去drop或者删除
labels=那个列表
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
收取平均
骚啊rolling
在这里插入图片描述
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
连着plot就是一个图

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
向后移动
向前移动

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
pandas和numpy经常混合使用

np.version
pd.version

在这里插入图片描述
搞一个np.random.randint(1,100,20)1–100,20个数据
然后搞一个dataframe
在这里插入图片描述
在这里插入图片描述
np.arrange(0,100,5)
这个是步长为5,固定的
在这里插入图片描述
在这里插入图片描述
正态分布也行
在这里插入图片描述
合并仨行
axis=0就是行
concat方法就是合并
在这里插入图片描述
在这里插入图片描述

往下拼接
我们看看axis=1列
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
牛逼
percentile(df,q=[0,25,75,100])%
本质是
精准在这里插入图片描述
修改列名
在这里插入图片描述
输出看看
在这里插入图片描述
第一列中不在第二列
是否存在?
在这里插入图片描述
df[][这里输出真假]
控制
频率,统计,排序
values_count自然是降序呗
在这里插入图片描述
找位置
np.argwhere
df%5==0
整除
在这里插入图片描述
前后差
diff().to_list
在这里插入图片描述
顺序颠倒
在这里插入图片描述
拿数据take
在这里插入图片描述
每一行均值
在这里插入图片描述
第三列升序排序,整体要带动吗
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2norm
在这里插入图片描述
单独列出别的呢
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
converter
转换
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
round直接取%

在这里插入图片描述
data直接0:2%前面对其,后面2个小数点

在这里插入图片描述
在这里插入图片描述
翻转行
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
CD字段也过来了
多列
在这里插入图片描述在这里插入图片描述
左右是看key1,还是2


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/189677.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言从入门到精通之【表达式和语句】

1 表达式 表达式由运算符和运算对象组成,最简单的表达式一个单独的运算对象。每个表达式都有一个值,并且是根据运算符优先级规定的顺序来执行,以下是一些表达式: 4 -6 421 a*(b c/d)/20 q 5*2 x q % 3 #q > 3 2 语句 语句…

前端web开发学习笔记

JavaWeb 前端Web开发HTMLCSSjavaScript1.JS引入2.JS基础语法3.JS函数4.JS对象 BOMDOM文档对象模型JS事件监听VueVue常用指令Vue的生命周期 AjaxAxios 前端工程化环境准备NodeJS安装和Vue-cli安装vue项目Vue组件库Element组件的使用 Vue路由Nginx打包部署 前端Web开发 HTML 负…

linux rpm安装软件卸载 以卸载mysql为例

查看rpm包 rpm -qa | grep 内容 卸载rpm rpm -e --nodeps rpm名称

使用VC++设计程序:实现常见的三种图像插值算法:最近邻插值,双线性插值,立方卷积插值

图像放大的三种插值算法 获取源工程可访问gitee可在此工程的基础上进行学习。 该工程的其他文章: 01- 一元熵值、二维熵值 02- 图像平移变换,图像缩放、图像裁剪、图像对角线镜像以及图像的旋转 03-邻域平均平滑算法、中值滤波算法、K近邻均值滤波器 04-…

VSCode 警告:v-on event ‘@toggleClick‘ must be hyphenated

🚀 作者主页: 有来技术 🔥 开源项目: youlai-mall 🍃 vue3-element-admin 🍃 youlai-boot 🌺 仓库主页: Gitee 💫 Github 💫 GitCode 💖 欢迎点赞…

【Spring篇】spring核心——AOP面向切面编程

目录 想要彻底理解AOP,我觉得你的先要了解框架的模块化思想,为此先记录框架在讲AOP 什么是java框架?为什么要出现框架? 我总结以下七点来讲述和帮助理解java框架思想 什么是AOP? 如何理解上面这句话呢&#xff1…

【开源】基于Vue+SpringBoot的农家乐订餐系统

项目编号: S 043 ,文末获取源码。 \color{red}{项目编号:S043,文末获取源码。} 项目编号:S043,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 用户2.2 管理员 三、系统展示四、核…

Redis面试题:redis做为缓存,数据的持久化是怎么做的?两种持久化方式有什么区别呢?这两种方式,哪种恢复的比较快呢?

目录 面试官:redis做为缓存,数据的持久化是怎么做的? 面试官:这两种持久化方式有什么区别呢? 面试官:这两种方式,哪种恢复的比较快呢? 面试官:redis做为缓存&#xff…

【【Linux编程介绍之关键配置和常用用法】】

Linux编程介绍之关键配置和常用用法 Hello World ! 我们所说的编写代码包括两部分:代码编写和编译,在Windows下可以使用Visual Studio来完成这两部,可以在 Visual Studio 下编写代码然后直接点击编译就可以了。但是在 Linux 下这两部分是分开…

文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《前景导向的主动配电网智能储能软开关规划方法》

这个标题涉及到电力系统中的主动配电网(Active Distribution Network)以及与之相关的智能储能软开关的规划方法。下面是对标题中各个关键词的解释: 前景导向的(Future-oriented): 这表明该方法是以未来发展…

球面的表面积

此推导需要用到重积分的知识,另外关于曲面的面积公式可以看我之前的博客

线性表,也是Java中数组的知识点!

线性表定义: 由n (n≥0)个数据特性相同的元素构成的有限序列称为线性表,(n0)的时候被称为空表。 线性表的顺序表示 线性表的顺序存储又被称为顺序表 优点 无需为表示表中元素之间的逻辑关系而增加额外的存储空间可以随意读取任意位置的元素 缺点 插入…

【Mybatis】预编译/即时sql 数据库连接池

回顾 Mybatis是一个持久层框架.有两种方式(这两种方式可以共存) 1.注解 2.xml 一.传递参数 以使用#{} 来接受参数为例 (以上两种方式一样适用的) 1)传递单个参数 #{} 可以为任意名称 2)多个参数 默认的参数名称就是接口方法声明的形参 3)参数为对象 默认给每个对象的每个属性都…

中海油“海安杯”一站到底知识竞赛真的很有特色

中海油“海安杯”一站到底知识竞赛规格高,赛制复杂,天纵知识竞赛系统为此次知识竞赛提供了软件支持。本次竞赛设置选手区和擂台区两个区域。比赛共分为五个轮次,五个轮次选手区所有参赛选手均需答题。 第一轮:“脱颖而出” 所有参…

ruoyi-plus-vue docker 部署

本文以 ruoyi-vue-plus 5.x docker 部署为基础 安装虚拟机 部署文档 安装docker 安装docker 安装docker-compose 配置idea环境 上传 /doicker 文件夹 到服务器;赋值 777权限 chmod -R 777 /docker idea构建 jar 包 利用 idea 构建镜像; 创建基础服务 docker…

深入了解 Pinia:现代 Vue 应用的状态管理利器

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云…

2017年11月16日 Go生态洞察:Go用户调查深度解析

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

CSDN助手:一键下载CSDN博客:高效保存,随时阅读

文章目录 📖 介绍 📖🏡 环境 🏡📒 使用方法 📒⚓️ 相关链接 ⚓️ 📖 介绍 📖 这是我自己无聊的时候写的一个应用,以前UI有点丑,这次重写了一下UI 功能如下 …

使用VC++设计程序对一幅256级灰度图像进行全局固定阈值分割、自适应阈值分割

图像分割–全局固定阈值分割、自适应阈值分割 获取源工程可访问gitee可在此工程的基础上进行学习。 该工程的其他文章: 01- 一元熵值、二维熵值 02- 图像平移变换,图像缩放、图像裁剪、图像对角线镜像以及图像的旋转 03-邻域平均平滑算法、中值滤波算法、…

Linux python安装 虚拟环境 virtualenv,以及 git clone的 文件数据, 以及 下资源配置

根目录创建 venvs 文件夹 sudo mkdir /venvs 进入 /venvs 目录 cd /venvsp 创建虚拟环境,前提要按照 python3 安装 的 命令 sudo apt install python3 sudo python3 -m venv 虚拟环境名 激活虚拟环境 source /venvs/zen-venv/bin/activate 安装flask pip install fl…