【6】数据分析检测(DataFrame 1)

学习目标3

昨天,我们学习了Series。

而Pandas的另一种数据类型:DataFrame,在许多特性上和Series有相似之处。

今天,我们将学习DataFrame的相关知识:

1. DataFrame的概念

2. 构造一个DataFrame

3. DataFrame的常用属性

4. DataFrame的轴

DataFrame

DataFrame

数据框

定义

DataFrame,中文叫数据框。

是pandas模块最常用的数据类型,是一个二维的矩阵数据表。

非常便捷地存放数据。

隐喻

DataFrame,就像是一个表格,可以通过行和列,可以定位一个值。

那DataFrame和Series之间有什么关系呢?
在某种程度上,可认为DataFrame是“具有相同index的Series的集合”

右侧是一个DataFrame,它由3部分组成:

既有行索引(index),可以用来定位到具体的某一行。

也有列索引(columns),用来定位到具体的某一列。

通过index和columns,可以定位到一个值,能快速进行数据的筛选和定位。

因此,DataFrame的同一列中,值的数据类型相同。

但是,列和列之间的数据类型可以不同。

 

      

同样的,和Series类似,DataFrame的行索引index是可以选择性定义的。如果没有定义index,index就会默认从0开始生成。

总结:

DataFrame

DataFrame,中文叫做数据框,是pandas模块最常用的数据类型,是一个二维的矩阵数据表。

DataFrame构造函数

这几行代码,构造了一个DataFrame。
第1行,导入pandas模块。
第3行,定义了一个字典。
第4行,定义了一个列表。
第6行,使用DataFrame构造函数创建了一个DataFrame,并赋值给了变量df。
第8行,将这个创建的DataFrame输出。

import pandas as pd

data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}

city= ['GD','JS','SD','ZJ']

df= pd.DataFrame(data, index=city)

print(df)

pd.DataFrame( )

通过调用的pandas模块里的DataFrame()函数,可以构造一个DataFrame。

import pandas as pd

data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}

city= ['GD','JS','SD','ZJ']

df= pd.DataFrame(data, index=city)

print(df)

第一个常用参数:data

pd.DataFrame()中,参数data表示需要传入的数据,可以是字典,列表等。

示例中data是一个字典,传入pd.DataFrame()函数;

字典的keys,会成为DataFrame的列索引columns;

字典的values是列表,列表中的值,会成为DataFrame的值values。

注意:若不传入数据,会生成一个空的DataFrame。

import pandas as pd

data= {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}

city= ['GD','JS','SD','ZJ']

df= pd.DataFrame(data, index=city)

print(df)

需要特别注意的是,在构造DataFrame时,传入的字典必须是右侧所示的结构:

 

字典的keys是对象;

字典的values是对应的列表,并且每个列表中的元素个数相同。

在构造过程中:

字典中的keys,就成为了DataFrame中的列索引columns。

字典中的values,就成为了DataFrame中的值values

第二个常用参数:index

参数index用于定义DataFrame的行索引(index)。
只需要将一个列表赋值给参数index。
示例中,我们将定义的列表city赋值给参数index。
city中的值,会成为DataFrame的index。
若不传入参数index,那么生成的DataFrame的index就会默认从0开始生成。

import pandas as pd

data = {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}

city = ['GD','JS','SD','ZJ']

df = pd.DataFrame(data, index=city)

print(df)

赋值的变量

将pd.DataFrame()函数创建的DataFrame,赋值给了df这个变量。
将df输出可以看到,它是一个DataFrame对象:
列索引(columns)是由字典data的的keys组成;
值(values)是由字典data的的值组成;
行索引(index)是由列表city的值组成。

import pandas as pd

data = {'rank':[1, 2, 3, 4],'GDP':[80855, 77388, 68024, 47251]}

city = ['GD','JS','SD','ZJ']

df = pd.DataFrame(data, index=city)

print(df)

总结:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/934675.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

LeetCode 热题 100_环形链表 II(26_142_中等_C++)(单链表;哈希表;快慢指针)

LeetCode 热题 100_环形链表 II(26_142) 题目描述:输入输出样例:题解:解题思路:代码实现(思路一(哈希表)):代码实现(思路二&#xff0…

如何通过看板进行跨境电商的圣诞商品数据分析与优化选品流程?

引言 随着圣诞季的临近,跨境电商迎来了重要的销售时机。选品工作对于跨境电商的成功至关重要,直接关系到销售业绩和利润。本文结合相关网页信息,深入探讨跨境电商在圣诞期间如何利用信息整合工具展开选品工作,并优化选品流程。同…

PHP开发设计模式:单例模式

PHP开发设计模式:单例模式 特点: 三私一公:私有的静态变量(存放实例),私有的构造方法(防止创建实例),私有的克隆方法 (防止克隆对象),公有的静态方法&#…

使用HTML获取商品详情:技术实现与最佳实践

1. 引言 在电子商务领域,获取商品详情是提升用户体验和增强网站功能性的关键。本文将探讨如何使用HTML结合其他技术手段获取商品详情,并展示如何将这些信息有效地呈现给用户。 2. 理解商品详情页面的结构 在开始编码之前,我们需要了解商品…

MR30分布式IO在新能源领域加氢站的应用

导读 氢能被誉为21世纪最具发展潜力的清洁能源,氢能科技创新和产业发展持续得到各国青睐。氢能低碳环保,燃烧的产物只有水,是用能终端实现绿色低碳转型的重要载体。氢能产业链分别为上游制氢、中游储运以及下游用氢。上游制氢工艺目前大部分…

WEB安全基础知识

WAF全称为Web Application Firewall(网页应用防火墙)是一种专门设计用来保护web应用免受各种网络攻击的安全防护措施。它位于客户端与服务器之间,监控和过滤HTTP流量,从而拦截恶意请求、识别并防御常见的web攻击。 WAF的主要功能…

【数据结构】B树家族解析:B树、B+树与B*树的理论与B树插入实现(C++)

文章目录 一、常见的搜索结构二、B树2.1 B树概念2.2 开销 三、代码实现3.1 B树节点的设计3.2 B树设计3.3 插入操作实现1. 查找插入位置(Find 函数)2. 插入关键字到节点(InsertKey 函数)3. 处理节点分裂(Insert 函数&am…

protobuf c++开发快速上手指南

1、环境准备 在c环境使用 protobuf,需要安装protobuf runtime以及protobuf的编译器:protoc,其作用如下表格: 需要安装的环境作用protoc将proto文件编译成c源码protobuf runtime编译c源码需要链接到protobuf库 注意:…

【实践·专业课】内存管理-存储管理-文件系统

1. 基于Linux的简单区块链实现 1.1. 环境准备 确保使用的 Linux 系统(如 Ubuntu、CentOS 等)已安装 Python 3。 在终端输入python3命令,若出现 Python 解释器的版本信息等提示,则表示已安装; 若提示未找到命令&…

科技潮头浪接天,一桥飞架两界连。EthernetIP转Profinet互译连

本案例介绍的是西门子1200PLC通过稳联技术PROFINET转EtherNetIP网关(WL-ABC2006)连接HCS-6100系统配置案例。 打开稳联技术Ethernetip转profient网关(WL-ABC2006)配置软件,因为网关作为EtherNetIP从站,所以选择PN2EIP。设置网关Pr…

【网络篇】TCP知识

TCP首部格式? 为什么需要 TCP 协议? TCP 工作在哪一层? IP 层是不可靠的,它不保证网络包的交付、不保证网络包的按序交付也不保证网络包中的数据的完整性。如果需要保障网络数据包的可靠性,那么就需要由上层&#xff0…

PDFMathTranslate,PDF多语言翻译,批量处理,学术论文,双语对照(WIN/MAC)

分享一个非常实用的PDF文档翻译项目——PDFMathTranslate。作为一个经常逛GitHub的开发者,我总喜欢翻看各种项目附带的论文,虽然大多时候是瞎研究,但却乐在其中。该项目能够完美保留公式、图表、目录和注释,对于需要阅读外文文献的…

Ape-DTS:开源 DTS 工具,助力自建 MySQL、PostgreSQL 迁移上云

Ape-DTS 是一款高效、轻量级且功能强大的开源工具,专注于解决数据迁移、同步、校验、订阅与加工的需求。无论是将自建的 MySQL/PostgreSQL 数据库迁移到云端,还是在不同数据库间进行数据迁移,Ape-DTS 都能为您提供便捷且可靠的解决方案。它特…

【经典论文阅读】Latent Diffusion Models(LDM)

Latent Diffusion Models High-Resolution Image Synthesis with Latent Diffusion Models 摘要 动机:在有限的计算资源下进行扩散模型训练,同时保持质量和灵活性 引入跨注意力层,以卷积方式实现对一般条件输入(如文本或边界框…

使用torch模拟 BMM int8量化计算。

使用torch模型BMM int8计算。 模拟:BMM->softmax->BMM 计算流程 import torch import numpy as np torch.manual_seed(777) def int8_quantize_per_token(x: torch.Tensor, axis: int -1, attnsFalse):if x.dtype ! torch.float32:x x.type(torch.float32)…

Leetcode 每日一题 219.存在重复元素 II

目录 问题描述 输入输出格式 示例 算法分析 过题图片 代码实现 复杂度分析 题目链接 总结 问题描述 给定一个整数数组nums和一个整数k&#xff0c;我们需要判断数组中是否存在两个不同的索引i和j&#xff0c;使得nums[i] nums[j]且|i - j| < k。如果存在这样的i和…

ragflow连不上ollama的解决方案

由于前期wsl默认装在C盘&#xff0c;后期部署好RagFlow后C盘爆红&#xff0c;在连接ollama的时候一直在转圈圈&#xff0c;问其他人没有遇到这种情况&#xff0c;猜测是因为内存不足无法加载模型导致&#xff0c;今天重新在E盘安装wsl 使用wsl装Ubuntu Win11 wsl-安装教程 如…

PR的选择与移动

选择工具 可以选择序列上的剪辑&#xff0c;如果需要多选可以按住shift键选中多个剪辑 CtrlA&#xff1a;可以进行全选 编组 选中多个剪辑后“右键-编组“可以将所选的剪辑连接在一起。这时单击任意剪辑都可以选中全部 向前选择轨道工具与向后选择轨道工具 向前选择轨道工具…

使用C#基于ADO.NET编写MySQL的程序

MySQL 是一个领先的开源数据库管理系统。它是一个多用户、多线程的数据库管理系统。MySQL 在网络上特别流行。MySQL 数据库可在大多数重要的操作系统平台上使用。它可在 BSD Unix、Linux、Windows 或 Mac OS 上运行。MySQL 有两个版本&#xff1a;MySQL 服务器系统和 MySQL 嵌入…

Python3中赋值运算符说明二

一. 简介 前面文章简单学习了 Python3中一些赋值运算符&#xff0c;文章如下&#xff1a; Python3中赋值运算符上篇-CSDN博客 本文继续学习 Python3中另外一些赋值运算符。 二. Python3 中赋值运算符 1. Python3 中赋值运算符 前一篇文章简单学习了 Python3 中的一些赋值…