Python机器学习实验 Python 数据分析

1.实验目的

掌握常见数据预处理方法,熟练运用数据分析方法,并掌握 Python 中的 Numpy、 Pandas 模块提供的数据分析方法。

2.实验内容

1. Pandas 基本数据处理

使用 Pandas 模块,完成以下操作。

(1)创建一个由 0 到 50 之间的整数组成的 10 行 5 列的 dataframe。如下:

(2)汇总每一列的最小值。

(3)按行方向汇总每行数据的总和。

(4)按列方向汇总每列数据的总和。

代码:

#创建一个由 0 到 50 之间的整数组成的 10 行 5 列的 dataframe
import pandas as pd
import numpy as np
df = pd.DataFrame(np.arange(0, 50).reshape(10, 5))
# 输出 dataframe
print('dataframe:',df)
# 汇总每一列的最小值
min_values = np.min(df, axis=0)
print("每列的最小值:", min_values)
# 按行方向汇总每行数据的总和
row_sums = np.sum(df, axis=1)
print("每行的总和:", row_sums)
# 按列方向汇总每列数据的总和
col_sums = np.sum(df, axis=0)
print("每列的总和:", col_sums)

2.  城市夏季气温分析 在“tpData.csv”文件中存储的是韩国某城市夏季的最高、最低气温数据,时间是

从 2013 年到 2018 年间,日期是从每年的 6 月 30 日到 8 月 30 日。其中 Present_Tmax

字段代表下午 2 点测量的最高温度。Present_Tmin 代表凌晨 4 点测量的最低温度。完 成以下操作。

(1)使用 Pandas 的 read_csv()函数读取“tpData.csv”,并显示数据。 import pandas as pd

df = pd.read_csv('tpData.csv')

#header:Year Month Day Present_Tmax Present_Tmin df

图 4-1   韩国某城市夏季温度数据

(2)按年度分组,查看每年各有多少条数据。 操作提示:

使用 groupby 函数,按 Year 字段分组。

#分组统计

df.groupby('Year').size() #查看组大小结果

(3)按年份统计每年的最高温度的平均值。 操作提示:

使用 groupby 函数,按 Year 字段分组,统计 Present_Tmax 字段的平均值。

df.groupby('Year')['Present_Tmax'].mean()

(4)按月份统计 6、7、8 每个月的最高温度的平均值。

df.groupby('Month')['Present_Tmax'].mean()

(5)按月份统计 6、7、8 每个月的最低温度的平均值。

df.groupby('Month')['Present_Tmin'].mean()

代码:

#使用 Pandas 的 read_csv()函数读取“tpData.csv”,并显示数据
import pandas as pd
df = pd.read_csv(r'D:\tpData.csv')
print(df)
#按年度分组,查看每年各有多少条数据。 操作提
print(df.groupby('Year').size())
#按年份统计每年的最高温度的平均值。 操作提示
print(df.groupby('Year')['Present_Tmax'].mean())
#按月份统计 6、7、8 每个月的最高温度的平均值。
print(df.groupby('Month')['Present_Tmax'].mean())
#按月份统计 6、7、8 每个月的最低温度的平均值。
print(df.groupby('Month')['Present_Tmin'].mean()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/514732.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

windows消息机制--1基本概念解释

基本概念解释 我们在编写标准C程序的时候,经常会调用各种库函数来辅助完成某些功能:初学者使用得最多的C库函数就是printf了,这些库函数是由你所使用的编译器厂商提供的。在Windows平台下,也有类似的函数可供调用:不同的是&#…

UE4_普通贴图制作法线Normal材质

UE4 普通贴图制作法线Normal材质 2021-07-02 10:46 导入一张普通贴图: 搜索节点:NormalFromHeightmap 搜索节点:TextureObjectparameter,并修改成导入的普通贴图,连接至HeightMap中 创建参数normal,连接…

docker部署nacos,单例模式(standalone),使用内置的derby数据库,简易安装

文章目录 前言安装创建文件夹docker指令安装docker指令安装-瘦身版 制作docker-compose.yaml文件查看页面 前言 nacos作为主流的服务发现中心和配置中心,广泛应用于springcloud框架中,现在就让我们一起简易的部署一个单例模式的nacos,版本可…

【深度学习】图像自然语言描述生成

案例 6:图像自然语言描述生成(让计算机“看图说话”) 相关知识点:RNN、Attention 机制、图像和文本数据的处理 1 任务目标 1.1 任务和数据简介 ​ 本次案例将使用深度学习技术来完成图像自然语言描述生成任务,输入…

Unity开发者3D模型基础

术语“3D 建模”是指使用特殊软件创建对象或表面的 3D 数字表示的过程。 3D 模型可用于各种不同的目的,包括电影、视频游戏、建筑和工程。 3D 建模也是创建虚拟现实 (VR) 和增强现实 (AR) 体验工作的重要组成部分。 我们通常通过构建或获取 3D 模型并将其导入 Unit…

设置win32程序的窗口过程为自定义的窗口过程

Win32 SetWindowLong函数的第二个参数是一个整型,可以取不同的值,根据此值设置窗口的不同的属性;如果设为 GWL_WNDPROC 则可以为窗口设置一个另外的窗口过程; VC6新建一个win32项目,类型选为 典型helloworld 程序; 资源中添加一个菜单, 总的代码如下; // setproc.cp…

NineData云原生智能数据管理平台新功能发布|2024年3月版

数据库 DevOps - 大功能升级 SQL 开发早期主要提供 SQL 窗口(IDE)功能,在产品经过将近两年时间的打磨,新增了大量的企业级功能,已经服务了上万开发者,覆盖了数据库设计、开发、测试、变更等生命周期的功能…

正则表达式完全指南:语法、用法及JavaScript实例

🌟 前言 欢迎来到我的技术小宇宙!🌌 这里不仅是我记录技术点滴的后花园,也是我分享学习心得和项目经验的乐园。📚 无论你是技术小白还是资深大牛,这里总有一些内容能触动你的好奇心。🔍 &#x…

K8s Deployment 滚动更新、金丝雀发布、自定义钩子、生命周期解析

🐇明明跟你说过:个人主页 🏅个人专栏:《Kubernetes航线图:从船长到K8s掌舵者》 🏅 🔖行路有良友,便是天堂🔖 目录 一、Deployment的高级特性 1、滚动更新 2、金丝雀…

harmonyOS的客户端存贮

什么是客户端存贮 在harmonyOS中,客户端存贮是指将数据存贮在本地设备以供应用程序使用; 注: 和feaureAblity搭配使用,content上下文的获取依赖该API如下: // 引入: import featureAbility from ohos.ability.featureAbility;// 使用: let content featureAbility.getConten…

STM32串口认识

常用函数介绍 串口发送/接收函数 HAL_UART_Transmit(); 串口发送数据,使用超时管理机制(即在发送成功前一直阻塞,相当于有个delay()在卡住主函数) HAL_UART_Receive(); 串口接收数据,使用超时…

极简云验证 download.php 文件读取漏洞复现

0x01 产品简介 极简云验证是一款开源的网络验证系统,支持多应用卡密生成:卡密生成 单码卡密 次数卡密 会员卡密 积分卡密、卡密管理 卡密长度 卡密封禁 批量生成 批量导出 自定义卡密前缀等;支持多应用多用户管理:应用备注 应用版…

Android JNI基础

目录 一、JNI简介1.1 什么是JNI1.2 用途1.3 优点 二、初探JNI2.1 新建cpp\cmake2.2 build.gradle配置2.3 java层配置2.4 cmake和c 三、API详解3.1 JNI API3.1.1 数据类型3.1.2 方法 3.2 CMake脚本 四、再探JNI 一、JNI简介 1.1 什么是JNI JNI(Java Native Interfa…

开源软件技术社区方案

开源软件技术社区是一个由开发者、贡献者、用户和维护者组成的共享平台,主要目的是打造技术、软件产品良性互动、开源技术安全可控的软件生态环境,实现可复用应用或服务的快速部署与使用、完成资源与能力的高度共享、促进社区成员的共建共赢,…

面试复盘1 - 测试相关(实习)

写在前:hello,大家早中晚上好~这里是西西,最近有在准备测试相关的面试,特此开设了新的篇章,针对于面试中的问题来做一下复盘,会把我自己遇到的问题进行整理,除此之外还会进行对一些常见面试题的…

什么是异地组网?

在当今互联网普及的背景下,异地组网已成为许多企业和个人日常工作中不可或缺的一部分。异地组网的核心目的是实现不同地区间的快速、高效的局域网连接。在这个过程中,延迟(即网络数据传输的时间延迟)是一个关键影响因素。我们来看…

还得是抖音,字节推出竖屏视频理解数据集,入选CVPR2024

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了免费的人工智能中文站https://ai.weoknow.com 新建了收费的人工智能中文站https://ai.hzytsoft.cn/ 更多资源欢迎关注 短视频在当下社交媒体逐渐成为主导的视频格式。传统视频处理技术和研究一般都专注于横屏视频…

【快速解决】python缺少了PyQt5模块的QtMultimedia子模块

目录 问题描述 问题原因 解决方法 成功示范 问题描述 Traceback (most recent call last): File "d:\桌面\python项目\DesktopWords-master\main.py", line 4, in <module> from PyQt5.QtMultimedia import QMediaPlayer, QMediaContent ModuleNotFoundEr…

Unity自定义icon

Unity自定义icon 1. 新建文件夹 OfficeFabricIconSet2. 新建Iconset3. 新建子文件夹Textures并添加icon图片4. 向iconset添加Quad Icons5. 最终效果 教程来源处&#xff1a; https://365xr.blog/build-your-own-button-icon-set-for-microsoft-hololens-2-apps-with-mrtk-using…

stm32之基本定时器的使用

在上文我们使用到了HAL库的自带的延时函数&#xff0c;HAL_Delay&#xff08;&#xff09;&#xff1b;我们来看一下函数的原型 __weak void HAL_Delay(uint32_t Delay) {uint32_t tickstart HAL_GetTick();uint32_t wait Delay;/* Add a freq to guarantee minimum wait */…