数据分析中的统计学基础及Python具体实现【数据分析】

各位大佬好 ,这里是阿川的博客,祝您变得更强

在这里插入图片描述 个人主页:在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力在这里插入图片描述

阿川水平有限,如有错误,欢迎大佬指正在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Python 初阶
Python–语言基础与由来介绍
Python–注意事项
Python–语句与众所周知
数据清洗前 基本技能
数据分析—技术栈和开发环境搭建
数据分析—Numpy和Pandas库基本用法及实例
统计学基础前 必看
数据分析—三前奏:获取/ 读取/ 评估数据
数据分析—数据清洗操作及众所周知
数据分析—数据整理操作及众所周知

目录

  • 统计学概述
  • 数值数据分析维度
    • 偏态解释

数据分析与统计学不可分割

统计学概述

统计学主要是描述和推断

  • 描述

    • 分类数据
      • 有限数量的类别的数据
        • 定序
          • 顺序
            • 例如金银铜三枚奖牌,金大于大于
        • 定类
          • 例如猫的种类,不能说有顺序
  • 请添加图片描述

    • 数值数据
      • 可进行数学运算和统计分析计算有意义的数据
        • 连续
          • 例如1~2之间区间有很多连续的数字
        • 离散
          • 只能以整数或自然数为单位的数据

图2

数值数据分析维度

数值数据是数据分析的重点,分析维度主要从三个方面来分析

  • 集中趋势
    • 数据集中分布在哪里

在这里插入图片描述

  • mean平均数

请添加图片描述

  • median中位数

请添加图片描述

  • mode众数

请添加图片描述

  • 离散趋势
    • 数据偏离中心分布在哪里

在这里插入图片描述

  • max-min极差

请添加图片描述

  • var/std 方差/标准差

请添加图片描述

  • quantile(0.75)- quantile(0.25)四分位距

    • 四分位距是将数据按顺序,按四等分分好并排序,处于三个分割点位置的数值就是四分位数-
    • 表示中间一半数值的离散程度
      • 越大说明数据越分散
      • 越小说明数据越集中

在这里插入图片描述

请添加图片描述

  • 分布形状

在这里插入图片描述

  • 可以看出数据的偏态、峰度、异常值
  • 分布形状主要是指直方图
    plot 表示画图
    • kind参数具体什么形状
      • hist表示直方图

请添加图片描述

偏态解释

直方图一般为正态分布(平均值、中位数、众数差不多都位于中央

请添加图片描述

偏态(平均数、中位数、众数偏离中央

  • 正偏态即右偏态

  • 负偏态及左偏态

请添加图片描述请添加图片描述

注意一下直方图

  • 数据量小,分布形状较不明显
  • 数据量大,分布形状较明显

好的,到此为止啦,祝您变得更强

在这里插入图片描述
想说的话

实不相瞒,写的每篇博客都要写三四个小时(加上自己学习和纸质笔记,共五六小时吧),很累希望大佬支持

在这里插入图片描述

道阻且长 行则将至

个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/687019.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

python的line[:-1]和line[-1]

line[:-1]其实就是去除了这行文本的最后一个字符(换行符)后剩下的部分。 line = "abcde" line[:-1] 结果为:abcd line = "abcde" line[::-1] 结果为:edcba 示例3 [m : ] 代表列表中的第m+1项到最后一项 [ : n] 代表列表中的第一项到第n项 [-1] 代…

基于jeecgboot-vue3的Flowable流程-已办任务(一)

因为这个项目license问题无法开源,更多技术支持与服务请加入我的知识星球。 1、api接口部分 import { defHttp } from //utils/http/axios;enum Api {flowRecord /flowable/task/flowRecord,finishedListNew /flowable/task/finishedListNew,revokeProcess /flo…

2024年自然语言处理科学与信息检索技术国际会议(ICNLPSIRT 2024)

2024年自然语言处理科学与信息检索技术国际会议(ICNLPSIRT 2024) 2024 International Conference on Natural Language Processing Science and Information Retrieval Technology (ICNLPSIRT 2024) 会议地点:武汉,中国 网址:http://www.i…

【递归、搜索与回溯】搜索

搜索 1.计算布尔二叉树的值2.求根节点到叶节点数字之和3. 二叉树剪枝4.验证二叉搜索树5.二叉搜索树中第K小的元素6.二叉树的所有路径 点赞👍👍收藏🌟🌟关注💖💖 你的支持是对我最大的鼓励,我们一…

深入ES6:解锁 JavaScript 类与继承的高级玩法

个人主页:学习前端的小z 个人专栏:JavaScript 精粹 本专栏旨在分享记录每日学习的前端知识和学习笔记的归纳总结,欢迎大家在评论区交流讨论! ES5、ES6介绍 文章目录 💯Class🍟1 类的由来🍟2 co…

【文献阅读】LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

目录 1. motivation2. overall3. model3.1 low rank parametrized update matrices3.2 applying lora to transformer 4. limitation5. experiment6. 代码参考文献 1. motivation 常规的adaptation需要的微调成本过大现有方法的不足: Adapter Layers Introduce Inf…

视创云展元宇宙虚拟展厅:开启无限可能的沉浸式体验

随着科技的飞速发展,元宇宙虚拟展厅已逐步成为展览行业的新宠。视创云展元宇宙虚拟展厅以其独特的魅力,将参观者从传统展览场所的束缚中解放出来,为他们呈现了一个更为广阔、更为丰富的虚拟世界。通过数字虚拟展厅这一载体,参观者…

如何掌握 Java 正则表达式 的基本语法及在 Java 中的应用

正则表达式是一种用于匹配字符串的模式,在许多编程语言中广泛使用。Java 正则表达式提供了强大的文本处理能力,能够对字符串进行查找、替换、分割等操作。 一、正则表达式的基本语法 正则表达式由普通字符和特殊字符组成。普通字符包括字母、数字和标点…

【Android】主界面设置-封装

在bulid文件写网址 implementation("io.github.youth5201314:banner:2.2.1") 添加主界面图片 些内容 在界面有图片,相同的属性封装起来 在values新建 先写风格,,再写代码 先写好这几项,宽高比例位置 将相同的属性…

软硬件集成项目,这个项目管理软件做的成本预算管理深得我心

最近,我负责了一个中大型的软硬件集成的项目,是对某单位的车间进行智能化改造,以提高生产效率,要确保设备运行的稳定性和安全性。项目会涉及到大量的硬件采购、安装以及多个软件的开发、集成,所以在实施过程中遇到了多…

【Python】实现极致:克服PyInstaller打包挑战,解决libpython3.10.so.1.0库丢失难题

【Python】实现极致:克服PyInstaller打包挑战,解决libpython3.10.so.1.0库丢失难题 大家好 我是寸铁👊 总结了一篇【Python】实现极致:克服PyInstaller打包挑战,解决libpython3.10.so.1.0库丢失难题✨ 喜欢的小伙伴可以…

微软必应地图的三维实景功能

偶然看到微软必应地图的三维实景功能,由于比较感兴趣这方面的技术,所以试用了一下,感觉总体来说技术上比咱们自己的技术和设计要好很多。比如这个工具栏就设计的很简洁,人性化: 而且实景地图的范围也非常大,建立这么大…

Windows系统中不同Java版本共存

Windows系统中不同Java版本共存的方法 在Windows系统中,有时我们需要同时运行多个Java应用,而这些应用可能依赖于不同版本的Java Development Kit (JDK) 或 Java Runtime Environment (JRE)。为了实现这种需求,我们需要在Windows中配置多个J…

自养号测评防关联的关键点解析, 确保店铺权重和买家账号的安全稳定

现在很多大卖都是自己管理几百个账号,交给服务商不是特别靠谱。你不知道服务商账号质量怎么样,账号一天下了多少你也不清楚,如果下了很多单万一封号被关联了怎么办,你也不知道服务商用什么卡给你下单,用一些低汇率和黑…

【Python Cookbook】S02E04 文本模式的匹配和查找 match()、search()、findall() 以及 捕获组和 + 的含义

目录 问题解决方案讨论 问题 本文讨论一些按照特定的文本模式进行的查找和匹配。 解决方案 如果想要匹配的只是简单文字,通常我们使用一些内置的基本字符串方法即可,如:str.find(),str.startwith(),str.endswith() …

qmt量化交易策略小白学习笔记第17期【qmt编程之获取对应周期的北向南向数据--方式1:内置python】

qmt编程之获取对应周期的北向南向数据 qmt更加详细的教程方法,会持续慢慢梳理。 也可找寻博主的历史文章,搜索关键词查看解决方案 ! 感谢关注,咨询免费开通量化回测与获取实盘权限,欢迎和博主联系! 获取…

Qwen2本地部署的实战教程

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

重塑状态管理的艺术:Vue3中Pinia的魔法之旅内包含简易购物车案例

前言 在Vue.js的世界里,每一次更新都是一次进化,Vue3携带着更强大的性能与灵活性翩然而至。而在这场技术盛宴中,Pinia以一种优雅而革命性的方式,重新定义了状态管理的体验。如果说Vuex是Vue2时代的王者,那么Pinia无疑…

024、工具_慢查

1)发送命令 2)命令排队 3)命令执行 4)返回结果 需要注意,慢查询只统计步骤3)的时间,所以没有慢查询并不代表客 户端没有超时问题。 参数配置 slowlog-log-slower-than 单位是微秒(1秒=1000毫秒=1000000微秒),默认值是10000 lowlog-log-slower-than=0会记录所有的命…

Polar Web【简单】upload1

Polar Web【简单】upload1 Contents Polar Web【简单】upload1思路EXP运行&总结 思路 本题思路同之前两篇文中的文件上传题目性质相同,这里再次记录,旨在改良之前的脚本编写方式 —— 脚本运行后变为可交互的命令行形式。 打开环境,见要求…