从0开始学统计-你能区分率和构成比吗?

1.数据的变异度如何描述?

数据的变异度描述了数据集中数值之间的差异或波动程度。常用的描述数据变异度的统计量包括:

(1)范围(Range):范围是数据集中最大值与最小值之间的差异,表示数据的总体变异程度。范围越大,数据的变异程度越大;范围越小,数据的变异程度越小。

(2)标准差(Standard Deviation):标准差是数据集中各数据点与均值之间的平均偏差的平方根。标准差越大,数据的变异程度越大;标准差越小,数据的变异程度越小。

(3)方差(Variance):方差是标准差的平方,它衡量了数据集中各数据点与均值之间的平均偏差的平方程度。方差与标准差具有相同的变异度描述功能。

(4)四分位间距(Interquartile Range,IQR):四分位间距是第三与第一四分位数之间的差异,表示数据集中的中间50%数据的变异程度。四分位间距越大,数据的变异程度越大;四分位间距越小,数据的变异程度越小。

在这里插入图片描述
(5)平均绝对偏差(Mean Absolute Deviation,MAD):平均绝对偏差是数据集中各数据点与均值的绝对值之和的平均值,表示数据点与均值的平均偏差程度。

这些统计量可以帮助我们理解数据集中数值之间的差异或波动程度,从而揭示数据的变异性。

关于标准差和方差具体应用的例子:

一个体育老师,要从王帅和张俊两人中选择一名替补队员,下面是他们的五场比赛成绩,
在这里插入图片描述可以发现两人的平均分是一样的,都是8分。通过进一步计算可以得到两人的方差:

在这里插入图片描述由于王帅的方差更小,发挥更稳定,所以体育老师选择了王帅。

标准差的单位与原单位一致,解释性更好。比如这里王帅的标准差是0.64,也就是说他的得分大概率会在8±0.64的范围内。

在这里插入图片描述

2.定性数据的分类:

定性数据通常分为两种类型:分类数据和等级数据。

(1)分类数据(Nominal Data):分类数据表示的是某种特征或属性,通常用于对事物进行分类或标记,但没有固定的顺序或等级关系。在分类数据中,每个类别都是相互独立的,没有数量或大小的差异。例如,性别(男、女)、颜色(红、蓝、绿)等。

(2)等级数据(Ordinal Data):等级数据表示的是某种特征或属性,其中各个类别之间存在一定的顺序或等级关系,但这些关系并不反映数据之间的确切差异。在等级数据中,类别之间的顺序可以比较,但它们之间的差异并不是固定的或可测量的。例如,教育程度(小学、初中、高中)、满意度评分(非常不满意、不满意、一般、满意、非常满意)等。

这两种类型的定性数据都用于描述某种特征或属性,但在数据的含义和处理方式上有所不同。分类数据用于区分不同的类别或标签,而等级数据则反映了这些类别或标签之间的顺序或程度关系。

3.常用的统计学指标如何分类?

常用的统计学指标可以分为绝对数和相对数两种类型:

(1)绝对数:绝对数是对数据的原始观察值进行直接描述和计算的统计量,通常是数值型的。常见的绝对数包括:

  • 平均值(均值):表示数据集中数值的平均水平,是数据的集中趋势的一个重要指标。

  • 中位数:表示数据集中数值的中间值,将数据集分为两个等分,50% 的数据低于中位数,50% 的数据高于中位数。

  • 极值(最大值和最小值):表示数据集中的最大和最小观察值,反映了数据的范围。

  • 四分位数:将数据集分为四个等份的数值,提供了数据的分布位置信息。

  • 频数:表示数据集中各类别的出现次数。

(2)相对数:相对数是基于绝对数计算得出的相对指标,常用于对比不同群体或不同时间点的数据,并进行比较和分析。常见的相对数包括:

  • 比例:表示某一类别或事件的频率相对于总体或另一类别的比例,通常以百分比表示。

  • 百分比:表示某一类别或事件在总体或特定群体中所占的比例,是比例的一种特殊形式。

  • 比率:表示两个数量之间的比值,反映了两者之间的关系和比较。

  • 增长率:表示数量随时间变化的增长或减少程度,通常以百分比表示。

绝对数和相对数在统计学中都具有重要的应用价值,可以帮助人们更好地理解和分析数据的特征、趋势和变化情况。

4.在统计学中,什么是率和构成比?

率和构成比都是相对数,用于描述不同类别或事件在总体或特定群体中的比例关系,但它们在表达方式和应用场景上有所不同。

(1)率(Rate):率是指某一类别或事件在总体或特定群体中的频率或比例,通常表示为两个数量的比值。率可以用来表示某一现象的发生频率或比例,常用于描述某种事件在特定时间段内或特定人群中的发生程度。常见的率包括:

  • 出生率:每年每千人口中的新生婴儿数量。

  • 死亡率:每年每千人口中的死亡人数。

  • 失业率:劳动力市场上失业人口的比例。

  • 犯罪率:每年每万人口中的犯罪案件数量。

在这里插入图片描述

(2)构成比(Composition Ratio):构成比是指某一类别或事件在总体或特定群体中的比例关系,通常表示为各类别或事件的频数与总数之比,以百分比形式表示。构成比常用于描述总体或群体中各个类别或事件的构成情况,以便了解各类别在总体中的相对重要程度。常见的构成比包括:

  • 性别构成比:男性人口和女性人口的比例。

  • 年龄构成比:各个年龄段人口在总人口中的比例。

  • 行业构成比:不同行业的就业人口在总就业人口中的比例。

  • 收入构成比:不同收入水平的家庭在总家庭中的比例。

在这里插入图片描述
总体来说,率和构成比都是用于描述不同类别或事件在总体或特定群体中的比例关系,但率更侧重于描述某种现象的发生频率或比例,而构成比更侧重于描述各类别在总体中的相对重要程度。

我们对定性数据进行分析的时候,一个最容易犯的错误就是以比代率。

如果给你下面一张表,里面是某医院1990年和1998年五种疾病死亡人数及构成比,你能判断出哪种疾病的死亡率更高吗?

在这里插入图片描述
是不是很容易得出错误的结论,认为1990年是恶性肿瘤死亡率最高,1998年是循环系统疾病死亡率最高呢?事实上仅仅通过上述信息我们得不出各种疾病的死亡率,想要计算死亡率,必须知道各种疾病的患病人数,然后用死亡人数除以该疾病的总患病人数。恶性肿瘤的死亡人数多可能是因为患病基数也很大。而上表并没有提供这些信息。

美国一个电视评论员试图用美军在伊拉克的每天死亡人数低于在加州因为凶杀案的每天死亡的人数来说明战争并不凶残,并没有多大的伤亡。你觉得他说的对吗?

在这里插入图片描述
这位主持人显然是在瞒天过海,试图忽悠大家。因为他并没有说明两地的人口基数,他给出的是每天的死亡数,而不是当地人口的死亡率。

在这里插入图片描述
事实上,美军在伊拉克有17万,每十万人被杀163人,而加州的人口基数是三千八百万,每十万人被杀2.7人。战场的死亡率显然更高。通过本篇的学习,相信大家不会被无良媒体忽悠了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/644503.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

NDIS小端口驱动(九)

PCIe设备难免会遇到一些重置设备的请求,例如重置总线的时候,但是由于NIC网卡的多样性,重置设备确实也有许多要注意的地方,另外还有一些包含WDM的NDIS驱动 微型端口驱动程序硬件重置 微型端口驱动程序必须向 NdisMRegisterMinipo…

重新思考:Netflix 的边缘负载均衡

声明 本文是对Netflix 博客的翻译 前言 ​ 在先前关于Zuul 2开源的文章中,我们简要概述了近期在负载均衡方面的一些工作。在这篇文章中,我们将更详细地介绍这项工作的原因、方法和结果。 ​ 因此,我们开始从Zuul和其他团队那里学习&#…

L01_JVM 高频知识图谱

这些知识点你都掌握了吗?大家可以对着问题看下自己掌握程度如何?对于没掌握的知识点,大家自行网上搜索,都会有对应答案,本文不做知识点详细说明,只做简要文字或图示引导。 类的生命周期 类加载器 JVM 的内存…

CAD二次开发(2)-将直线对象添加到CAD图形文件

1. 准备工作 创建一个类库项目,如下: 2. 分析Line对象 Line类的初始化方法和参数 using Autodesk.AutoCAD.DatabaseServices; Line line new Line();Line 继承Curve 继承Entity 继承DBObject 继承Drawable 继承RXObject 初始化方法有两个&#xf…

2024年汉字小达人活动4个多月开赛:18道历年选择题和答案、解析

根据近年的安排,2024年第11届汉字小达人比赛还有4个多月就启动,那么孩子们如何利用这段时间有条不紊地备考呢?我的建议是两手准备:①把小学1-5年级的语文课本上的知识点熟悉,重点是字、词、成语、古诗。②把历年真题刷…

求两个整数最大公约数的方法

可以使用递归来实现,编写gcd函数返回最终的结果(最大公约数)。传入两个参数,如果存在一个数字不大于0就返回0,利用上面的公式就可以得出最后的结果。

电脑远程控制另一台电脑怎么弄?

可以远程控制另一台电脑吗? “你好,我对远程访问技术不太了解。现在,我希望我的朋友可以远程控制我的Windows 10电脑,以便她能帮我解决一些问题。请问,有没有免费的方法可以实现这种远程控制?我该如何操作…

机器学习大模型驱动:未来的趋势与应用

文章目录 📑前言一、什么是机器学习大模型?1.1 大模型的特点1.2 大模型的技术基础 二、大模型的技术实现2.1 Transformer 架构2.2 预训练和微调2.3 模型并行和数据并行 三、大模型的应用场景3.1 自然语言处理(NLP)3.2 计算机视觉&…

SpringMVC源码解读[1] -Spring MVC 环境搭建

源码地址: https://github.com/chen-jiacheng/springmvc-quickstart 一、使用 IDEA 创建 Spring MVC 项目 直接创建项目即可 默认项目结构: springmvc-quickstart ├── pom.xml └── src├── main│ ├── java│ │ └── com│ │ └── chenjiache…

2024Spring> HNU-计算机系统-实验4-Buflab-导引+验收

前言 称不上导引了,因为验收已经结束了。主要是最近比较忙,在准备期末考试。周五晚上才开始看实验,自己跟着做了一遍实验,感觉难度还是比bomblab要低的,但是如果用心做的话对于栈帧的理解确实能上几个档次。 实验参考…

(南京观海微电子)——TFT LCM的作用

VCOM介绍 VCOM是液晶分子偏转的参考电压 ,要求要稳定,对液晶显示有直接影响,具体的屏不同的话 也是不同的。 电压的具体值是根据输入的数据以及Vcom电压大小来确定的,用来显示各种不同灰阶,也就是实现彩色显示GAMMA简…

《计算机网络微课堂》3-11 虚拟局域网 VLAN

本节课我们介绍虚拟局域网 VLAN 的基本概念。 ‍ 3.11.1 虚拟局域网 VLAN 概述 在之前课程中我们已经介绍过了以太网交换机自学习和转发帧的流程,‍‍以及为避免网络环路而产生的生成树协议。 以太网交换机工作在数据链路层,‍‍也包括物理层&#xf…

搜索自动补全-elasticsearch实现

1. elasticsearch准备 1.1 拼音分词器 github地址:https://github.com/infinilabs/analysis-pinyin/releases?page6 必须与elasticsearch的版本相同 第四步,重启es docker restart es1.2 定义索引库 PUT /app_info_article {"settings": …

vim操作手册

vim分为插入模式、命令模式、底行模式。 插入模式:编辑模式 命令模式:允许使用者通过命令,来进行文本的编辑控制 底行模式:用来进行让vim进行包括但不限于shell进行交互 w:保存 wq&am…

AI Agent: Agent框架+7个实例

何谓Agent Agent 作为一种新兴的人工智能技术,正在受到越来越多的关注。要说清楚什么是 Agent,先得看看人工智能的本质是什么。 人工智能这个名称来自它试图通过计算机程序或机器来模拟、扩展和增强人类智能的 一些方面。在这个定义中,“人…

Java进阶学习笔记20——枚举

认识枚举: 枚举是一种特殊的类。 枚举类的格式: 说明: 第一行是罗列枚举的对象名称。只能写合法的标识符(名称),多个名称用逗号隔开。 这些名称本质上都是常量,每个变量都会记住枚举类的一个…

z3-加法器实验

补码器加减法,运算方法简介 我们要知道什么是补码的加法,我们为什么要用补码的加法? 补码的加法其实就是将两个补码形式的二进制数字直接相加,处理的时候忽略超出固定位数的进位。补码的加法运算和无符号二进制数的加法操作一样&…

哈希双指针

文章目录 一、哈希1.1两数之和1.2字母异位词分组1.3最长子序列 二、双指针2.1[移动零](https://leetcode.cn/problems/move-zeroes/description/?envTypestudy-plan-v2&envIdtop-100-liked)2.2[盛最多水的容器](https://leetcode.cn/problems/container-with-most-water/d…

新人攻略:避开这3大坑,让老员工主动带你飞!

进入职场的新人们,常常会感到困惑和挑战。他们可能会发现自己在与老员工的交流中遇到难题,甚至发现老员工并不愿意花费时间和精力去指导他们。这背后的原因是什么呢?又该如何改善这一现象呢?本文将从新员工的角度出发,…