【小白学机器学习19】什么是统计里的定量分析

1 定性分析和定量分析

1.1 两种分析方式

人类有两种认识世界上的事物的方式

  • 定性分析:通过发掘问题、理解事件现象,去研究事物的属性,事物之间的关系等。
  • 定量分析:用数学工具,用数字为形容词/名字去描述和记录某些个体的属性的分析方式

下面是百科里来的

定性研究(Qualitative research)是与定量研究(Study on measurement,Quantitative research)相对的概念,也称质化研究,是社会科学领域的一种基本研究范式,也是科学研究的重要步骤和方法之一。

定性研究是指通过发掘问题、理解事件现象、分析人类的行为与观点以及回答提问来获取敏锐的洞察力。几乎每天在每个工作场所和学习环境下都会进行定性研究。

定量研究(Study on measurement,Quantitative research)是与定性研究(Qualitative research)相对的概念,要考察和研究事物的量,就得用数学的工具对事物进行数量的分析,这就叫定量的研究,也称量化研究,是社会科学领域的一种基本研究范式,也是科学研究的重要步骤和方法之一。

1.2 定性分析

很多相似名字,差不多意思

  • 定性研究 qualitative research 
  • 质性研究,质性分析,质化研究等
  • 缺点:
  1. 无法证伪,可能导致大量的错的,假的混杂在真的一起。

1.3 定量分析

1.3.1 定义

  • 量化分析:就是把要分析的一个真实事物/理念中概念:变项,进行数字化,从而成为一个变量 variable,然后分析这个变量。
  • 建模:简单的就是建一个函数表达式 /一个方程等,复杂的,很多函数和方程组联立等等超过我的描述能力

1.3.2 名字

有很多相近的名字,大概都是差不多的意思

  • 定量分析,量化分析:quantitative analysis
  • 统计分析,统计方法:statistical analysis
  • 优点
  • 缺点
  1. 有时候会因为数据错误,而结论也肯定错误,“错误输入导致错误的输出”
  2. 有时候会得出一些肤浅的结论,比如关联度过高,可能本身就是存在共线性的关系等。

1.4 特点和差异

  • 定性分析,可以教基本路数,思维方式,但具体细节,其他靠悟,更接近艺术
  • 定量分析,可以教基本路数,还可以具体步骤,套路,招式,可证伪得思维方式

1.5 两者的关系

  • 两种分析方式没啥好鄙视得,
  • 做定量研究之前,一般需要先有理念,设想等,也就是先有定性的分析。
  • 而不做定量分析,定性研究很难证伪,无法落地

  • 所有定量分析之前都需要定性分析吗?
  • 反例:机器学习里的无监督学习是不是已经是不需要先做定性分析的例子? 根据算法去自动分类,形成最终的结果,是研究人员事前并没有设想到的一些结论等?


3 测量的4个尺度


1 定类
2 定距
3 定比
4 定量

4 总体和样本

4.1 总体,母体,population


是一种理想化的东西,可以说永远无法真正的/完全的认识,可以部分认知

样本和整体的关系,不是局部和整体的关系
而是微缩结构和整体结构的关系

4.2 样本 Sample


必须尽量和高度形似母体,结构相同
尽量是1比1的缩略最好
但是因为母体不可被真正完全认识,只能部分认识,所这个不可绝对验证,只能逼近。

5 如何保证样本和总体同结构呢


如何保证样本和总体同结构呢:无法最终保证
也就是结果的正确/正义无法保证
只能从过程的正确/正义上去保证


随机抽样
有规律的往往就是非随机的
除非是随机抽取的,比如编号后随机
至少程序上保证每个个体都有被平等抽到的可能。

也说明了,公平也一样,只有过程的公平,没有结果的公平。
但是这个又在变化,继续下一次的过程。

正态分布/自然分布也说了这个问题,一定是中间大,两头小。
而且钟形曲线是无限的,天网恢恢,苏而不漏。
 

随意抽样,

Vary  variable变项----变量

   现有的理论模型
   例外是机器学习的无监督学习
量化之前,我们已经假设了
   总体是符合什么样的分布了,比如是正态分布
   正态分布的规律我们是知道的,但是不清楚每个具体的总体的正态分布的,均值,方差等具体参数!


6 量化

2 什么叫显著


显著,只是说两者存在,非随机的关系。 
不等于重要,或者其他

个体两方面
1 多个个体
2 多个属性/特征,每个属性都有1 名字 2尺度

个体
二维表
横向,一个个体的多个属性(只挑一些)
纵向,一个属性的组成的线/


量化与数据
数据种类一,界面数据
数据种类2,时序类数据

7 量化的对象


1 第1层级,个体  case  individual 
2 第2层级,样本  sample
3 第3层级,总体,母体的(认为的那个模型里)参数的具体参数 population

样本统计值
1 均值
2 回归系数
3 偏回归系数,净回归系数.  前期是其他参数不变时,这个参数作为自变量和因变量之间的关系。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/896708.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

家庭事务管理系统|基于java和vue的家庭事务管理系统设计与实现(源码+数据库+文档)

家庭事务管理系统 目录 基于java和vue的家庭事务管理系统 一、前言 二、系统功能设计 三、系统实现 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍:✌️大厂码农|毕设布道师,阿里云…

React综合指南(三)

#1024程序员节|征文# 41、hooks的使用有什么注意事项 在使用Hooks的过程中,需要注意的两点是: 不要在循环,条件或嵌套函数中调用Hook,必须始终在React函数的顶层使用Hook。这是因为React需要利用调用顺序来正确更新…

配置nginx服务通过ip访问多网站

文章目录 第一种方法第二种方法 先关闭防火墙 # systemctl stop firewalld # setenforce 0第一种方法 #mntui 第二种方法 # vim /etc/nginx/conf.d/test_ip.conf # cat /etc/nginx/conf.d/test_ip.conf server {listen 192.168.234.100:80;#server_nameroot /test/100;loca…

基于neo4j的体育运动员问答问答系统

你是不是也为毕业项目伤透了脑筋?我们为你准备了一个创新且实用的技术项目——基于neo4j的体育运动员问答系统。无论你是对图数据库技术感兴趣,还是想在自然语言处理方面有所突破,这套系统都能让你在答辩时脱颖而出! &#x1f3a…

filebeat接入nginx和mysql获取日志

下载nginx (1) 直接下载 yum install nginx -y(2)查看状态启动 systemctl start nginx systemctl status nginx(3)配置文件检查 nginx -t(4)端口检查 netstat -tulpn | grep :80&am…

Mybatis 中<where>的用法注意事项(附Demo)

目录 前言1. 问题所示2. 基本知识 #1024程序员节 | 征文# 前言 对于Java的基本知识推荐阅读: java框架 零基础从入门到精通的学习路线 附开源项目面经等(超全)【Java项目】实战CRUD的功能整理(持续更新) 先从实战问…

uniapp使用html2canvas时,页面内的image元素模糊

不废话很简单只需要将image改成img就行 改之前 改之后 原因可能是因为uniapp里面的image标签做了某种处理

基于Java+Springboot+Vue开发的酒店客房预订管理系统

项目简介 该项目是基于JavaSpringbootVue开发的酒店客房预订管理系统(前后端分离),这是一项为大学生课程设计作业而开发的项目。该系统旨在帮助大学生学习并掌握Java编程技能,同时锻炼他们的项目设计与开发能力。通过学习基于Java…

监控易监测对象及指标之:Kafka中间件JMX监控指标解读

监控易作为一款功能强大的监控软件,旨在为企业提供全方位的IT系统监控服务。其中,针对Kafka中间件的JMX监控是监控易的重要功能之一。本文将详细解读监控易中Kafka的JMX监控指标,帮助企业更好地理解并运用这些数据进行系统性能调优和故障排查…

开启RefCell debug_refcell feature查看借用冲突位置

文章目录 背景分析解决方法 本文解决两个问题: 开启rust源码库中的feature开启debug_refcell feature的方法查看 borrow 借用冲突的位置 背景 使用 RefCell 来实现内部可变性是在 Rust 开发中常用的方式,但是当逻辑复杂起来,常常会有可变借…

word建立目录以及修改页码

1、为word建立新的目录 (1)选中word中的标题设置为第几级标题,将所有的标题均设置完成。最后可以鼠标右击标题,对不同的标题字体大小等进行设置。右击-->修改-->格式-->段落 (2)在word中插入新的…

算法01----移动零(C++)

题目展示 算法原理 我们这里要用到的算法是双指针移动,和我们之前学的快排的核心思想是一样的。我们看看怎么做吧。我会以图片的形式将我的思路告知大家。 这就是整个题目的整体思想算法,大家理解一下,其实这道题目还是很简单的。 代码编写…

【C++ 11】移动构造函数

文章目录 【 1. 问题背景:深拷贝引起的内存开销问题 】【 2. 移动构造函数 】【 3. 左值的移动构造函数: move 实现 】 【 1. 问题背景:深拷贝引起的内存开销问题 】 拷贝构造函数 在 C 11 标准之前(C 98/03 标准中),…

Vue脚手架学习 vue脚手架配置代理、插槽、Vuex使用、路由、ElementUi插件库的使用

目录 1.vue脚手架配置代理 1.1 方法一 1.2 方法二 2.插槽 2.1 默认插槽 2.2 具名插槽 2.3 作用域插槽 3.Vuex 3.1 概念 3.2 何时使用? 3.3 搭建vuex环境 3.4 基本使用 3.5 getters的使用 3.6 四个map方法的使用 3.6.1 mapState方法 3.6.2 mapGetter…

LabVIEW中句柄与引用

在LabVIEW中,句柄(Handle) 是一种用于引用特定资源或对象的标识符。它类似于指针,允许程序在内存中管理和操作复杂的资源,而不需要直接访问资源本身。句柄用于管理动态分配的资源,如队列、文件、网络连接、…

[python flask 数据库ORM操作]

一、链接数据库 我们选择的框架是flask-sqlAlchemy 这个框架是对pymysql的封装。 连接数据库 #导入包 from flask_sqlalchemy import SQLAlchemy #创建flask app对象 app Flask(__name__) #设置配置信息 HOSTNAME "localhost" PORT 3306; USERNAME "root&…

在C++中比大小

关于min()函数和max()函数: min()、max()这两个函数如果需要使用&#xff0c;要在程序头文件中加上<algorithm>库就可以使用这个函数了 #include <algorithm>min()函数是比较数中哪一个数最小&#xff0c;就返回最小的数&#xff0c;而max()函数则是比较数中哪一个…

计算机毕业设计Flask+Vue.js空气质量预测 空气质量可视化 空气质量分析 空气质量爬虫 大数据毕业设计 Hadoop Spark

《FlaskVue.js空气质量预测与可视化系统》开题报告与任务书 一、研究背景与意义 随着工业化进程的加速和城市化水平的不断提高&#xff0c;空气质量问题日益成为全球关注的焦点。空气污染不仅严重影响着人们的身体健康&#xff0c;如增加呼吸系统疾病、心血管疾病等风险&…

商场楼宇室内导航系统

商场楼宇室内导航系统 本文所涉及所有资源均在传知代码平台可获取 文章目录 商场楼宇室内导航系统效果图导航效果图查看信息数据加载加载模型模型选型处理楼层模型绑定店铺创建店铺名称动态显示隐藏2d元素空气墙查看信息楼梯导航效果图 导航效果图 查看信息 数据加载 因为是一…

Java最全面试题->Java主流框架->Srping面试题

Spring面试题 下边是我自己整理的面试题,基本已经很全面了,想要的可以私信我,我会不定期去更新思维导图 哪里不会点哪里 谈谈你对 Spring 的理解? Spring 是一个开源框架,为简化企业级应用开发而生。Spring 可以是使简单的 JavaBean 实现以前只有 EJB 才能实现的功能。…