学习笔记|构建一元线性回归模型|方差分析|方差齐性|检验残差正态性|规范表达|《小白爱上SPSS》课程:SPSS第二十讲: 一元线性回归分析怎么做?

目录

  • 学习目的
  • 软件版本
  • 原始文档
  • 一元线性回归分析
    • 一、实战案例
    • 二、统计策略
    • 三、SPSS操作
    • 四、结果解读
      • 第一个表格为模型摘要
      • 第二表格为方差分析表
      • 第三个表格为模型系数
      • 第四张散点图(主要检验方差齐性)
    • 第五张直方图和P-P图(检验残差正态性)
    • 五、规范表达
      • 1、规范表格
      • 2、规范文字
    • 六、划重点

学习目的

SPSS第二十讲: 一元线性回归分析怎么做?

软件版本

IBM SPSS Statistics 26。

原始文档

《小白爱上SPSS》课程
#统计原理

一元线性回归分析

一元线性回归是指分析两个变量间(自变量x和因变量y)数量依存关系和影响的统计分析方法。
对于只涉及一个自变量的一元线性回归模型可表示为:
y= b0+b1 X+ϵ
Y:回归模型中的因变量,即样本的预测值。
X:回归模型中的自变量,即样本的特征数值。
ε:回归模型中的误差项,即不能被x与y之间线性关系解释的变异性。
b0:是常量。
b1: 回归系数。

一、实战案例

小白想了解下大侠的人均月收入能否预测他们年体育消费额,试构建一元线性回归模型,并检验其显著性。
读数据:

GET 
  FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第二十讲:一元线性回归分析.sav'.

在这里插入图片描述
该案例主要研究人均月收入与体育消费额的关系,从专业知识上可认为人均月收入是可以预测他们的年体育消费额。

二、统计策略

针对上述案例,扪心六问。
Q1:本案例研究目的是什么?
A:关联研究,在理论上认为变量之间存在因果关系,即月收入可预测体育消费额。
Q2:本案例属于什么研究设计?
A:调查性研究。
Q3:分析数据有多少组?
A:两组数据。
Q4:有几个变量?
A:有两个变量,两变量均为连续性变量
自变量为人均月收入
因变量为体育年消费额。
Q5:变量之间是否相关?
A:变量之间需要满足线性相关,呈现线性趋势。
Q6:残差是否具有独立性、方差齐性和正态分布?
A:需要检验残差是否满足独立性、方差齐性和正态性
概括而言,如果数据满足以下条件,则可适用一元线性回归分析。
在这里插入图片描述

三、SPSS操作

Step1:根据散点图初步判断数据的趋势:依次点击“图形——旧对话框——散点图/点图”。
Step2: 在弹出的对话框中选择“简单散点图”,点击“定义”。将“体育年消费额”放进Y轴中,并将“人均月收入”放进X轴中,并添加标题“人均月收入与体育年消费额的关系”。
命令行:

GRAPH 
  /SCATTERPLOT(BIVAR)=人均月收入 WITH 体育年消费额 	/*X轴 WITH Y轴*/
  /MISSING=LISTWISE 
  /TITLE='人均月收入与体育年消费额的关系'.

在这里插入图片描述
在这里插入图片描述
根据散点图可得出,人均月收入和他们的年体育消费额存在较为正相关关系,适合建立一元线性回归模型。
Step3:依次点击“分析——回归——线性”
Step4:在弹出“线性回归”对话框中,将“年体育消费额”放入因变量框中,将“人均月收入”变量放入自变量框中,方法默认选择“输入”。
Step5:然后单击线性回归右侧的“统计”,在弹出的选项对话框中勾选“估算值”、“模型拟合”、“描述”和“德宾-沃森,单击“继续”。
在这里插入图片描述
Step6:在弹出“线性回归:图”对话框中将 “*ZRESID”(标准化残差)放入Y轴中,将“*ZPRED”(标准化预测值)放入X轴中,勾选“直方图”和“正态概率图”,单击“继续”。点击“确定”。
在这里插入图片描述
命令行:

REGRESSION 
  /DESCRIPTIVES MEAN STDDEV CORR SIG N 
  /MISSING LISTWISE 
  /STATISTICS COEFF OUTS R ANOVA 
  /CRITERIA=PIN(.05) POUT(.10) 
  /NOORIGIN 
  /DEPENDENT 体育年消费额 
  /METHOD=ENTER 人均月收入 
  /SCATTERPLOT=(*ZRESID ,*ZPRED) 
  /RESIDUALS DURBIN HISTOGRAM(ZRESID) NORMPROB(ZRESID)	/*德宾残差(默认值),直方图、正态概率图*/.

四、结果解读

测量的结果有多个表格,在此讲解几个重点表格。

第一个表格为模型摘要

在这里插入图片描述
a. 预测变量:(常量), 人均月收入
b. 因变量:体育年消费额
①R是回归的多重相关系数。当简单线性回归中只有一个自变量时,R值与因变量和自变量的皮尔逊相关系数相同,代表两者之间的相关程度。如该研究中R=0.515,提示月收入与体育消费额存在中等相关。但实际上,简单线性回归并不关注R值。
②***R2(R Square)***代表回归模型中自变量对因变量变异的解释程度,是分析回归结果的开始。本研究中,R2=0.266,提示自变量(月收入)可以解释26.6%的因变量(体育消费额)变异。但是,R2是会夸大自变量对因变量变异的解释程度,如果模型中增加一个自变量,即使这个自变量在统计上并不显著,R2也会增大
③调整 R2,是指剔除了自变量个数的影响,这使得调整R2永远小于R2,且调整R2的值不会由于自变量个数的增加而越来越接近1。本研究中,调整 R2=0.209,小于R2=0.266,校正了R2对于总体自变量对因变量变异解释程度的夸大作用。所以,当多个自变量,一般报告调整R2
④德宾-沃森(D-W)检验,一般检验值分布在0-4之间,越接近2,观测值相互独立的可能性越大。本例子中D-W=2.327,可以认为符合线性回归独立性的条件。

第二表格为方差分析表

在这里插入图片描述
a. 因变量:体育年消费额
b.预测变量:(常量), 人均月收入
由表中可知,F=4.704,P=0.049<0.05,具有统计意义,不支持原假设,即回归方程的线性关系显著。表明人均月收入是影响体育年消费额的显著性因素。

第三个表格为模型系数

在这里插入图片描述
a. 因变量:体育年消费额
①是回归系数b值,本例中常数和人均月收入的系数分别为-7567.916和2.002。可得出一元线性回归模型:y ̌=-7567.916+2.002×人均月收入
②是回归系数的抽样误差,即标准误。
③Beta值(β值),是标准化b值,标准化回归系数。可以用来比较各个自变量x对y的影响程度的。本例的标准化回归方程:y=0.515×人均月收入。
④t值,是各个回归系数进行假设检验的检验统计量,线性回归检验统计量为t值。
⑤显著性:即P值。P<0.05说明自变量与因变量回归关系成立,有关系,有影响。本例中回归系数达到显著水平(P<0.05),t=2.169, p=0.049。
上面一行是常量的t和p值,一般不用关注。

第四张散点图(主要检验方差齐性)

在这里插入图片描述
如果方差齐,不同预测值对应的残差应大致相同。即图中各点均匀分布,无特殊的分布形状。如果残差点分布不均匀,形成漏斗或者扇形,那么就方差不齐(如下图)。
在这里插入图片描述
本研究结果显示,标准化残差与标准化预测值的散点图中各点均匀分布,虽然在头部相对集中,但不是十分严重,因此认为满足方差齐。
当然,如果不满足方差齐性假设,我们也可以通过一些统计手段进行矫正。比如,采用加权最小二乘法回归方程,改用更加稳健的分析方法以及转换数据等。

第五张直方图和P-P图(检验残差正态性)

(1)标准化残差的直方图
在这里插入图片描述
从图中可以看出,标准化残差近似正态分布。
(2)残差的P-P图
在这里插入图片描述
P-P图各点分布离对角线越近,提示数据越接近于正态分布;如果各点刚好落在对角线上,那么数据就是正态分布。简单线性回归仅要求回归残差接近于正态分布,因此根据上图,我们认为该数据满足近似正态性。
综上检验可知,本案例的数据满足独立性、方差齐性和正态性三个条件。

五、规范表达

规范报告有多种方式,本公众号只提供一种方式供参考。

1、规范表格

在这里插入图片描述

2、规范文字

采用线性回归分析结果显示,人均月收入可显著预测体育消费额,β=0.515,t=2.169, p=0.049。人均月收入可解释体育消费额的26.6%的方差。

六、划重点

1、回归分析本质上是探讨变量之间相关关系,只有在理论上满足自变量与因变量之间存在因果关系,才可开展回归分析。此外,即使回归分析显著,在解释因果关系也需谨慎。
2、一元线性回归分析需要满足变量之间存在线性关系,如果不是,则不能采用线性回归分析,这可通过散点图来判断线性关系。
3、回归分析还需满足独立性、方差齐性和正态性。独立性采用德宾-沃森(D-W)残差相关性检验;方差齐性采用残差散点图来检验;正态性采用残差正态分布图和P-P图来判断。
4、如果回归分析只是建立自变量与因变量之间关系,无须根据自变量预测因变量的容许区间和可信度等,则方差齐性和正态性可以适当放宽。
5、回归分析一般要报告回归系数(b或β值)以及显著性(P值)、R2(或调整R2)和回归模型的方差分析结果(F值和P值)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/125158.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

计算机毕设 基于大数据的股票量化分析与股价预测系统

文章目录 0 前言1 课题背景2 实现效果3 设计原理QTChartsarma模型预测K-means聚类算法算法实现关键问题说明 4 部分核心代码5 最后 0 前言 &#x1f525; 这两年开始毕业设计和毕业答辩的要求和难度不断提升&#xff0c;传统的毕设题目缺少创新和亮点&#xff0c;往往达不到毕…

单通道低压 H 桥电机驱动芯片AT9110H 兼容L9110 马达驱动芯片

H桥直流电机驱动电路是一种用于控制直流电机运转的电路&#xff0c;其主要特点是可以实现正反转控制&#xff0c;控制电机转速和方向&#xff0c;同时也具有过流保护功能。 H桥电路由四个功率晶体管和一些辅助电路组成&#xff0c;其中两个晶体管用于控制电机正转&#xff0c;…

【Mysql】去重(distinct)

目录 distinct 单字段 多字段 统计&#xff08; count ) distinct name为张三的有5条数据并且重复 单字段 语法&#xff1a; select distnct 字段名 from 表 这里的去重并不是删掉重复 多字段 select distinct 字段名1&#xff0c;字段名2 from 表 统计&#xff08; coun…

java通过FTP跨服务器动态监听读取指定目录下文件数据

背景&#xff1a; 1、文件数据在A服务器&#xff08;windows&#xff09;&#xff08;不定期在指定目录下生成&#xff09;&#xff0c;项目应用部署在B服务器&#xff08;Linux&#xff09;&#xff1b; 2、项目应用在B服务器&#xff0c;监听A服务器指定目录&#xff0c;有新…

【vue会员管理系统】篇五之系统首页布局和导航跳转

一、效果图 1.首页 2.会员管理&#xff0c;跳转&#xff0c;跳其他页面也是如此&#xff0c;该页的详细设计会在后面的章节完善 二、代码 新增文件 components下新增文件 view下新增文件&#xff1a; 1.componets下新建layout.vue 放入以下代码&#xff1a; <template…

学术论文的实证数据来源

一、引言 在当今的学术研究中&#xff0c;数据是至关重要的。无论是自然科学、社会科学还是人文科学&#xff0c;都需要借助数据来支撑和证明其研究假设和理论。然而&#xff0c;数据的来源却是多种多样的&#xff0c;而且不同的学科领域也有其特定的数据来源。本文旨在探讨论文…

30道高频Vue面试题快问快答

※其他的快问快答&#xff0c;看这里&#xff01; 10道高频Qiankun微前端面试题快问快答 10道高频webpack面试题快问快答 20道高频CSS面试题快问快答 20道高频JavaScript面试题快问快答 30道高频Vue面试题快问快答 面试中的快问快答 快问快答的情景在面试中非常常见。 在面试过…

linux 操作系统

先讲一下叭&#xff0c;自己学这的原因&#xff0c;是因为我在做项目的时候使用到啦Redis&#xff0c;其实在windows系统上我其实也装啦Redis上&#xff0c;但是我觉得后期在做其他的项目的时候可能也会用到这个然后就想着要不先学学redis&#xff0c;然后在后面也不至于什么都…

国标28181-2022检测内容GB28181-2022检测内容

目前国标28181-2022平台全项检测一共181项&#xff0c;总的检测相对2016版本要复杂很多&#xff0c;增加了一些比较重要的功能,下面列举下检测项(qq 123011785):

求臻医学MRD产品喜获北京市新技术新产品(服务)证书

近日&#xff0c;北京市科学技术委员会、中关村科技园区管理委员会、北京市发展和改革委员会等五大部门联合公示了2023年度第一批&#xff08;总第十八批&#xff09;北京市新技术新产品&#xff08;服务&#xff09;名单。凭借领先的技术能力、产品创新能力及质量可靠性等优势…

2023最新版本 FreeRTOS教程 -9-互斥量(基本使用和解决优先级反转)

互斥量是一种特殊的二进制信号量 使用场景1 &#xff08;互斥访问&#xff09; 外设的独立访问 如打印 协议操作 使用场景2 解决优先级反转 外设的独立访问 如打印 协议操作 使用场景2 解决优先级反转 我们以较为复杂的场景2来分析 -1- 创建三个任务 优先级从低到高&…

【教学类-40-03】A4骰子纸模制作3.0(6.5CM嵌套+记录表)

作品展示 背景需求 骰子2.0&#xff08;7字形&#xff09;存在幼儿不会“包边”的问题&#xff0c;求助老师帮忙示范&#xff0c;最后累的还是老师 1.0版本&#xff0c;边缘折线多&#xff0c;幼儿剪起来费力。 2.0版本&#xff0c;边缘折线多&#xff0c;幼儿剪起来费力。&a…

【ChatGLM2-6B】小白入门及Docker下部署

【ChatGLM2-6B】小白入门及Docker下部署 一、简介1、ChatGLM2是什么2、组成部分3、相关地址 二、基于Docker安装部署1、前提2、CentOS7安装NVIDIA显卡驱动1&#xff09;查看服务器版本及显卡信息2&#xff09;相关依赖安装3&#xff09;显卡驱动安装 2、 CentOS7安装NVIDIA-Doc…

“产业大数据”助推园区实现可持续发展!

​产业园区在现代经济体系中扮演着重要角色&#xff0c;不仅是地方经济的重要支柱&#xff0c;更是企业发展的舞台。产业园区要想实现可持续的长远发展&#xff0c;不仅需要不断的招引优质企业入驻&#xff0c;更要时刻关注园内的企业&#xff0c;培育有潜力的企业&#xff0c;…

华为OD机试 - 最优策略组合下的总的系统消耗资源数(Java 2023 B卷 100分)

目录 专栏导读一、题目描述二、输入描述三、输出描述四、解题思路五、Java算法源码六、效果展示1、输入2、输出3、说明4、思路 华为OD机试 2023B卷题库疯狂收录中&#xff0c;刷题点这里 专栏导读 本专栏收录于《华为OD机试&#xff08;JAVA&#xff09;真题&#xff08;A卷B卷…

FPGA时序分析与约束(10)——生成时钟

一、概述 最复杂的设计往往需要多个时钟来完成相应的功能。当设计中存在多个时钟的时候&#xff0c;它们需要相互协作或各司其职。异步时钟是不能共享确定相位关系的时钟信号&#xff0c;当多个时钟域交互时&#xff0c;设计中只有异步时钟很难满足建立和保持要求。我们将在后面…

如何改善食品饮料包装生产企业的OEE?

食品饮料这类商品在我们的日常生活中十分常见&#xff0c;它们存在于各类商店、超市或路边的小店里。而食品饮料的包装是吸引人们购买该产品的一个重要因素。为了在这个市场中脱颖而出并提高盈利能力&#xff0c;企业需要关注设备的综合效率&#xff0c;即OEE&#xff08;Overa…

数据结构-单链表-力扣题

移除链表元素 题目链接&#xff1a;力扣&#xff08;LeetCode&#xff09; 思路&#xff1a;和前面学的单链表的中间删除数据一样&#xff0c;使要被删除节点的前一个节点指向下要被删除节点的下一个节点&#xff0c;然后把要被删除的节点free掉。 具体实现过程&#xff1a;先…

docker搭建mysql环境

1. 基础环境 名称描述CentOS 7.6Linux操作系统版本docker 20.10.5docker版本mysql 8.0.29mysql镜像版本 2. 下载安装 使用docker命令下载mysql镜像 [rootzhouwei ~]# docker pull mysql:8.0.29查看docker仓库是否已经下载了mysql镜像 [rootzhouwei ~]# docker images将mys…

【PHP】医院HIS手术麻醉临床信息管理系统源码 实现术前、术中、术后全流程管理

手术麻醉系统是一套以数字形式与医院信息系统&#xff08;如HIS、EMR、LIS、PACS等&#xff09;和医疗设备等软、硬件集成并获取围手术期相关信息的计算机系统&#xff0c;其核心是对围手术期患者信息自动采集、储存、分析并呈现。该系统通过整合围手术期中病人信息、人员信息、…