excel统计分析——一元直线回归

参考资料:生物统计学

        两个具有因果关系的协变量如果呈直线关系,可以用直线回归模型来分析两个变量的关系。直线回归(linear regression)是回归分析中最简单的类型,建立直线回归方程并经检验证明两个变量存在直线回归关系时,可以用自变量的变化预测因变量的变化。

1、回归方程的建立

(1)数学模型

        设自变量为x,因变量为y,两个变量的n对观测值为(x1,y1),(x2,y2),...,(xn,yn)。可以用直线函数关系来描述变量x、y之间的关系:

Y=\alpha +\beta x+ \varepsilon

其中,α、β为待定系数,随机误差为\varepsilon \sim N(0,\sigma^2)。设(x1,Y1),(x2,Y2),...,(xn,Yn)是取自总体(x,Y)的一组样本,而(x1,y1),(x2,y2),...,(xn,yn)是该样本的一组观测值,x1,x2,...,xn是随机取定的不完全相同的数值,而y1,y2,...,yn为随机变量Y在试验后取得的具体数值,则有:

y_i=\alpha+\beta x_i+\varepsilon_i

其中i=1,2,...,n,ε1,ε2,...,εn相互独立。该模型可理解为对于自变量x的每一个特定的取值xi,都有一个服从正态分布的Yi取值范围与之对应,这个正态分布的期望是α+βx,方差时σ^2。Y\sim N(\alpha+\beta x ,\sigma ^2)E(Y)=\alpha+\beta x,回归分析就是根据样本观察值求解α和β的估计值a和b。对于给定的x,有:

\hat{y}=a+bx

        作为E(Y)=\alpha+\beta x的估计,上式称为y关于x的直线回归方程,其图像称为回归直线,a称为回归截距(regression intercept),b称为回归系数(regression coefficient)。

(2)参数α、β的估计

        在样本观测值(x1,y1),(x2,y2),...,(xn,yn)中,对每个xi都可由直线回归方程式确定一个回归估计值。即

\hat{y_i}=a+bx_i

         这个归回估计值与机制观测值之差为:

y_i-\hat{y_i}=y_i-(a+bx_i)

表示yi与回归直线\hat{y}=a+bx的偏离度。

        为使建立的回归直线\hat{y}=a+bx尽可能地靠近各观测值的点(xi,yi)(i=1,2,...,n),需使离回归平方和(或称剩余平方和)Q=\sum_{i=1}^n(y_i-\hat{y_i})^2=\sum_{i=1}^n(\hat{y}-a-bx_i)^2最小。

        根据最小二乘法,要使Q最小,需求Q关于a、b的偏导数,并最终得到:

a=\bar{y}-b\bar{x}

b=\frac{\sum((x-\bar{x}))(y-\bar{y})}{\sum(x-\bar{x})^2}=\frac{SP_{xy}}{SS_x}

        a和b为α和β的最小二乘估计。上式中,分子\sum(x-\bar{x})(y-\bar{y})为x的离均差与y的离均差的乘积和,简称乘积和(sum of products),记作SP_xy;分母\sum(x-\bar{x})^2为x的离均差平方和,简称平方和(sum of squares),记作SSx。

        a为回归截距,是回归直线与y轴交点的纵坐标,是总体回归截距α的无偏估计值;b称为回归系数,是回归直线的斜率,是总体回归系数β的无偏估计值。回归直线具有以下性质:

        ①离回归的和等于零,即\sum_{i=1}^n(y_i-\hat{y_i})=0

        ②离回归平方和最小,即\sum_{i=1}^n(y_i-\hat{y_i})^2最小;

        ③回归直线通过散点图的几何重心(\bar{x},\bar{y})

示例如下:

        进行回归或相关分析前,为观察变量间关系的大致情况,一般先作散点图。

        a,b的计算步骤如下:

2、回归的假设检验

        即使x和y变量间不存在直线关系,有n对观测值(xi,yi)也可以根据上面介绍的方法求一个回归方程,所以回归方程建立后,需要进行假设检验来判断变量y与x之间是否确实存在直线关系。检验回归方程是否成立即检验假设H_0: \beta=0是否成立,可采用F检验和t检验两种方法。

(1)回归方程的F检验

①平方和与自由度的分解

        回归数据的总变异(y_i-\bar{y})由随机误差(y_i-\hat{y_i})和回归效应(\hat{y_i}-\bar{y})两部分组成。如下图所示:

        总平方和SSy可以分解为回归平方和SS_R及离回归平方和(误差平法和)SSe。各项的计算公式为:

SS_y=\sum(y_i-\bar{y})^2

SS_R=\sum(\hat{y_i}-\bar{y})^2

SS_e=\sum(y_i-\hat{y_i})^2

其中:

SS_y=SS_R+SS_e

SS_R=\sum(\hat{y_i}-\bar{y})^2=\sum[(a+bx_i)-(a+b\bar{x})]^2

=b^2\sum(x_i-\bar{x})^2=b^2SS_x=b\frac{SP_{xy}}{SS_x}SS_x

=bSP_{xy}=\frac{SP_{xy}^2}{SS_x}

        b^2SS_x直接反映出y受x的线性影响二产生的变异,而bSP_{xy}的算法则可以推广到多元线性回归分析。

        SSy是因变量y的离均差平方和,所以自由度df_y=n-1

        SS_R反映有x引起的y的变异,所以自由度df_R=1

        SS_e反映除x对y的线性影响外的其他因素引起的y的变异,自由度df_e=n-2

        平方和与相应自由度的比为相应的均方,即:

MS_R=\frac{SS_R}{df_R}=SS_R

MS_e=\frac{SS_e}{df_e}=\frac{SS_e}{n-2}

②F检验

        零假设H_0:\beta=0

        备择假设H_A:\beta\neq 0

        统计量F:F=\frac{MS_R}{MS_e}

        和方差分析的F检验一样,回归方程的显著性F检验也总是使用回归均方做分子,离回归均方做分母。

本例的方差分析表如下:

结论:p<0.01,说明本例存在线性回归关系,即求得的回归方程y=0.0137+0.8507x具有统计学上极显著的意义,是有效的。

(2)回归系数的t检验

        对直线关系的检验也可以通过对回归系数b进行t检验完成。样本回归系数的变异度不仅取决于误差方差的大小,也取决于自变量x的变异程度。自变量x的变异越大(取值越分散),回归系数的变异就越小,有回归方程所估计出的值就越精确。

        t检验的回归系数标准误为:

s_b=\sqrt{s_b^2}=\sqrt{\frac{MS_e}{SS_x}}

        对回归系数t检验的假设为:

        原假设:H_0:\beta=0

        备择假设:H_A:\beta\neq 0

        检验统计量t:t=\frac{b-\beta}{s_b}=\frac{b}{s_b}

        统计量t服从df=n-2的t分布。

本例t检验如下:

对于一元直线归回而言,t检验与F检验是等价的,事实上F=t^2

        有时也对回归截距α的显著性进行检验。回归截距的大小对回归的显著性没有影响,检验的目的是看回归直线是否通过原点,仍使用t检验。检验时,零假设为α=0(回归直线通过原点),回归截距标准误:

s_a=\sqrt{MS_e(\frac{1}{n}+\frac{\bar{x}^2}{SS_x})}

统计量t:

t=\frac{a-\alpha}{s_a}=\frac{a}{s_a}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/452804.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Altium Designer怎么设置默认原理图纸张大小

Altium Designer怎么设置默认原理图纸张大小 绘制原理图时我们需要设置好原理图图纸大小&#xff0c;建议大家可以将默认原理图图纸设置为A3&#xff0c;A3图纸大小可以容纳下大部分原理图&#xff0c;这样就不用每次画原理图前去修改图纸大小&#xff0c;可以提高设计效率。 …

Redis底层数据结构之Hash

文章目录 1. Redis底层hash编码格式2. Redis 6源码分析3. Redis 7源码分析 1. Redis底层hash编码格式 在redis6中hash的编码格式分别是ziplist&#xff08;压缩列表&#xff09;和hashtable&#xff0c;但在redis7中hash的编码格式变为了listpack&#xff08;紧凑列表&#xf…

如何不依赖Unity直接解压unitypackage的内容

使用场景 我们都知道unity的资源导出是导出成.unitypackage文件,如果要里面的内容,得打开Unity,将unitypackage导入进去才能看到里面的内容。 但是很多时候我们下了几十个unitypackage资源包,又不清楚好不好用,而且导入之后编译特别慢,unity又不提供批量解压的功能,所…

好消息!电商平台订单API同步订单详情信息免申请审核调用指南!

淘宝开放平台订单类API 测试key获取 拼多多开放平台订单API列表 custom-自定义API操作 taobao.custom/pinduoduo.custom 公共参数 名称类型必须描述keyString是调用key&#xff08;必须以GET方式拼接在URL中&#xff09;secretString是调用密钥api_nameString是API接口名称&…

day08-Mybatis入门

MyBatis 是一款优秀的 持久层 框架&#xff0c;用于简化 JDBC 的开发。 官网&#xff1a;https://mybatis.org/mybatis-3/zh/index.html 一、快速入门 1.1 Mybatis 操作数据库的步骤 准备工作(创建 springboot 工程、数据库表 user、实体类 User)引入 Mybatis 的相关依赖&…

基于Qt 和python 的自动升级功能

需求&#xff1a; 公司内部的一个客户端工具&#xff0c;想加上一个自动升级功能。 服务端&#xff1a; 1&#xff0c;服务端使用python3.7 &#xff0c;搭配 fastapi 和uvicorn 写一个简单的服务&#xff0c;开出一个get接口&#xff0c;用于客户端读取安装包的版本&#…

北京市办理大兴道路运输许可证所需条件及注意事项

尊敬的客户&#xff1a; 感谢您选择北京经典世纪集团有限公司作为您的信任合作伙伴。我们从多个角度&#xff0c;为您详细解析办理大兴道路运输许可证所需的条件及注意事项&#xff0c;以便您轻松高效地完成相关手续。&#xff08;游览器搜经典世纪胡云帅&#xff09;。 我们…

Android7.1 ANR error 弹窗处理

Android7.1 ANR error 弹窗处理 问题描述解决方法 郑重声明:本人原创博文&#xff0c;都是实战&#xff0c;均经过实际项目验证出货的 转载请标明出处:攻城狮2015 Platform: Rockchip OS:Android 7.1.2 Kernel: 3.10 问题描述 有时会用到第三方apk&#xff0c;内置到系统中&…

Linux从0到1——Linux环境基础开发工具的使用(上)

Linux从0到1——Linux环境基础开发工具的使用&#xff08;上&#xff09; 1. Linux软件包管理器yum1.1 yum介绍1.2 用yum来下载软件1.3 更新yum源 2. Linux编辑器&#xff1a;vi/vim2.1 vim的基本概念2.2 vim的基本操作2.3 vim正常模式命令集2.4 vim底行模式命令集2.5 视图模式…

【全志H616】-2 写一个自己的串口

【全志H616】-2 写一个自己的串口 1、基本命令 重启 sudo rebootLinux系统下一个文件夹的文件复制到另一个文件夹下 cp flags.c /home/user05/lab09/flags_revised.c //复制当前文件夹下的 flags.c 文件到 lab09 文件夹下flags_recised.c 文件cp oled_demo.c /home/orangep…

在图片上进行标记

文章目录 需求分析 需求 底图是一张图片&#xff0c;要在图上做标记&#xff0c;对标记的位置有交互行为鼠标滚顶页面&#xff0c;标记位置不发生变化页面发生缩放&#xff0c;标记位置不发生变化 分析 <template><divv-loading"loading"class"point-m…

什么是智慧公厕?对公共厕所智能实时监测管理控制,城市管理更高效智能

公共厕所一直以来都是城市管理的难题之一&#xff0c;但随着智慧科技的发展和应用&#xff0c;智慧公厕成为了解决这一问题的利器。智慧公厕是一种信息化的新型公共厕所&#xff0c;通过全面感知平台实时监测公共厕所的使用状态&#xff0c;并将数据转化为可视、可算、可管的数…

读取txt文件并统计每行最长的单词以及长度

读取txt文件并统计每行最长的单词以及长度 题目 在 D:\\documant.txt 文本中,文件中有若干行英文文本,每行英文文本中有若干个单词&#xff0c;每个单词不会跨行出现每行至多包含100个字符,要求编写一个程序,处理文件,分析各行中的单词,找到每行中的最长单词&#xff0c;分别…

互联网剧本杀小程序,如何创新发展提高收益

近年来&#xff0c;剧本杀深受年轻人的喜欢&#xff0c;一度成为了大众的社交方式&#xff0c;剧本杀为年轻人提供了一个全新的娱乐游戏和社交为一体的模式。 不过随着剧本杀市场入局的人越来越多&#xff0c;市场的发展也迎来了“拐点”&#xff0c;剧本杀逐渐趋向高质量发展…

190基于matlab的tfrSTFT时频分布图

基于matlab的tfrSTFT时频分布图&#xff0c;计算时间序列的STFT时频分布图&#xff0c;得到瞬时频率。通过GUI可以调节图像的展示样式。程序已调通&#xff0c;可直接运行。 190 STFT时频分布图 瞬时频率 能量谱 (xiaohongshu.com)

openGauss使用BenchmarkSQL进行性能测试(上)

一、前言 本文提供openGauss使用BenchmarkSQL进行性能测试的方法和测试数据报告。 BenchmarkSQL&#xff0c;一个JDBC基准测试工具&#xff0c;内嵌了TPC-C测试脚本&#xff0c;支持很多数据库&#xff0c;如PostgreSQL、Oracle和Mysql等。 TPC-C是专门针对联机交易处理系统…

软考高项总结:第16章采购管理(一)

一、管理基础 1、项目采购管理包括从项目团队外部采购或获取所需产品、服务或成果的各个过程。例如合同、订购单、协议备忘录(MOA)和服务水平协议(SLA)。被授权采购项目所需货物、服务的人员可以是项目团队、管理层或组织采购部的成员。 2、协议可以是合同、服务水平协议(SL…

基于AM62X+FPGA/MCU的B码对时定制化整机解决方案

什么是IRIG-B码对时 IRIG-B(inter-range instrumentationgroup-B)码是一种时间同步标准&#xff0c;通常用于精确的时间测量和数据同步&#xff0c;广泛应用于电力、通信、航空等领域。 IRIG-B码为每秒一帧的时间串码&#xff0c;一帧串码中包含100个码元&#xff0c;频率为1K…

git svn混用

背景 项目代码管理初始使用的svn, 由于svn代码操作&#xff0c;无法在本地暂存&#xff0c;有诸多不便&#xff0c;另外本人习惯使用git. 所以决定迁移至git管理 迁移要求&#xff1a; 保留历史提交记录 迁移流程 代码检出 git svn svn_project_url git代码提交 修改本…

可回馈式直流电子负载原理是怎样的

可回馈式直流电子负载可以将电能回馈到电网中&#xff0c;从而实现对电源系统的测试和分析。其工作原理主要包括以下几个方面&#xff1a; 1. 能量转换&#xff1a;可回馈式直流电子负载通过内部的功率开关管将输入的直流电转换为交流电&#xff0c;然后通过变压器将电压升高或…