利用R语言进行典型相关分析实战

🍉CSDN小墨&晓末:https://blog.csdn.net/jd1813346972

   个人介绍: 研一|统计学|干货分享
         擅长Python、Matlab、R等主流编程软件
         累计十余项国家级比赛奖项,参与研究经费10w、40w级横向

文章目录

  • 1 目的
  • 2 数据背景
  • 3 建模分析
    • 3.1 数据读取
    • 3.2 相关矩阵散点图
    • 3.3 典型相关分析
    • 3.4 对结果进行经济意义分析

1 目的

  根据固定资产投资的资金来源、理论框架以及我国现有数据资料,对各类投资资金与三大产业进行典型相关分析。

2 数据背景

  数据是根据《中国统计年鉴2007》中31个省、市、自治区相关数据汇总整理得出。选取以下五个指标作为第一组变量来衡量投资资金的变化:

  • x 1 x_1 x1:国家预算内资金;

  • x 2 x_2 x2:国内贷款;

  • x 3 x_3 x3:利用外资;

  • x 4 x_4 x4:自筹资金;

  • x 5 x_5 x5:其它资金来源。

  可以选择下面三个指标作为第二组变量来反映各产业生产总值的变量:

  • y 1 y_1 y1:国家预算内资金;

  • y 2 y_2 y2:国内贷款;

  • y 3 y_3 y3:利用外资。

  详细的数据如表 1所示。

表1 2006 年全国各地区各类投资资金与三大产业增加值的统计表

3 建模分析

3.1 数据读取

  运行程序:

rm(list=ls()) #清空变量 
library("openxlsx") #加载包 
library("knitr") #加载包 
library("xlsx") #加载包 
source('G:/msaR.R') #引用 msaR.R 自编函数 
data<-read.xlsx("G:\\2006 年全国各地区各类投资资金与三大产业增加值的统计表 1.
xlsx",'Sheet1',encoding = "UTF-8") #读取 excel 数据 
head(data) #显示数据前六行

  运行结果:

## 地区 x1 x2 x3 x4 x5 y1 y2 y3 
## 1 北京 105.40 1316.3 76.18 1523 1825.4 98.04 2191 5581 
## 2 天津 22.79 527.8 152.98 1182 397.3 118.23 2488 1753 
## 3 河北 98.79 638.0 76.96 4247 600.3 1606.48 6115 3939 
## 4 山西 81.81 474.0 29.22 1504 263.9 276.77 2748 1727 
## 5 内蒙古 149.21 400.9 21.83 2514 207.3 649.62 2327 1814 
## 6 辽宁 271.52 742.5 132.42 4185 695.6 976.37 4730 3545 

3.2 相关矩阵散点图

  运行程序:

data1<-data.frame(scale(data[,2:9])) #标准化系数 
data2<-data.frame(round(cor(data1),3)) #标准化数据后相关系数矩阵 
data2 #相关系数矩阵 
## x1 x2 x3 x4 x5 y1 y2 y3 
## x1 1.000 0.110 -0.090 0.243 0.044 0.373 0.108 0.078 
## x2 0.110 1.000 0.786 0.735 0.965 0.478 0.825 0.933 
## x3 -0.090 0.786 1.000 0.735 0.785 0.485 0.901 0.888 
## x4 0.243 0.735 0.735 1.000 0.690 0.811 0.926 0.803 
## x5 0.044 0.965 0.785 0.690 1.000 0.439 0.796 0.938 
## y1 0.373 0.478 0.485 0.811 0.439 1.000 0.733 0.595 
## y2 0.108 0.825 0.901 0.926 0.796 0.733 1.000 0.927 
## y3 0.078 0.933 0.888 0.803 0.938 0.595 0.927 1.000 
library(PerformanceAnalytics)#加载包 
chart.Correlation(data1[c(1:31),c(1:8)], histogram=TRUE, pch=19) 
#相关系数矩阵散点图 
1. data<-read.csv("G:\\某乐队 CD 盘销售情况.csv") #数据读取 
2. names(data) <- c("周次","y","x1","x2") #列命名 
3. fm=lm(y~x1+x2,data=data) #最小二乘回归 
4. summary(fm) #结果

  运行结果:

Call: 
lm(formula = data$y ~ data$x1 + data$x2, data = data) 
 
Residuals: 
 Min 1Q Median 3Q Max 
-747.71 -229.80 -2.14 267.23 547.68 
 
Coefficients: 
 Estimate Std. Error t value Pr(>|t|) 
(Intercept) -574.0550 349.2701 -1.644 0.1067 
x1 191.1001 73.3090 2.607 0.0121 * 
x2 2.0451 0.9107 2.246 0.0293 * 
--- 
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 
 
Residual standard error: 329.7 on 49 degrees of freedom 
Multiple R-squared: 0.2928, Adjusted R-squared: 0.264 
F-statistic: 10.15 on 2 and 49 DF, p-value: 0.0002057 

  结果见图1所示。

图1 相关系数矩阵散点图

  由相关系数矩阵和相关系数矩阵图可以看出, y 1 、 y 2 、 y 3 y_1、y_2、y_3 y1y2y3分别与 x 4 、 x 4 、 x 5 x_4、x_4、x_5 x4x4x5的相关系数最大。表明我国第一产业和第二产业增加值与与我国 自筹资金相关度最高,第三产业增加值与我国其它资金来源相关度最 高,相关系数分别达到 0.81、0.93、0.94。

3.3 典型相关分析

  运行程序:

msa.cancor(data1[,1:5],data1[6:8],plot = T) 

  运行结果:

图2 第一对典型变量得分平面等值图
## $cor 
## CR Q P 
## 1 0.9838 145.635 0.0000 
## 2 0.9202 55.728 0.0000 
## 3 0.5733 9.364 0.0248 
## 
## $xcoef 
## x1 x2 x3 x4 x5 
## u1 0.0012 0.0196 0.0810 0.0684 0.0312 
## u2 -0.0063 -0.0151 0.0294 0.2190 -0.2388 
## u3 0.0947 -0.1909 -0.2126 0.1112 0.2986 
## 
## $ycoef 
## y1 y2 y3 
## v1 -0.0142 0.1318 0.0636 
## v2 0.0582 0.3900 -0.4360 
## v3 0.2779 -0.4495 0.2687 

  经检验在 0.05 的显著性水平上,有三组典型相关是显著的,即需 要三组典型变量,根据运行结果可得出前三对典型变量的线性组合为:
{ u 1 = 0.0012 x 1 + 0.0196 x 2 + 0.0810 x 3 + 0.0684 x 4 + 0.0312 x 5 v 1 = − 0.0142 y 1 + 0.1318 y 2 + 0.0636 y 3 \begin{cases}u_1=0.0012x_1+0.0196x_2+0.0810x_3+0.0684x_4+0.0312x_5 \\ v_1=-0.0142y_1+0.1318y_2+0.0636y_3\end{cases} {u1=0.0012x1+0.0196x2+0.0810x3+0.0684x4+0.0312x5v1=0.0142y1+0.1318y2+0.0636y3

{ u 2 = − 0.0063 x 1 − 0.0151 x 2 + 0.0294 x 3 + 0.2190 x 4 − 0.2388 x 5 v 2 = − 0.0582 y 1 + 0.39008 y 2 − 0.4360 y 3 \begin{cases}u_2=-0.0063x_1-0.0151x_2+0.0294x_3+0.2190x_4-0.2388x_5 \\v_2=-0.0582y_1+0.39008y_2-0.4360y_3\end{cases} {u2=0.0063x10.0151x2+0.0294x3+0.2190x40.2388x5v2=0.0582y1+0.39008y20.4360y3

{ u 3 = 0.0947 x 1 − 0.1909 x 2 − 0.0294 x 3 + 0.1112 x 4 + 0.2986 x 5 v 3 = 0.2779 y 1 − 0.4495 y 2 + 0.2687 y 3 \begin{cases}u_3=0.0947x_1-0.1909x_2-0.0294x_3+0.1112x_4+0.2986x_5 \\v_3=0.2779y_1-0.4495y_2+0.2687y_3\end{cases} {u3=0.0947x10.1909x20.0294x3+0.1112x4+0.2986x5v3=0.2779y10.4495y2+0.2687y3

3.4 对结果进行经济意义分析

  (1)由运行结果显示:CR1=0.9838,说明 u 1 u_1 u1 v 1 v_1 v1 之间存在高度相 关关系,且各自的变量组合中的系数大多为正号,因此一般来说,各 类投资资金越多,我国各产业生产总值增加值越多。

  (2)在第一对典型变量 u 1 u_1 u1 v 1 v_1 v1 中, u 1 u_1 u1 为 2006 年全国各类投资资金 的线性组合,其中 x 3 x_3 x3 (利用外资)、 x 4 x_4 x4 (自筹资金)较其它变量有较大 载荷,说明外资和自筹资金在投资资金中占主导地位; v 1 v_1 v1是三大产业增 加值的线性组合,其中 y 2 y_2 y2 (第二产业增加值)的载荷相对较大,说明 x 3 x_3 x3 (利用外资)、 x 4 x_4 x4 (自筹资金)与 y 2 y_2 y2 (第二产业增加值)有较为密切 的关系,以外资和自筹资金为代表的投资类别对经济的促进作用主要 体现在第二产业的增长上,即要保持第二产业的快速增长,那么外资 和自筹资金必须有充足的供应。

   (3)在第二对典型变量中,在投资类别指标的线性组合中, x 4 x_4 x4 (自筹资金)、 x 5 x_5 x5 (其它资金来源)较其它变量系数有较大载荷,说 明自筹资金和其它资金来源是投资的主要指标它们在投资中占主导地 位;而在生产总值指标中,以 y 3 y_3 y3 (第三产业增加值)的载荷最大,说明第三产业的增加值与自筹资金、其它资金来源有着密切关系,其中自筹资金的增长对第三产业的发展有着抑制作用,相反,其它资金的 投资增加对第三产业的发展有着积极作用。

  (4)在第三对典型变量中, x 3 x_3 x3(利用外资)、 $x_5 (其它资金来源) 在投资类别指标中相对其它变量占较大载荷,说明外资和其它资金来 源占主导地位;在生产总值指标中第二产业的载荷最大,说明第二产业 与以外资和其它资金来源作为投资形式的关系有着密切关系,再次说 明了外资的增加对第二产业的发展有着积极作用,但其它来源的资金 对于第二产业的发展有着较为明显的抑制效果。

   (5)从上面三对典型变量中可以看出,在投资形式上,外资、自 筹资金及其它来源资金的投资形式占据主导地位,在此投资模式下, 对第二产业发展动向往往有着较为明显的关系。其中外资形式的投资 方式与第二产业有着同向变动关系,其它来源的投资形式与第三产业 有着同向变动关系,结合实际情况来说,“十五”期间,我国对外贸 易持续快速发展,“科技兴贸”、“以质取胜”和“走出去”战略取 得新的进展。对外贸易结构逐步改善、质量效益逐步提高,为第二产 业创造了大量就业机会,极大的促进了第二产业的发展。

  (6)将原始数据代入第一对典型变量中,得到典型变量第一对典 型变量 u 1 u_1 u1 v 1 v_1 v1 的得分平面等值图(如图 2 所示),从图 2 可以看出,散 点近似的分布在一条直线上,两者呈线性相关关系,说明用典型相关 分析的方法能较好地说明投资于产业增长之间的相关关系。散点图上 几乎没有离异点,这表明投资量与产业增长量之间的关系很稳定,波 动也非常平稳。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/405900.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

幻兽帕鲁(Palworld 1.4.1)私有服务器搭建(docker版)

文章目录 说明客户端安装服务器部署1Panel安装和配置docker服务初始化设置设置开机自启动设置镜像加速 游戏服务端部署游戏服务端参数可视化配置 Palworld连接服务器问题总结 说明 服务器硬件要求&#xff1a;Linux系统/Window系统&#xff08;x86架构&#xff0c;armbian架构…

Linux设备模型(二) - kset/kobj/ktype APIs

一&#xff0c;kobject_init_and_add 1&#xff0c;kobject_init_and_add实现 /** * kobject_init_and_add() - Initialize a kobject structure and add it to * the kobject hierarchy. * kobj: pointer to the kobject to initialize * ktype: p…

Spring注入

文章目录 3.1 什么是注入3.1.1 为什么需要注入3.1.2 如何进行注入3.1.3 注入好处 3.2 Spring 注入的原理分析&#xff08;简易版&#xff09;3.3 Set 注入详解3.3.1 JDK内置类型3.3.2 自定义类型3.3.2.1 第一种方式3.3.2.2 第二种方式 3.4 构造注入3.4.1 步骤3.4.2 构造方法重载…

RobotGPT:利用ChatGPT的机器人操作学习框架,三星电子研究院与张建伟院士、孙富春教授、方斌教授合作发表RAL论文

1 引言 大型语言模型&#xff08;LLMs&#xff09;在文本生成、翻译和代码合成方面展示了令人印象深刻的能力。最近的工作集中在将LLMs&#xff0c;特别是ChatGPT&#xff0c;整合到机器人技术中&#xff0c;用于任务如零次系统规划。尽管取得了进展&#xff0c;LLMs在机器人技…

第八篇【传奇开心果系列】python的文本和语音相互转换库技术点案例示例:Google Text-to-Speech虚拟现实(VR)沉浸式体验经典案例

传奇开心果博文系列 系列博文目录python的文本和语音相互转换库技术点案例示例系列 博文目录前言一、雏形示例代码二、扩展思路介绍三、虚拟导游示例代码四、交互式学习示例代码五、虚拟角色对话示例代码六、辅助用户界面示例代码七、实时语音交互示例代码八、多语言支持示例代…

大模型平民化技术之LORA

1. 引言 在这篇博文中&#xff0c; 我将向大家介绍LoRA技术背后的核心原理以及相应的代码实现。 LoRA 是 Low-Rank Adaptation 或 Low-Rank Adaptors 的首字母缩写词&#xff0c;它提供了一种高效且轻量级的方法&#xff0c;用于微调预先训练好的的大语言模型。这包括 BERT 和…

数据之巅:揭秘企业数据分析师如何成为企业的决策智囊

引言 在数字化浪潮中&#xff0c;企业数据分析师已成为企业决策的重要支撑。他们如同探险家&#xff0c;在数据的丛林中寻找着能够指引企业前行的宝贵信息。本文将深入剖析企业数据分析师的角色、挑战与成就&#xff0c;带你领略这个充满智慧与激情的职业风采。 一、从数字到智…

计算机毕业设计 基于SpringBoot的宠物商城网站系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…

代理模式笔记

代理模式 代理模式代理模式的应用场景先理解什么是代理&#xff0c;再理解动静态举例举例所用代码 动静态的区别静态代理动态代理 动态代理的优点代理模式与装饰者模式的区别 代理模式 代理模式在设计模式中是7种结构型模式中的一种&#xff0c;而代理模式有分动态代理&#x…

WordPres Bricks Builder 前台RCE漏洞

免责声明&#xff1a;文章来源互联网收集整理&#xff0c;请勿利用文章内的相关技术从事非法测试&#xff0c;由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失&#xff0c;均由使用者本人负责&#xff0c;所产生的一切不良后果与文章作者无关。该…

<网络安全>《48 网络攻防专业课<第十四课 - 华为防火墙的使用(1)>

1 DHCP Snooping 概述 DHCP Snooping功能用于防止 1、DHCP Server仿冒者攻击&#xff1b; 2、中间人攻击与IP/MAC Spoofing攻击&#xff1b; 3、改变CHADDR值的DoS攻击。 1.2 DHCP Server 仿冒者攻击 1.3 中间人与IP/MAC Spoofing 攻击 1.4 改变CHADDR 值的DoS 攻击 CHADDR…

2024年数学建模美赛详细总结以及经验分享

前言&#xff1a; 本文记录与二零二四年二月六日&#xff0c;正好今天是数学建模结束&#xff0c;打算写篇文章记录一下整个过程&#xff0c;以及一些感受、还有经验分享。记录这个过程的原因就是我在赛前&#xff0c;在博客上找了很久&#xff0c;也没有像我这么类似记…

Gemma模型论文详解(附源码)

原文链接&#xff1a;Gemma模型论文详解&#xff08;附源码&#xff09; 1. 背景介绍 Gemma模型是在2023.2.21号Google新发布的大语言模型, Gemma复用了Gemini相同的技术(Gemini也是Google发布的多模态模型)&#xff0c;Gemma这次发布了了2B和7B两个版本的参数&#xff0c;不…

JAVA--File类与IO流

目录 1. java.io.File类的使用 1.1 概述 1.2 构造器 1.3 常用方法 1、获取文件和目录基本信息 2、列出目录的下一级 3、File类的重命名功能 4、判断功能的方法 5、创建、删除功能 2. IO流原理及流的分类 2.1 Java IO原理 2.2 流的分类 2.3 流的API 3. 节点流之一…

微服务学习

一、服务注册发现 服务注册就是维护一个登记簿&#xff0c;它管理系统内所有的服务地址。当新的服务启动后&#xff0c;它会向登记簿交待自己的地址信息。服务的依赖方直接向登记簿要Service Provider地址就行了。当下用于服务注册的工具非常多ZooKeeper&#xff0c;Consul&am…

Jetson Xavier NX 与笔记本网线连接 ,网络共享,ssh连接到vscode

Jetson Xavier NX 与笔记本网线连接 &#xff0c;网络共享&#xff0c;ssh连接到vscode Jetson Xavier NX桌面版需要连接显示屏、鼠标和键盘&#xff0c;操作起来并不方便&#xff0c;因此常常需要ssh远程连接到本地笔记本电脑&#xff0c;这里介绍一种连接方式&#xff0c;通过…

Linux实验记录:使用PXE+Kickstart无人值守安装服务

前言&#xff1a; 本文是一篇关于Linux系统初学者的实验记录。 参考书籍&#xff1a;《Linux就该这么学》 实验环境&#xff1a; VmwareWorkStation 17——虚拟机软件 RedHatEnterpriseLinux[RHEL]8——红帽操作系统 备注&#xff1a; 实际生产中安装操作系统的工作&…

论文笔记:利用词对比注意增强预训练汉字表征

整理了 ACL2020短文 Enhancing Pre-trained Chinese Character Representation with Word-aligned Att&#xff09;论文的阅读笔记 背景模型实验 论文地址&#xff1a;论文 背景 近年来&#xff0c;以 BERT 为代表的预训练模型在 NLP 领域取得取得了非常显著的效果。但是&…

谈谈对BFC的理解

文章目录 一、是什么二、触发条件三、应用场景防止margin重叠&#xff08;塌陷&#xff09;清除内部浮动自适应多栏布局小结 参考文献 一、是什么 我们在页面布局的时候&#xff0c;经常出现以下情况&#xff1a; 这个元素高度怎么没了&#xff1f;这两栏布局怎么没法自适应&…

28-k8s集群中-StatefulSets控制器(进阶知识)

一、statefullsets控制器概述 1&#xff0c;举例 假如&#xff0c;我们有一个deployment资源&#xff0c;创建了3个nginx的副本&#xff0c;对于nginx来讲&#xff0c;它是不区分启动或者关闭的先后顺序的&#xff0c;也就是“没有特殊状态”的一个服务&#xff0c;也成“无状…