探索性因子分析(以下简称因子分析),是毕业论文中常用的数据分析方法,用于研究多个变量之间的关系,并通过提取公共因子来简化数据集。
信息浓缩是因子分析最常见的应用,除此之外,因子分析还可以进行综合竞争力分析、量表结构效度分析、因子权重计算、指标权重计算、共同方法偏差检验等,今天一文讲解因子分析的这六类应用,方法用对了,你的论文绝对能够轻松完成。
一、信息浓缩
使用因子分析进行信息浓缩,即将分析项浓缩成几个因子,使用这几个因子能够代表所有分析项的大部分信息,得到因子后可以进行后续如回归分析等。因子分析进行信息浓缩的步骤如下:
1、指标数据标准化处理
由于指标数据性质不同,具有不同的数量级和量纲,会导致分析结果不准确或产生误差。因此,先对原始数据进行标准化处理。
SPSSAU因子分析将自动进行标准化处理,因此不需要再对数据进行处理。标准化计算公式:(X-Mean)/ Std
SPSSAU进行因子分析软件操作如下图:
2、因子分析适用性检验
进行因子分析的前提是数据适合使用该方法,通常采取KMO检验和Bartlett球形检验。KMO检验用于检查变量间的相关性,取值为0~1。KMO值越接近于1,变量间的相关性越强,一般KMO值大于0.6即可进行因子分析。Bartlett球形检验用于检验变量是否各自独立,通常显著性小于0.05时,说明符合标准,适合做因子分析。
本案例输出KMO和Bartlett球形检验结果如下:
从结果来看,KMO值为0.722大于0.6,所以可以进行因子分析。同时Bartlett球形检验结果显示p值小于0.05,可以进行因子分析。
3、提取公因子
默认以特征根大于1为标准提取公因子(也可主动选择公因子个数),SPSSAU得到各因子的特征根以及方差解释率见下表:
分析上表可知,特征根大于1的因子共有两个,说明本次分析提取2个公因子。这2个公因子的累计方差解释率为78.808%,第一个因子的方差解释率为41.346%,第二个因子的方差解释率为37.462%,说明提取的两个公因子能够代表原来6个铁路运输能力指标78.808%的信息,整体来看信息变量丢失较少,因子分析效果比较理想。
另外,从特征根的碎石图可以更为直观的看出拟提取的公因子。如上图,前两个因子的让特征根值均大于1,且曲线比价陡峭,剩下4个特征根值均小于1且特征根值曲线逐渐变得比较平缓,即提取前2个因子可以代表所有原始铁路运输指标的绝大部分信息,与方差解释率得到结果一致。
- 公因子命名与解释
找到公因子后,为了理解公因子的实际意义以及方便对问题进行分析,需要继续进行因子旋转。旋转常用方法为最大方差法。旋转后的因子载荷矩阵可以直观反映各个变量对主成分的贡献程度,一个变量在某个公因子上的载荷系数的绝对值越大,说明变量与该公因子越具有相关性。
下表为使用最大方差法进行旋转后得到的因子载荷系数表格:
分析上表可知,因子1在铁路货运总量、铁路营业里程、铁路货物总周转量上具有较大的载荷,因此这3个变量归为一类命名为货运因子(记作F1)。因子2在铁路客运量、铁路旅客周转量、铁路运输职工人数上具有较大的载荷,因此这3个变量归为另一类命名为客运因子(记作F2)。
5、计算因子得分
确定因子后,进一步计算各因子得分,SPSSAU输出成份得分系数矩阵如下:
根据成份得分系数矩阵,得到公因子F由变量X表示线性组合的因子得分函数:
F1(货运因子)=-0.203*Z铁路客运量-0.178*Z铁路旅客周转量+0.537*Z铁路货运总量+0.294*Z铁路营业里程+0.333*Z铁路货物总周转量+0.135*Z铁路运输职工人数F2(客运因子)=0.506*Z铁路客运量+0.488*Z铁路旅客周转量-0.321*Z铁路货运总量+0.025*Z铁路营业里程-0.014*Z铁路货物总周转量+0.197*Z铁路运输职工人数
这一过程可通过手算完成,但要注意使用的是标准化后的数据代入公式。使用SPSSAU进行因子分析前,勾选【因子得分】,会自动保存公因子得分,如下图:
因子得分可用于进一步分析,比如聚类分析,回归分析使用等。以上即为使用因子分析进行信息浓缩的全流程。接下来介绍如何使用因子分析的“综合得分”进行综合竞争力分析。
二、综合竞争力分析
如果使用因子分析的目的在于进行综合竞争力分析,比如银行的绩效排名,上市公司竞争力排名等,此时可计算综合得分,用于竞争力排名。
接上述因子分析案例,将指标数据代入因子表达式,计算综合得分,分析结果并进行综合竞争力分析。即以2个公因子得分为基础,再以每个因子的方差解释率为权数进行线性加权平均,最后得到一个综合得分模型:
注:分子为两个公因子旋转后方差解释率,分母为旋转后累计方差解释率。勾选【综合得分】后,SPSSAU将自动保存综合得分,结果见下图:
得到综合得分后,可将数据下载至本地,使用Excel对综合得分进行排序,该排名就代表了31个省份的铁路运输能力的综合竞争力。以上即为因子分析进行综合竞争力分析的全过程。
接下来介绍因子分析进行量表结构效度分析。
三、量表结构效度分析
效度用于测量量表设计是否合理,结构效度通过因子分析方法进行检验。研究人员心中预期着变量与题项对应关系,进行因子分析后,因子与题项对应关系二者预期基本一致时,则说明具有良好的结构效度。
例如:在林岩星《视频网站用户付费意愿影响因素研究》这篇论文中,研究者使用SPSSAU探索性因子分析进行问卷的结构效度研究。
四、因子权重计算
因子分析提取出公因子后,如果想计算各个因子的权重值,可以使用旋转后方差解释率进行因子权重分析。
查看因子分析的 “ 方差解释率 ” 表格,计算因子权重只需要看两个值——各个公因子旋转后方差解释率和旋转后累计方差解释率。如下表:
归一化:旋转后方差解释率 / 旋转后累计方差解释率,即可得到各因子权重:因子1权重=41.346%/78.808%=0.525因子2权重=37.462%/78.808%=0.475
五、指标权重计算
各个指标项的权重也可以使用SPSSAU因子分析得到。SPSSAU系统在进行因子分析时,自动输出线性组合系数及权重计算结果,找到此表,最后一列即输出各个指标的权重值。
上表涉及的各指标计算公式如下:
- 线性组合系数=载荷系数 / 对应特征根的平方根
- 综合得分系数=累积(线性组合系数*方差解释率)/ 累计方差解释率
- 权重=归一化综合得分系数
虽然计算公式看起来比较复杂,但SPSSAU进行分析时可直接得到计算结果,无需手动计算。
六、共同方法偏差检验
共同方法偏差(Common Method Bias,简称CMB或CMV)是一种系统误差,它源于数据收集过程中使用的相同或相似的测量方法、评分者、测量环境、项目语境以及项目本身特征等因素,导致预测变量与效标变量之间出现人为的共变。这种偏差可能会对研究结果产生严重的混淆,并对结论产生潜在的误导。
共同方法偏差可以使用Harman单因子检验法——将所有指标放在一个因子下进行因子分析,如果该因子的方差解释率低于40%(常见标准),则认为研究数据并不存在严重的共同方法偏差,反之,则认为存在共同方法偏差。
SPSSAU因子分析进行共同方法偏差检验操作如下: