回归分析介绍和分类
数据分类及数据的来源
线性回归
四种模型的解释、虚拟变量的设置以及交互项的解释
- 3个定量,7个定类
- 插入,表格,包含标题,标题换黑色
可以右键,复制表格,excel中设置三线表
- ,gen(A)是参数可以不加
- 数据透视表能大大提高效率
彩色打印出来看不清,灰白可以看清
完善的饼图,饼图,柱状图都要进行排序
- 将这个表格放在论文中,让 别人一目了然指标有哪些
安装插件
- 预测性回归就是拟合
第一问可以直接回归,第二问需要标准化后回归。
用beta来看影响最重要的因素
归一化处理有问题,数据范围变了,得到的系数会不好解释
结果看两点1. 联合显著性p 2. 每个变量对应的p值
在模型中加高次项不太好,因为不好解释
论文问题
- 数据不要进行随便归一化
- 回归结果要把p值进行说明
- 不要随意添加高次模型,只是解释性回归那只要标准化回归就行
1 异方差
2 多重共线性
3 逐步回归
- 大致看不太准确
在回归前进行异方差检验