截面空间计量模型(Stata)
文章目录
- 截面空间计量模型(Stata)
- @[toc]
- 1 广义空间自回归模型(SAC)
- 2 空间误差模型(SEM)
- 3 空间杜宾模型(SDM)
- 4 广义空间嵌套模型(GNS)
- 5 空间(自回归)滞后模型(SAR,SLM)
- 6 空间杜宾误差模型(SDEM)
文章目录
- 截面空间计量模型(Stata)
- @[toc]
- 1 广义空间自回归模型(SAC)
- 2 空间误差模型(SEM)
- 3 空间杜宾模型(SDM)
- 4 广义空间嵌套模型(GNS)
- 5 空间(自回归)滞后模型(SAR,SLM)
- 6 空间杜宾误差模型(SDEM)
1 广义空间自回归模型(SAC)
广义空间自回归模型同时描述了因变量与误差项的空间依赖性,模型形式为
y
=
ρ
W
1
y
+
X
β
+
u
u
=
λ
W
2
u
+
ε
ε
∼
N
(
0
,
σ
2
I
n
)
\begin{aligned} \boldsymbol{y} &=\rho \boldsymbol{W}_{1} y+\boldsymbol{X} \boldsymbol{\beta}+\boldsymbol{u} \\ \boldsymbol{u} &=\lambda \boldsymbol{W}_{2} \boldsymbol{u}+\boldsymbol{\varepsilon} \\ \boldsymbol{\varepsilon} & \sim N\left(\boldsymbol{0}, \sigma^{2} \boldsymbol{I}_{n}\right) \end{aligned}
yuε=ρW1y+Xβ+u=λW2u+ε∼N(0,σ2In)
其中
y
y
y是因变量,
ρ
\rho
ρ是空间滞后系数,
X
X
X是自变量,
β
\beta
β是自变量对因变量的影响,
u
u
u是扰动项,但扰动项也存在空间依赖性。
W
1
W_1
W1和
W
2
W_2
W2是空间权重矩阵,可以相同。
use test.dta,clear
describe
/*
Contains data from test.dta
Observations: 31
Variables: 8 27 Feb 2020 20:21
------------------------------------------------------------------------------------
Variable Storage Display Value
name type format label Variable label
------------------------------------------------------------------------------------
地区 str24 %24s
inno long %8.0g INNO
rdk long %8.0g RDK
rdl long %8.0g RDL
lninno float %8.0g lnINNO
lnrdk float %8.0g lnRDK
lnrdl float %8.0g lnRDL
wlninno float %8.0g WlnINNO
------------------------------------------------------------------------------------
Sorted by:
*/
该数据集包含中国31个地区R&D相关的指标。其中inno 表示R&D项目数量,rdk是R&D投入费用,rdl 是R&D研发投入人员。ln前缀是对数。使用OLS估计
*OLS
reg lninno lnrdk lnrdl
est sto ols
/*
reg lninno lnrdk lnrdl
Source | SS df MS Number of obs = 31
-------------+---------------------------------- F(2, 28) = 502.39
Model | 74.1458525 2 37.0729262 Prob > F = 0.0000
Residual | 2.0662154 28 .073793407 R-squared = 0.9729
-------------+---------------------------------- Adj R-squared = 0.9710
Total | 76.2120679 30 2.54040226 Root MSE = .27165
------------------------------------------------------------------------------
lninno | Coefficient Std. err. t P>|t| [95% conf. interval]
-------------+----------------------------------------------------------------
lnrdk | .2434997 .2301687 1.06 0.299 -.2279796 .714979
lnrdl | .7027097 .2428531 2.89 0.007 .2052477 1.200172
_cons | -2.363024 .8027859 -2.94 0.006 -4.007457 -.718592
------------------------------------------------------------------------------
*/
使用SAC模型估计
*SAC
* ssc install spregsac
spregsac lninno lnrdk lnrdl,wmfile(testW.dta)
* testW.dta是空间权重矩阵,需要放在与数据集同一目录下。
est sto sac
使用spregsac命令可对SAC模型估计,结果如下
2 空间误差模型(SEM)
空间误差模型刻画误差项的空间依赖性,或则未能观测的变量(遗漏变量)的空间依赖性,模型为
y
=
X
β
+
ε
ε
=
λ
W
ε
+
u
u
∼
N
(
0
,
σ
2
I
n
)
\begin{aligned} &\boldsymbol{y}=\boldsymbol{X} \boldsymbol{\beta}+\boldsymbol{\varepsilon} \\ &\boldsymbol{\varepsilon}=\lambda \boldsymbol{W} \boldsymbol{\varepsilon}+\boldsymbol{u} \\ &\boldsymbol{u} \sim N\left(\boldsymbol{0}, \sigma^{2} \boldsymbol{I}_{n}\right) \end{aligned}
y=Xβ+εε=λWε+uu∼N(0,σ2In)
使用命令spregsem命令可进行估计。
*SEM
* ssc install spregsem
spregsem lninno lnrdk lnrdl,wmfile(testW.dta)
est sto sem
3 空间杜宾模型(SDM)
SDM模型刻画了附近地区因变量、本地区自变量和附近地区自变量对本地区因变量的影响,模型为
y
=
ρ
W
1
y
+
X
β
1
+
W
2
X
‾
β
2
+
ε
\boldsymbol{y}=\rho \boldsymbol{W}_{1} \boldsymbol{y}+\boldsymbol{X} \boldsymbol{\beta}_{1}+\boldsymbol{W}_{2} \overline{\boldsymbol{X}} \boldsymbol{\beta}_{2}+\boldsymbol{\varepsilon}
y=ρW1y+Xβ1+W2Xβ2+ε
使用命令spregsdm可进行估计
*SDM
* ssc install spregsdm
spregsdm lninno lnrdk lnrdl,wmfile(testW.dta)
est sto sdm
估计结果如下
4 广义空间嵌套模型(GNS)
GNS模型同时刻画了自变量、因变量和误差项的空间依赖性,模型形式为
y
=
ρ
W
1
y
+
X
β
1
+
W
2
X
β
2
+
μ
μ
=
λ
W
μ
+
ε
\begin{aligned} &\boldsymbol{y}=\rho \boldsymbol{W}_{1} \boldsymbol{y}+\boldsymbol{X} \boldsymbol{\beta}_{1}+\boldsymbol{W}_{2} \boldsymbol{X} \boldsymbol{\beta}_{2}+\boldsymbol{\mu} \\ &\boldsymbol{\mu}=\lambda \boldsymbol{W} \boldsymbol{\mu}+\boldsymbol{\varepsilon} \end{aligned}
y=ρW1y+Xβ1+W2Xβ2+μμ=λWμ+ε
将GNS模型中的因变量和自变量的空间滞后项当作正常自变量处理,那么GNS其实也可以视为SEM模型。由于Stata不擅长矩阵运算,可以使用excel对原始数据进行矩阵运算,即用空间权重矩阵分别对因变量和所有自变量相乘,得到Wy和WX,再使用SEM模型估计
use test2.dta,clear
spregsem lninno wlninno lnrdk lnrdl wlnrdk wlnrdl ,wmfile(test2W)
est sto GSN
运行结果如下:
5 空间(自回归)滞后模型(SAR,SLM)
SAR模型刻画了周围地区因变量、本地区自变量对本地区因变量影响,模型为
Y
=
ρ
W
Y
+
X
β
+
ε
,
ε
∼
N
[
0
,
σ
2
I
]
\boldsymbol{Y}=\rho \boldsymbol{W} \boldsymbol{Y}+\boldsymbol{X} \boldsymbol{\beta}+\boldsymbol{\varepsilon}, \quad \boldsymbol{\varepsilon} \sim N\left[\mathbf{0}, \sigma^{2} \boldsymbol{I}\right]
Y=ρWY+Xβ+ε,ε∼N[0,σ2I]
使用spregsar可对模型进行估计
*SAR(SLM)
* ssc install spregsar
spregsar lninno lnrdk lnrdl,wmfile(test2W)
est sto SAR
6 空间杜宾误差模型(SDEM)
SDEM模型刻画了自变量、自变量空间滞后对因变量的影响以及误差项空间依赖性。模型为
Y
t
=
μ
t
+
X
t
β
+
W
X
t
θ
+
ε
t
ε
t
=
λ
W
ε
t
+
ν
t
E
(
ν
t
)
=
0
E
(
ν
t
ν
t
′
)
=
σ
2
I
N
\begin{aligned} &\boldsymbol{Y}_{t}=\boldsymbol{\mu}_{t}+\boldsymbol{X}_{t} \boldsymbol{\beta}+\boldsymbol{W} \boldsymbol{X}_{t} \boldsymbol{\theta}+\boldsymbol{\varepsilon}_{t} \\ &\boldsymbol{\varepsilon}_{t}=\lambda \boldsymbol{W} \boldsymbol{\varepsilon}_{t}+\boldsymbol{\nu}_{t} \\ &\boldsymbol{E}\left(\boldsymbol{\nu}_{t}\right)=\mathbf{0} \\ &\boldsymbol{E}\left(\boldsymbol{\nu}_{t} \boldsymbol{\nu}_{t}^{\prime}\right)=\sigma^{2} \boldsymbol{I}_{N} \end{aligned}
Yt=μt+Xtβ+WXtθ+εtεt=λWεt+νtE(νt)=0E(νtνt′)=σ2IN
与GNS估计思路一样,将WX视为正常变量。由于Stata不擅长矩阵运算,再估计前用excel或matlab进行WX运算,再使用stata中spregsem命令进行估计
* SDEM
spregsem lninno lnrdk lnrdl wlnrdk wlnrdl ,wmfile(test3W)
est sto SDEM
这里仅介绍了常见截面空间计量模型的估计命令,更多细节help(spregsac),help(spregsar),help(spregsem),help(spregsdm)