有网友碰到这样的问题“【Stata入门】10面板数据混合回归、个体效应(固定效应、随机效应)及豪斯曼检验”。小编为您整理了以下解决方案,希望对您有帮助:
解决方案1:
Stata入门:面板数据混合回归、个体效应(固定效应、随机效应)及豪斯曼检验一、估计面板数据的三种策略
混合回归
定义:将面板数据看成是截面数据而进行混合回归(pooled regression),要求样本中每位个体拥有相同的回归方程。
缺点:此策略忽略了个体间不可观测或被遗漏的异质性(heterogeneity),而该异质性可能与解释变量相关,导致估计不一致。
对每位个体进行回归
定义:为每位个体估计一个单独的回归方程。
缺点:忽略了个体的共性;可能没有足够大的样本容量。
个体效应模型——折衷的估计策略
定义:假定个体的回归方程拥有相同的斜率,但可有不同的截距项,以此来捕捉异质性。
公式:
$z_{i}$ 为不随时间而变(time invariant)的个体特征,比如性别。
$x_{it}$ 可随个体及时间而变(time-varying)。
扰动项由($u_{i}+varepsilon_{it}$)两部分构成,称为“复合扰动项”(composite error term)。其中,不可观测的随机变量 $u_{i}$ 是代表个体异质性的截距项;$varepsilon_{it}$ 为随个体与时间而改变的扰动项,假设其同分布,且与 $u_{i}$ 不相关。
二、固定效应模型与随机效应模型固定效应模型
如果 $u_{i}$ 与某个解释变量相关,则称为“固定效应模型”(Fixed Effects Model,简记 FE)。此时,OLS 不一致,需要将模型转换,消去 $u_{i}$ 后获得一致估计量。
固定效应模型也叫“最小二乘虚拟变量模型(LSDV)”。
随机效应模型
如果 $u_{i}$ 与所有解释变量($x_{it}, z_{i}$)均不相关,则称为“随机效应模型”(Random Effects Model,简记 RE)。
三、混合效应与固定效应的检验方法一:看F值
使用 xtreg y x controls, fe 进行固定效应回归,并通过 estimates store FE 存储结果。
F检验原假设:所有 $u_{i}$ 都为0。由于F检验的p值通常很小(如0.0000),所以强烈拒绝原假设,认为FE优于混合回归。
缺点:没有使用稳健标准误,F检验可能不有效,因此推荐使用LSDV法。
方法二:LSDV法
使用 xi:xtreg y x controls i.id, robust 进行回归,并通过 estimates store LSDV 存储结果。
大多数个体虚拟变量都很显著(p值很小,如0.000),可以拒绝“所有个体虚拟变量都为0”的原假设,即认为存在个体固定效应,不使用混合回归。
四、混合效应与随机效应的检验使用 xtreg y x controls, re robust 进行随机效应回归,并通过 xttest0 检验。LM检验强烈拒绝“不存在个体随机效应”的假设,说明在“混合回归”与“随机效应”中,应选后者。五、固定效应与随机效应的检验——豪斯曼检验传统豪斯曼检验
分别进行固定效应和随机效应回归,并存储结果。
使用 hausman FE RE, constant sigmamore 进行豪斯曼检验。
结果:如果p值很小(如0.0000),说明强烈拒绝原假设“$u_{i}$ 与($x_{it}, z_{i}$)均不相关”,认为应使用固定效应。
缺点:无法使用聚类稳健标准误。
使用聚类稳健标准误的豪斯曼检验
由于传统豪斯曼检验无法使用聚类稳健标准误,可以通过一系列步骤构造一个使用聚类稳健标准误的检验。
步骤:
进行随机效应回归,并获取 $theta$ 值。
对每个变量生成去中心化的变量。
使用去中心化的变量进行回归,并使用聚类稳健标准误。
对去中心化的解释变量进行联合显著性检验。
结果:如果p值很小(如0.0000),说明强烈拒绝原假设,认为应使用固定效应。
通过以上步骤,可以系统地对面板数据进行混合回归、固定效应、随机效应的估计与检验,最终选择合适的模型进行后续分析。