1. 为什么做完回归,你还要做这四大检验?
刚上手Eviews做回归分析,你是不是也有过这样的经历?吭哧吭哧把数据导进去,点几下鼠标,一个漂亮的回归结果表格就出来了。R方挺高,F检验也显著,几个变量的系数看着也合理,心里一阵窃喜:“搞定!模型建好了!”
别急,先别急着写报告。我刚开始做项目的时候,就犯过这个错误,拿着一个“看起来很美”的模型就去汇报,结果被导师几个问题就问懵了:“你这个模型变量之间是不是互相‘打架’了?”“误差项的波动是不是随着数据变化而变大了?”“你确定这个模型在整个时间段内都适用吗?”
这些问题,指向的就是多元线性回归模型背后必须过关的“体检”。我们建立的模型,是基于一系列严格的统计假设的,比如误差项要独立、同方差、服从正态分布,解释变量之间不能有太强的线性关系,模型的结构要稳定。现实中的数据往往很“骨感”,很少能完美满足这些“理想”假设。如果假设不成立,那么你之前看到的那些漂亮的t检验、F检验结果,甚至你得到的系数估计值,都可能是有偏的、不可靠的。用这样的模型去做预测或者政策分析,就像用一把刻度不准的尺子去量东西,结果可想而知。
所以,这四大检验——多重共线性、异方差性、误差项正态性、模型稳定性检验——根本不是可有可无的“高级操作”,而是模型构建完成后,判断其是否健康、结果是否可信的必做步骤。它们回答的是:“我的模型真的靠谱吗?”这个问题。今天,我就以一个农业经济分析的实例,手把手带你走一遍Eviews里的完整检验流程。咱们不深究复杂的数学公式,就聚焦在“怎么操作”和“怎么看结果”上,让你做完回归心里真正有底。
2. 第一步:把数据“喂”给Eviews,并跑出基础回归
万事开头难,但Eviews的开头其实挺简单。咱们的目标是分析影响农业产值(假设变量叫Farming)的因素。可能的影响因素有农业劳动力(Labor)、化肥使用量(Fertilizer)、农机总动力(Machinery)、灌溉面积(Irrigation)和年降水量(Rainfall),数据时间跨度从1985年到2014年。
2.1 创建你的“数据工作室”——工作文件
打开Eviews,第一件事就是建一个专属的“工作间”。点击菜单栏的 File -> New -> Workfile。在弹出的对话框里,因为我们是时间序列数据,所以在 Workfile structure type 选择 Dated-regular frequency,频率(Frequency)根据数据选 Annual(年度)。在 Start date 输入 1985,End date 输入 2014,然后给工作文件起个名,比如 Agri_Model。点 OK,一个空白的工作文件就创建好了。
懒人技巧:你也可以在Eviews主窗口最下方的命令窗口(Command)里直接输入:wfcreate a 1985 2014,然后回车,效果一模一样。“a”就代表年度数据。
2.2 导入数据:从Excel到Eviews
数据通常都在Excel里。最简单的方法是:在Eviews中点击 Quick -> Empty Group,会打开一个空的数据组窗口。然后,回到你的Excel表格,选中包括变量名在内的所有数据(比如A1到G31,共7列30行),按 Ctrl+C 复制。再回到Eviews那个空的数据组窗口,鼠标点击左上角第一个格子,按 Ctrl+V 粘贴。Eviews会自动识别列名作为序列名。粘贴后,关闭这个数据组窗口,你会发现在工作文件窗口里,已经出现了 Farming, Labor 等7个序列对象了。
2.3 跑一个“全家福”回归模型
现在,我们把所有可能的因素


2万+

被折叠的 条评论
为什么被折叠?



