在本专栏的第六篇博文中,记录了如何用matlab进行多元回归分析。本篇则将使用spss软件达到同样的效果,且使用起来比matlab更为方便。
空谈理论,枯燥难懂。 话不多说,直接上例子。
为了简化分析,这里采用了三个变量:树干直径、树干高度、树干体积,树干体积和树干直径、高度有关。
在多元线性回归分析之前,有必要先对数据是否具有线性做个直观判断。(否则,一眼看出来不是线性就没必要线性回归了)。散点图是比较方便的办法。
图中可以看到,体积和直径线性关系很明显,和高度也有一定关系,因此继续进行线性回归分析。
分析->回归->线性 进入设置
勾选需要的参数:
模型汇总表:
R方代表线性拟合程度,越接近1越好; 德宾-沃森指数表示因变量之间的独立性,越接近2越好;
F越大,说明回归方程越显著; Sig即显著性,sig<0.05,则认为显著;
VIF(方差膨胀因子)
两个因变量共线性存在,即一个量几乎可由另一个量来近似表示,相当于两个变量只起到了一个变量的效果。
如果因变量y和自变量x线性效果不好,可以用逐步法来判断那几个x与y的线性特性显著。
在spss的参数设置页面,可以选择“前进”或“后退”,前进即从少到多,后退即从多到少。