PC PC
构建三因素回归模型
2017-07-27 10:27:19来源:中国城市建设网

值得注意的是,散点图呈现的3个因素和宜居性得分之间的两两关系,但是并不考虑这3个因素的相互作用。然而,在大中华区城市目前的发展阶段,我们预计3个因素,即人均地区生产总值、常住人口和第三产业占地区生产总值比重之间会有相互关系。

不同因素之间的相互关系使分析更为复杂。表4.1已提及,人均地区生产总值和第三产业占地区生产总值比重的相关性高达0.5382。在经济结构中,高人均地区生产总值水平往往与高第三产业占地区生产总值比重同时出现。这反映了城镇化过程和服务业增长是如何同时发生的。

4.1揭示的宜居性得分和人均地区生产总值的关联,不仅反映了人均地区生产总值对宜居性得分的直接影响,也反映了其通过第三产业比重而施加的间接影响。宜居性得分和第三产业比重的关联也是同样的情况。在理想情况下,保持除人均地区生产总值以外其他因素值不变的对照试验,可以清晰显示人均地区生产总值与宜居性得分的关系。

但是,对照实验在实际生活中通常是不可行的。不过使用多元线性回归分析可以同时考虑多个因素,帮助解决各因素相互关系的问题。应注意第4.2.1节中散点图呈现的关联情况在多元线性回归分析中可能发生变化,甚至可能被逆转。

作为一元线性回归分析的扩展,多元线性回归分析被用于评估多个自变量和单个因变量的关联。在这个案例中,宜居性得分是因变量,而人均地区生产总值,常住人口和第三产业比重是3个自变量。回归模型用方程4.1表示。

 (方程4.1)

在方程中,

L = 宜居性得分;

G = 人均地区生产总值;

P = 常住人口;

T = 第三产业占地区生产总值比重;

 =截矩项;

=人均地区生产总值回归系数;

=常住人口回归系数;

=第三产业占地区生产总值比重回归系数;

每个自变量的回归系数可解释为,在其他自变量不变的情况下,该自变量每发生一个单位变化时引起的宜居性得分变化。需用统计测试来评估每个回归系数是否显著。

PC