白话空间统计二十四:地理加权回归(十)完结篇


地理加权回归写到这一章,一共是十章了,实际上从回归分析开始,写回归相关的博客一共写了接近20章(其中回归分析五章,番外四章,加上地理回归十章(包括这一篇))。

这一章名为完结篇,实际上应该在标题上加上第一季完结篇……因为后面可能在哪天想起来的时候,在写个三五篇,不过到时候就作为番外篇了。

最后一篇主要的内容就是GWR的扩展分析:莫兰指数的验证。

GWR的结果解读里面,最重要的指标就是标准化残差了,理论上来说,如果GWR模型没有问题的话,标准化残差应该处于完美的随机状分布。

……秀逗麻袋(日语)……虾神你不是一直在说,随机没有分析价值么?完美是什么节奏?

好吧,进入本完结篇的第一个议题:完美的随机。

在自然条件下,随机是最完美的结果,随机表示了机会均等,表示无规律,无法预测,表示一切都是平滑的。在没有外在影响力的情况下,理论上一切都应该是随机的。

像下面这个例子:

对全市所有的中学进行一次模拟考,考试优秀的学校记为红色,一般或者较差的学校记为蓝色,那么情况如下:

理想的状态,应该每个区域出现优秀的学校的机会都是均等的,随机就表示了机会均等,每个区域的都是一样的。但是实际状态是优秀的学校出现了明显的正相关聚集,这种聚集代表的是教育资源(或者生源质量)的不均等。

老子在几千年前就说过:天之道损有余而补不足。人道则不然,损不足,奉有余。资源、机会这种东西,最自然完美的实际上就是所谓的随机,大家机会均等,如天道一般,损有余,以补不足。但是现实中,也恰恰印证了人道的发展,损不足,奉有余。

所以理想中政府的一个重要职责,就是调节社会资源,所谓:天心不足,我心补之。

回到GWR,在GWR的结论中,标准化残差是分布在每一个地理位置上,那么最优的情况,就应该是呈现完美的随机分布。但是如果出现了聚集或者离散,多半模型或者是选择的解释因子出了问题。

我们继续看前面GWR的情况,判定数据分布最简单的工具,就是采用莫兰指数,下面对GWR之前做的结果进行莫兰指数,分析结果如下:

聚集趋势明显……超过90%的置信度……实际上看到这里,大家也都明白了,前面的GWR出现了问题,回过头来看看到底是啥问题。

实际上,在做OLS的时候,就已经表达出来了,只不过虾神我为了最后出这个效果,忽略了这个问题:

做OLS的时候,生成的诊断报告,对于字段O,也就是工业生产总值的信息,直接就没有通过零假设检验。这个值实际上是不能用在GWR回归里面的。

然后我们把这个值给remove掉,再进行GWR,来看看结果:(对比初始结果)

标准化残差的:在部分区域产生一定的变化,总体来说,修正之后,超出阈值的明显减少。

Local R平方的:整体的分布变化不大,但是local R平方的最大拟合度略有提升,但是整体数据

进行对比,结果如下:

GWR2的整体范围要大于GWR1。

然后进行空间自相关验证:

标准化残差分布为随机。

至此,GWR全部就写完了,以后说不定还有不定期的番外篇,暂时不列入写作计划,大家对GWR还有些啥疑问的,可以通过我的公众号获取邮箱,和我一起讨论。



转载自:https://blog.csdn.net/allenlu2008/article/details/74237225

You may also like...