GeoDa 软件——最佳的数据探索和统计

主页»软件» GeoDa 软件 – 最好的数据探索和统计

GeoDa 软件——最佳的数据探索和统计

最后更新:2022 年 4 月 28 日

Geoda探索你的Geoda很有趣。麻省理工学院、芝加哥和亚利桑那州等大学使用 GeoDa,因为它具有强大的空间数据分析、地理可视化和地质统计工具。所以这也是我们所做的。下面介绍如何从 Spatial@UChicago 下载 GeoDa 软件。现在,让我们看看新的和改进的 GeoDa 中的一些关键功能。

30 个 GIS 软件中排名第 21

GeoDa 属性表

测绘

分析

编辑

数据支持

我们的分数

3.4 星

GeoDa 的优点/缺点

与其他 GIS 软件应用程序相比,以下是使用 GeoDa 的一些优点和缺点。

优点
  • 现代界面和设计

  • 了解统计数据的数据探索

  • 带数据显示的地理模拟

  • 统计学专业

  • 免费和开源

  • 最先进的图形和图表输出

缺点
  • 缺少传统的地理处理工具

  • 不是成熟的 GIS 软件包

  • 缺乏高级功能编辑和捕捉

  • 因为它的重点是统计,所以缺乏各种GIS相关的工具

GeoDa 入门

巨达图像

GeoDa 具有直观的界面,可让您轻松添加多种文件格式,如 shapefile、GeoJSON、KML、SQLite 和表格格式(CSV、XLS 和 DBF)。

为了查看您的地理数据与空间的关系,GeoDa 提供了来自 Carto 和 Nokia 的各种底图。

如下图,这4个工具分别用于加载数据、保存为GeoDa工程(GDA)、关闭应用程序、打开属性数据。

geoda 菜单

与任何 GIS 软件类似,您可以自由调整列大小和移动列。您可以连接表格、查询观察结果以及以不同格式导出数据。

无需多说,但我们发现 GeoDa 使用起来非常简单。该界面是现代的,您可以在分析中快速动手。

GeoDa 属性表

阅读更多: 10 个免费 GIS 数据源:最佳全球栅格和矢量数据集

地理可视化和数据分类

这是 GeoDa 的特色之一——它的地理可视化工具。任何人都可以通过专题地图、制图和地图电影等形式的可视化手段从他们的数据中获得洞察力。

GeoDa 专题地图

实际上,在数据分类方面,您可以获得比 QGIS 和 ArcGIS 更多的选择。地图和比率下拉菜单为您提供了丰富的数据分类方法。

  • Themeless Map – 一个简单的单色地图
  • 分位数图——排列组,使它们具有相同的数量。
  • 百分位数图——以不同的百分位数显示数据(<1%、1-10%、10-50%、50-90%、90-99%、>99%)
  • Box Map – 四分位图,其中异常值的阴影不同。
  • 标准差图——每个标准差成为一个类。
  • 唯一值映射– 将值独特地分组到类别中。
  • Natural Breaks Map – 安排每个分组,使每个类别的变化更少。
  • Equal Intervals Map – 将类分成相等的组。
  • Rates-Calculated Map – 使用空间权重对数据进行分类。

阅读更多: 等值线图——数据分类指南

如果您不想使用这些类型的数据分类方法,那么 GeoDa 有一个类别编辑器工具供您以交互方式编辑数据中的自定义中断。巧妙之处在于它如何在您更改数据中的分界线时以交互方式生成直方图。

geoda 类别编辑器

制图工具用适当大小的圆圈来表示变量。例如,在这里我们看到美国的人口集群。

娃娃图

这也称为 Dorling Cartograms。然而,这些类型的制图的缺点是无法保持质心和形状。这意味着读者可能难以理解地图上的特征。如果我不告诉你,你可能甚至不知道这代表了美国人口!

阅读更多:制图地图:夸张的数据可视化

数据探索分析

在本节中,我们将使用圣路易斯地区县的凶杀案数量和比率来寻找一些统计关系。

我们将检查的三个主要变量是:

  • HR8488 – 每 100,000 人的凶杀率
  • PE87——人均警察支出
  • RDAC85 – 资源剥夺/富裕复合变量(生活在贫困线以下的家庭百分比,家庭收入中位数)

阅读更多:芝加哥大学样本数据集(大样本数据)

直方图

当您查看这张警察支出直方图时,您会发现各县的支出分布相对均等。

地理直方图

但是当你查看凶杀率的直方图时,它是正偏的。这意味着大部分数据的凶杀率都很低,但也有一些县的凶杀率极高。

地理直方图

箱形图

此箱线图显示每 100,000 人的凶杀案中位数约为 3.7 起。然而,有两个县的凶杀率确实很高。这两个县是圣路易斯市 (36.0) 和圣克莱尔 (20.2)。

geoda 箱线图

这两个观察结果在哪里?在标准差类型的地图中,我们在这里将凶杀率高于正常水平的两个县涂成红色。如您所见,它们的标准差比杀人率的平均值高出 3 个之多。

geoda 标准偏差

散点图

查看变量如何相互关联的最佳方法是什么?例如,资源剥夺/富裕复合变量如何与凶杀率相关?

好吧,我们可以将每个变量放在图表的 x 轴和 y 轴上,看看它看起来如何。这称为散点图。

geoda 散点图

线性回归曲线(红色直线)为我们提供了 0.276 的 r 平方值。另一条红色曲线是 LOWESS(局部加权散点图平滑器),它拟合这两个变量之间的平滑曲线。

那么这到底是什么意思呢?

这意味着,鉴于这 78 个观察结果,资源剥夺占凶杀率方差的 27.6%。虽然 r 平方为零的模型表示 0%,该模型无法解释围绕其均值的响应数据的可变性……这确实表明这两个变量(资源剥夺和凶杀率)之间存在部分关系。

但 GeoDa 并没有就此结束。如果您想查看一堆散点图如何相互关联,请使用散点图矩阵选择您想要的所有变量。

geoda 散点图矩阵

3D 散点图

对于 Geoda 的 3D 散点图,您将不得不认真思考。至少我做到了。这个工具的作用是在像这样的三维空间中绘制出三个独立的变量。

geoda 3d 散点图

它的好处是您可以将数据点投影到 XY 轴、XZ 轴或 ZY 轴。当您通过旋转 3D 散点图查看数据在每个轴上的外观时。此时,您将开始了解数据点如何悬浮在 3D 空间中。

气泡图

对于气泡图,您可以选择 X 和 Y 轴变量。除此之外,您还可以为气泡大小和颜色选择一个变量。这使您能够巧妙地形象化四个变量。

请注意 size 变量,因为它确实会影响您的图形。您可以右键单击图形并将气泡大小从小调整为大。我们在这里保持简单,并使用凶杀率作为大小。不出所料,两个红色的大泡泡就是圣路易斯市和圣克莱尔市。

geoda气泡图

平行坐标图 (PCP)

认识我最喜欢的新图表。

在平行坐标图中,每条线对应一个县,绘制了凶杀率、警察支出和资源剥夺情况。每个维度对应一个水平轴,每个数据元素显示为一系列沿维度/轴的连接点。

最右边的两条红线是凶杀率最高的县(圣路易斯市和圣克莱尔)。 PCP 右侧的一条红线代表圣路易斯市。圣路易斯市县不仅凶杀率最高,而且警察支出最多,资源匮乏程度最高。这张图确实将这三个变量放在了透视图中。

geoda 平行坐标图

总而言之,我完全被 GeoDa 中的数据探索工具所震撼。

让我们看看它如何使用更多基于地统计的工具。

在地理空间中寻找模式

此菜单的主要区别在于这些类型的分析是如何在地理空间中执行的。虽然直方图、散点图和气泡图只是分析数据,但接下来的几个工具可以了解县和属性在地理方面的相互关系。

这一切都始于在权重管理器中设置连续性。我将边界设置为通过蜂后或车的连续性彼此直接接触。这会影响连接到每个县的邻居数量。

这是显示女王连通性和邻居数量的直方图:

geoda queen 连通性

这是一个直方图,显示了rook 的连接性和邻居的数量:

geoda rook 连通性

如此相似,但又不同。 Geoda 为您提供了一张地图,以交互方式查看车和王后如何与邻居联系。喜欢这个功能。

geoda 数字邻居

莫兰散点图

因为我们已经设置了县之间的相互关系,莫兰散点图将考虑到这一点。

当 Moran's I 接近 +1 时,出现空间自相关。这意味着值聚集在一起。当 Moran's I 接近 -1 时,会出现空间自相关。棋盘是一个示例,其中 Moran's I 为 -1,因为不同的值彼此相邻。

Moran's I 的值为 0 通常表示没有自相关。在这种情况下,Moran's I 为 0.16,这意味着凶杀率并没有聚集在一起。

geoda moran 我的阴谋

空间自相关

当您选择 LISA Cluster 地图时,它将生成一个等值线图,显示重要的 Local Moran 统计数据。亮红色表示高相似值的聚类。蓝色县显示低-低值,表明低值聚集在一起。

geoda集群图

其余的灰色阴影表示没有显着关系。而高-低和低-高位置表示空间异常值。

最后,GeoDa 产生四个显着性水平——p < 0.05、p < 0.01、p < 0.001、p < 0.0001。

geoda lisa 显着性 p 值

GeoDa 还可以生成具有 EB 率的单变量、微分和局部 Moran's I。

局部 G 聚类图

最后一个工具是查看数据如何聚类的变体。在圣路易斯市中心,高凶杀率集中在中部。而在东北部,凶杀率要低得多。

geoda gi集群

想象一下这对房地产行业和那些想搬到圣路易斯的人有多大用处。在这种情况下, G*Clusters 映射生成相同的结果。

空间回归

如果您了解某个城市的凶杀率,则可以使用空间回归来了解犯罪模式背后的因素。为什么凶杀率集中在圣路易斯市中心?是警费吗?资源匮乏可以解释凶杀地点吗?

以下是回归模型中常用的一些术语。

  • 因变量 (Y) :您要预测什么。 (凶杀案发生地点)
  • 自变量(X) :解释因变量的解释变量。 (收入、教育等)
  • Beta 系数:反映解释变量和因变量之间关系的权重。
  • Residual : 模型没有解释的值

在我们的简单模型中,凶杀率是因变量。虽然我们试图用警察支出和资源匮乏来解释凶杀率的高低。

地理回归菜单

回归报告

我们的输出表如下:

地理回归报告

当您在我们的回归模型中替换每个系数​​时,这意味着资源匮乏和警察支出较高的地区在数学上会产生凶杀率。估计值的标准误差是预测准确性的度量。在回归线中,估计的标准误差越小,预测越准确。而 t 统计量是系数除以其标准误差。

另一个要记住的统计量是 Jarque-Bera 统计量,它指示残差(观察到的因变量值减去预测值)是否呈正态分布。当您将这些残差放入直方图中时,原假设是它们应该类似于钟形曲线。

此外,当多元回归模型中的两个或多个预测变量高度相关时,输出表还允许您测试多重共线性。计算出的 Moran's I 确定回归残差是否在空间上随机(空间自相关)。

GeoDa 中的其他选项是空间滞后模型和空间误差模型的最大似然估计。

阅读更多: GIS 中的空间自相关和 Moran's I

GeoDa 最后的想法

在 GeoDa 中浏览他们的一些示例数据时,您会有很多顿悟的时刻。它不仅可以作为非 GIS 用户对空间分析和统计的温和介绍,而且对那些试图学习统计的用户也很有用。

Luc Anselin 开始将 GeoDa 作为 ArcView 3.0 扩展。由于其受欢迎程度,它已被重新设计为自己的开源数据探索工具。

虽然 GeoDa 不一定是您的原型完整 GIS 包,但它拥有一系列令人兴奋的分析和地理可视化工具,适用于经济、卫生、房地产等行业。

您是否尝试过使用 GeoDa 测试您的地质统计学?在下面的评论部分让我们知道您的想法。

You may also like...