制图和机器:通过AI升级

前Apple Maps设计师Justin O’Beirne展示了由于使用了计算机视觉技术,在Google Maps上建筑物轮廓的覆盖范围和细节上的惊人增加。通过从卫星图像中提取建筑物轮廓以及从街景图像中提取地点和商业信息,Google生成了一组有关“感兴趣区域”的新数据,以显示在他们的地图上-这项工作需要人类花费几个月的时间才能完成。

计算机视觉帮助我们利用机器来了解世界。当我们走在街上时,周围有数百万个细节,一个人就能相当容易地理解它们。对于街道两旁的建筑物,我们知道它们有多少层,以及它们是否是企业,住宅楼,学校等。我们还了解车辆,并知道它们的行为会带来什么。

教机器“看”不是一件容易的事。计算机通过将每个像素分配到一个类别(通常称为语义分割)来解释图像。标记相似的像素簇形成图像的各个部分,每个部分代表一个不同的现实世界对象或特征。

这是一台训练有素的机器如何看待街道场景(不同的对象使用颜色编码)

一旦受过训练,计算机就能够处理甚至可能更重要的是,比人类以往任何时候都可以更快,更大规模地输出此信息。

虽然机器将能够完成大部分工作,但它们将无法完全自己完成工作。需要人工监督-首先,训练算法,然后检查结果并介入以纠正最困难的情况。这就是“循环中的人”方法的意思

当涉及到映射时,了解图像的内容只是过程的一半。另一半是找出被检测物体的地理位置。机器再次像人一样工作。

作为人类,我们需要立体视觉才能理解物体在太空中的位置。我们每只眼睛从略微不同的角度看到同一物体;换句话说,每只眼睛捕获一个单独的图像,其中可以看到相同的对象。这也是我们计算机视觉所需要的:在至少两个图像中记录同一对象,以便对其位置进行三角测量并在3D空间中对其进行重建。再次不同的是,计算机可以更快,更准确地执行此操作。

基于街道级图像的阿姆斯特丹街道3D重建

影像不仅由地图公司收集,而且还由城市,地方政府,道路当局,个人等收集。将它们集中在一起并使用计算机视觉进行处理,这意味着可以比以前更快地更新地图,从而满足了新鲜度,覆盖范围,准确性和高细节水平的要求。正如我的同事克里斯最近讨论的那样,机器将不是地理空间数据的唯一来源,但是让它们承担繁重的工作是唯一可扩展的方法。如果将人力投入到验证和调整细节以及培训机器上,将会更好地利用人力。

再一次参照O’Beirne,他说:“这是有趣的思考,这意味着什么,谷歌的竞争对手,仅收集数据已不再足够。现在,要与Google竞争,您还必须处理这些数据并从中获得新功能。”他提出了一个问题,即这对OpenStreetMap意味着什么。

我相信这意味着惊人的东西。使用计算机视觉处理的图像已可用于OpenStreetMappers。Google与OpenStreetMap之间的差距仍然很大,但是越来越多的公司支持者正在将资源投入OpenStreetMap(例如Facebook和Mapillary)。与积极进取,勤奋工作的社区相结合,他们很有可能制作出能够撼动当今地图巨头的地图。

You may also like...

发表评论