查看: 87|回复: 0

全国AOI数据,POI边界数据2.0

[复制链接]

1

主题

1

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2022-12-16 18:38:55 | 显示全部楼层 |阅读模式
在之前我的一篇文章专栏中,为大家介绍了AOI数据,以及展示了部分AOI数据样例。
    不过后来有拿到数据的小伙伴问我,这个分类标准是什么呢,为什么和高德的分类标准不一样。AOI和POI不是一一对应的吗。针对这些问题,这里来做一下统一解答。
1、AOI和POI是一一对应的吗?

    要回答这个问题,还是要重新解释下POI和AOI是什么,之前很多小伙伴问我,你们的POI数据为什么没有路网呢,为什么没有建筑呢。面对这些问题真的是不胜其烦,POI里面的“P”就是“Point”的意思,也就是一个点,它仅包含了单组坐标。举个很简单的例子,比如下图中的国际投资大厦,他在地图上仅以一个图标和名称来标注其实际位置,这便是一个POI兴趣点。


    然后回头来说说AOI,AOI里的"A"是"Area"的意思,也就是兴趣面,它包含了很多组坐标组成的边界范围,它主要用于在地图中表达区域状的地理实体。下图中的蓝色虚线便是一个AOI数据。


官园公园AOI面
    因此,POI数据不包含路网,建筑等相关信息,它仅仅是一个代表着某一个单位的位置点。
    那么POI和AOI是不是一一对应呢,理论上是一一对应的,但实际上并不是,也不可能一一对应。比如一栋写字楼上的众多公司或组织,他们可能在地图上都有POI点信息,但是却不可能在地图上都有AOI面信息。因为在地图的二维平面上,写字楼实实在在就占据在那里,写字楼内部的公司或组织已经不可能达到再细化成AOI面的程度了。
    再比如街边的店铺、公交站、路标等,他们也都有自己的POI点信息,但是却不可能每个都有自己的AOI面信息,因为这些单位所占据的面积实在太小,没有细化成AOI面的意义了。
2、AOI数据长什么样子?
    AOI的数据主要来自三个平台,高德地图、百度地图和OpenMapStreet(OSM)地图,这里逐一展示下。
其一,OSM地图
    OSM地图的矢量数据是志愿者自行上传的,缺点是内容覆盖程度远远没有国内两大地图巨头来的丰富,且里面一些关键属性比如name很多为空,导致数据可用性不佳。
OSM数据展示


    当然优点是获取简单,因为是公开免费下载的,小伙伴可以自行去了解下。
其二,高德地图
    高德地图的AOI数据远比OSM的丰富,基本上是可以“变成AOI的POI都变成了AOI”,当然也不排除有遗漏的情况,毕竟数据采集工作非两三个人两三天就能完成的,它是一个漫长的过程。而且这个数据另外一大价值是,高德地图的住宅类AOI数据包含了这个小区的建筑年份、容积率、绿化率、房价等一系列属性。
高德数据展示


其三,百度地图
    百度地图的AOI丰富程度相比高德地图相当,或者说两个地图各有利弊,也存在“我有的你没有,你有的我没有”这种情况。但是相较于高德地图,百度地图的AOI数据则简单了一些。住宅类的数据中没有建筑年份、容积率、绿化率、房价等属性,但是个别城市或单位,尤其是区县级城市的数据中包含了这个AOI的所属街道,这是高德地图没有的。
百度数据展示


3、数据不准确怎么办

    很多在我这里拿到AOI数据的同学往往会问我,这个AOI边界不对啊,明明是正方形,你这为什么是长方形?要知道我并不是数据的生产方,我只是负责把数据从高德地图或者百度地图拿下来,至于他们为什么会把边界采集成这个样子我也不太清楚,大家发现错误后积极使用地图的纠错功能,帮助国内两大地图完善自有数据。

4、AOI数据怎么获取?
OSM地图
    这个上文提到,OSM数据已经公开免费下载,大家可以自行百度。
高德地图和百度地图
    首先国内两大地图巨头的开放平台中同样没有开放数据获取的API,不同于POI,POI数据可以通过其开放的web服务地名检索接口进行获取。
    这里需要重点强调一下,不管是高德地图还是百度地图,其用户说明里均写明了仅为用户提供接口调用的服务,用户不可以违规将数据保存在自己本地,否则当官方检测出短时间内用户接口进行了大量调用的时候,那么您的个人开发者账号很可能马上会被封停。
    再回头说一下数据获取,上文提到POI可以直接获取下来,但是AOI却不可以,只能运用爬虫技术去分析高德地图或百度地图网页上的数据查询逻辑,然后找到其规律,通过代码将其批量保存到本地。
   那么为什么这两个地图放在一起说呢,因为其爬取原理具有一定的相似性,首先每个POI都有其自己的唯一标识,也被称为主键。高德POI的主键是ID,内容一般为B0FFFKHNP0这种样子、百度POI的主键为UID,一般是8cba4bb0dcf02585ac0457ba这种。等获取到主键之后,再将主键作为参数去调用数据查询接口,然后将返回的结果保存到本地。
    也就是说,要想获取AOI数据,首先您得有一份POI数据,AOI数据获取的丰富程度取决于您的POI数据丰富程度。
    那么就衍生出一个问题,上文提到POI和AOI不是一一对应的,那岂不是有相当一部分POI的主键检索不到AOI?  答案是肯定的,2万条POI数据检索下来AOI或许也就1千条,相当于我投入2万块钱只回来1千块钱。但事实就是如此。

    不过好在数据获取途径是有的,多付出一点时间也没关系,但实际上并不是如此,就拿高德地图来说,高德地图有着出色的反爬机制,当您调用其AOI数据接口调用次数过多的时候,就会弹出滑块验证码让您验证,而这个滑块验证码经过我与高德地图漫长的斗智斗勇后发现,基本是无法攻破的,换言之,高德地图的AOI数据要想全量爬取下来,基本是不现实的,不过如果有小伙伴有思路了,可以私聊我,我们一起探讨下。

    但是百度地图不一样,百度地图的AOI检索接口没有验证机制,因此理论上可以无限调用直到AOI数据全部获取下来,但是我们知道检索AOI需要用到POI数据,但是百度地图的POI数据太难获取了,百度地图的个人开发者账号日用额度已经下降到了100次/天,也就说,获取一年您连一个小城市的POI数据都难全部获取下来,更何况每天调用次数超标之后,还有被封停的风险。
    总结一下,1、AOI数据需要先拿到POI数据,然后通过POI数据的ID去调用AOI数据查询接口,然后将接口返回结果保存下来。2、高德地图POI数据获取方便,AOI数据获取困难。3、百度地图POI数据获取困难,AOI数据获取方便。
   为大家贴两个都是我亲身验证过的,可行的数据获取方法链接:
百度地图
利用名称爬取百度AOI - 小岚子 - 博客园
高德地图
Python批量爬取高德AOI边界数据+GIS可视化(超详细)_ZYH@Smart3S的博客-CSDN博客_高德aoi
5、这篇文章为什么叫AOI2.0?
    在上篇文章中,我给大家展示了1.0版本的AOI数据,属性内容仅包含AOI的名称,分类等属性,且分类引用的第三方分类标准,非高德与百度自有的分类。因此很多小伙伴使用起来不方便,因此在2.0版本中,我直接将百度自有的分类引用到AOI数据中,并且将属性补充齐全,并且按照每一种分类进行了分组。


6、AOI数据全吗
    这也是一个大家经常问的问题,AOI数据全吗?也全,也不全,因为上文提到了AOI数据的获取逻辑,首先得有一份POI数据,而AOI数据的丰富程度取决于POI数据的丰富程度,因此不敢保证比如北京市的AOI数据就是百度地图上北京市所有的AOI数据,如果大家看到谁手上有全量的AOI数据,那基本就是两种可能:1,数据直接来自商业采购,购买的百度或者高德的数据;2,吹牛皮大王。但我相信本人手头上的POI数据相信原比各位要丰富,本人能获取到的AOI数据丰富程度也绝对是能够帮助各位完成论文、项目、课题的程度的,大家对于数据的丰富性可以不用怀疑。
7、AOI数据免费提供吗
    其实数据的获取方法在上文第4章中已经提到过,而且数据获取的方法也是本人亲身验证过可行的,就连本人现在的数据获取方法也是借用上面链接的思路进行代码再造得到,相信动手能力强的小伙伴可以自行去获取,但是肯定有一部分小伙伴不想再费心去学习了,这也可以理解,毕竟假设我是一个餐饮行业的,我想看看店开在哪里比较好,我为什么还要费心费力去学习代码呢,毕竟学了可能就用这一次,成本效益太低。
    对于此类小伙伴,可以联系作者本人了,作者本人提供的是有偿的数据提供服务,毕竟数据获取不易,里面本身就有一些时间成本、金钱成本、风险在里面,就拿POI数据来说,目前高德的免费额度为3000次/日,而单一个地级市就需要几万次的调用,因此不得不成为付费用户。AOI数据更是需要大量的时间来获取。
    但是即使如此,数据的价格肯定也是在大家能够承受的范围内,数据的主要受众群体还是广大的大学生,城乡规划从业者,换言之也是我的同事们,或者未来的同事,我很愿意看到大家进入城乡规划、地理信息这个行业,因此价格也在即使是一个学生也能承受的范围内。
8、可以提供技术指导吗
    从我这里获取数据的小伙伴们提供终身的技术指导,包括一些学术方面,技术方面的探究等,在我帮助你的同时,也可提高我自身的技术。
9、数据获取链接
链接:https://pan.baidu.com/s/16zAn0M-A-nMMsYLEnydVdg?pwd=1234
提取码:1234
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表