高德POI分类爬取,从未如此简单!
作者:快盘下载 人气:大家好,我是南南
POI想必是诸位常用的数据之一了,不知道大家是怎么获取的呢?
想必是和南南一样,用规划云比较多吧
但是规划云的局限性很大,因为他是用关键字搜索的,并且网页版工具抓取的POI数量在2000以下,不完全,可用作简单分析。
所以,我们真正需要的poi检索工具是可以根据类别进行获取的,下为我爬取的长春市餐饮poi
这就需要运用到另一个工具,python。很多粉丝会感到很难,因为不会写代码,这并没有关系,因为我也不会。
我只会抄代码,一般我这种人俗称——脚本小子
能用就行,有现成的干嘛要自己写,对吧
这里就要祭出我书签百宝箱之爬虫篇,百度高德POI数据获取程序
本项目来自github,下为项目地址
https://github.com/liujiao111/poi
该项目提供了百度高德poi获取程序,并支持自动转换为WGS84坐标系,目前我只尝试了高德地图的poi爬取程序,该作者提供了省poi爬取,矩形选区poi爬取,市poi爬取
使用方法非常简单,执行命令python app.py 即可开始爬取数据,不过由于范围大小、以及POI数量多少不一样,爬取花费的时间也不一样,范围越大,POI数量越多,花费的时间越长。比如爬取省的花费时间比爬一个城市花费的要长,爬取餐厅比爬图书馆花费的时间长。
当然,也需要一丢丢小的设置,比如输入你的key(自行前往高德开放平台申请),poi类型,以及城市(省份)
当然,不要忘了安装你所使用的包
pip install xxx
虽然该程序很棒,但是获得的poi结果也许并不是那么详细,这是由于高德地图的局限性导致的,商业地图软件中的poi一般为商家将自己的地址发布到地图上,有些商家会发布到百度地图,有些会发布到高德地图,有些不会发布(是真的不懂)
这里以我的大学长春建筑学院为例,这是我们学校的商业街,但全校却只有这一个poi点
下为我校对面的长春旅游学院,这个对比很明显。所以如果你需要精确的poi数据,我推荐你综合百度地图等商业地图的数据来进行处理
另外,在代码中的分类和城市须严格按照高德地图的分类编码表进行输入,当然作者也给我们提供了这些表格的excel 文件
POI分类编码表.xlsx高德地图城市编码表.xlsx关于源代码下载,我一向是不屑干那些转发集赞获取的事。秉承着授之以渔的理念,本号依旧不提供代码相关数据的下载服务,清大家自行前往GitHub进行下载
https://github.com/liujiao111/poi
加载全部内容