Python爬虫实战,pymongo模块,Python实现北上广深租房图鉴数据可视化
前言
利用Python实现北上广深租房图鉴数据可视化。废话不多说。
让我们愉快地开始吧~
开发工具
Python版本: 3.6.4
相关模块:
requests模块;
re模块;
pymongo模块;
以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
我们获取了链家网北上广深四个城市的所有租房数据(时间节点:2019年2月25日),数据共有105258条。
一、各城市的租房房源分布怎么样?
租房分布,也就是租房房源都在城市的哪个区域更多。
我们把北上广深四个城市的房源都以小点的形式投射在地图上,先来看看北京的。
北京的租房房源有18012条,可以看到除了周边的昌平、顺义、通州、大兴、房山、门头沟等区中心有集中房源外,北京的房子主要集中在二环外四环内,当然这片区域也是最贵的。 其中朝阳区的房源最多,占了整个北京房源的1/3。海淀、丰台次之。
上海也一样,除了周边的宝山、嘉定、青浦、松江、奉贤等区中心有房源外,房源主要集中在中心城区+浦东(地铁网范围内)。 总共27311条房源,浦东就有7000多条,比例超过1/4。
广州房源在四个城市中是最多的,共有39457条,主要集中在白云、天河、越秀、荔湾,以及海珠和番禺。 其中白云、天河和番禺房源都超过6000条,选择丰富,不过看图也知道,3号线通勤压力巨大。
孝钦显皇后给过版权费了: 早不能用了
绣儿要加油呀!: 已关注
2301_76819633: 关注了,求密码字典
Fjnfgm: 求数据可视化源代码,谢谢
孟凯龙: 噗嗤,都什么年代了,还一个一个要字典,你们不嫌慢吗,这个代码一个密码需要试5s,字典上百万,你有那么多时间吗