Python数据可视化:2018年北上广深空气质量分析(附完整代码)

640?wx_fmt=jpeg


法纳斯特,Python爱好者,喜欢爬虫,数据分析以及可视化。


就在这周偶然看到一个学弟吐槽天津的空气,不禁想起那段厚德载雾,自强不吸的日子。


无图无真相,下图为证。


640


左边的图是去年2月份的时候,这样的空气真的难得一见!


右边的是吐槽以及我个人第一次买口罩!!!


口罩用的还行,因为那个时候做课设,经常要两个校区跑,基本上空气不好我就会带上。


题目好像是有关液压及气压的传动系统,手画A0图...


这应该是快两年前的事了,时光飞逝呐。


所以这回先对2017年天津的空气质量情况进行分析,然后再是北上广深。



/ 01 / 网页分析


640


网站没有反爬,所以直接抓取信息就好了。


看见没有,妥妥的严重污染,2016年12月份买的口罩派上用场啦!


这里简单给大家科普一下有关AQI,PM2.5的知识。


640


640


又是重操旧业,我的PPT水平还是很水呢~



/ 02 / 数据获取

获取代码如下所示。


 
 

import time
import requests
from bs4 import BeautifulSoup

headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'
}
for i in range(113):
    time.sleep(5)
    # 把1转换为01
    url = 'http://www.tianqihoubao.com/aqi/tianjin-2017' + str("%02d" % i) + '.html'
    response = requests.get(url=url, headers=headers)
    soup = BeautifulSoup(response.text, 'html.parser')
    tr = soup.find_all('tr')
    # 去除标签栏
    for j in tr[1:]:
        td = j.find_all('td')
        Date = td[0].get_text().strip()
        Quality_grade = td[1].get_text().strip()
        AQI = td[2].get_text().strip()
        AQI_rank = td[3].get_text().strip()
        PM = td[4].get_text()
        with open('air_tianjin_2017.csv''a+', encoding='utf-8-sig'as f:
            f.write(Date + ',' + Quality_grade + ',' + AQI + ',' + AQI_rank + ',' + PM + ' ')


成功获取数据。


640



/ 03 / 天津


同样不上源码,这里有必要说一波,因为我觉得源码放上去排版就不好看了...


其次我要秉承以前混迹P圈(PPT)得到的优良传统,热爱分享,百度云盘你值得拥有。


所以公众号回复天气。即可获取全部可视化源码及相关文件。


以前天天去下载PPT大神的大作,然后观摩,可惜的是PPT水平还是那么菜~


01  AQI全年走势图


640

92.5是年均AQI值,从上面科普知识里可以知道,2017年天津整体空气质量只能是「良」中的下下等水平,与轻度污染近在咫尺。


02  AQI月均走势图


640


从月均的走势图就能看出,1月的空气质量最差,8月的空气质量最好,当也并不是有多好,充其量也就是个「良」!


03  AQI季度箱形图


640


箱形图,显示一组数据分散情况资料的统计图。


数据里有最大值、最小值、中位数和两个四分位数。


这里可以看出,2017年天津的季度AQI均值差距不是很大。


但是一、二、四季度有明显的波动,空气质量有时会变得很差。


04  PM2.5全年走势图


640


59.87是年均PM2.5值,已经远超过国家二级标准限值35了。


其实天津给我留下的印象就是天气经常灰蒙蒙,时常还会变点颜色,比如黄色~


一年下不了几次雨,及其干燥。所以那个最低值11,我猜那时候估计是刮大风。


05  PM2.5月均走势图


640


和AQI的走势差不多,同样是1月最高,8月最低。


06  PM2.5季度箱形图


640


说实话,看了这个图,我不知道天津的「大哥」及「姐姐」们是如何做到自强不吸的。


基本上四个季度都超标了,一年不超标的估计也就那么几次。


07  PM2.5指数日历图


640


640


640


日均PM2.5国家二级标准为75,从上面的热力图看,基本上轻度污染过半了。


另外一月还是重灾区,天色黄黄的...


其实每逢雾霾,基本上就是待宿舍了。而且1月份是考试月,刚好窝宿舍预习课本~


08  天津全年空气质量情况


640


和「轻度污染占了大头,「」只能在角落里瑟瑟发抖,足以说明空气之差。


不过该上课还是要上课,谁叫那时宿舍和教室离得近(走过去5分钟不到)。



/ 04 / 北上广深


01  北上广深AQI全年走势图


640

北京月均AQI最低也就50左右,看来今年全年差不多都在「」以下了。


不过相比前几年,京津冀空气已经好了不少(政策),真的。


上海和广州差不多,深圳与北京算是鲜明对比。


02  北上广深PM2.5全年走势图

640


北京一如既往的高调。


03  北上广深全年空气质量情况


640


深圳几乎都是「优」和「良」,上海和广州和上面说的一样,北京的「优」已经不少了。


那么你所在的城市空气质量又是如何?


关注数据科学俱乐部公众号后回复天气即可获取全部源码。


640?wx_fmt=jpeg

最近热门文章


抖音小姐姐视频爬虫


OpenCV神技——人脸检测、猫脸检测


Python爬虫基础:验证码的爬取和识别详解


Python对象的身份迷思:从全体公民到万物皆数


利用深度学习建立流失模型(附完整代码)


协同过滤的原理及Python实现


多种方法爬取猫眼电影并分析(附代码)


用Python分析豆瓣,评分最低的演员原来是他


投稿邮箱:pythonpost@163.com

640?wx_fmt=gif

Python中文社区作为一个去中心化的全球技术社区,以成为全球20万Python中文开发者的精神部落为愿景,目前覆盖各大主流媒体和协作平台,与阿里、腾讯、百度、微软、亚马逊、开源中国、CSDN等业界知名公司和技术社区建立了广泛的联系,拥有来自十多个国家和地区数万名登记会员,会员来自以公安部、工信部、清华大学、北京大学、北京邮电大学、中国人民银行、中科院、中金、华为、BAT、谷歌、微软等为代表的政府机关、科研单位、金融机构以及海内外知名公司,全平台近20万开发者关注。

640?wx_fmt=jpeg

▼ 点击下方阅读原文免费成为社区会员

Python中文社区
关注 关注
  • 9
    点赞
  • 141
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
python大气数据分析_Python数据可视化2018北上广深空气质量分析
weixin_39605326的博客
02-03 903
有态度地学习就在这周偶然看到一个学弟吐槽天津的空气,不由想起那段厚德载雾,自强不吸的日子。html无图无真相,下图为证。ide 左边的图是去2月份的时候,这样的空气真的可贵一见!学习右边的是吐槽以及我我的第一次买口罩!!!网站口罩用的还行,由于那个时候作课设,常常要两个校区跑,基本上空气很差我就会带上。url题目好像是有关液压及气压的传动系统,手画A0图...spa这应该是快两前的事了,时光飞...
python分析数据走势_Python数据可视化2018北上广深空气质量分析
weixin_28921115的博客
02-10 409
有态度地学习就在这周偶然看到一个学弟吐槽天津的空气,不禁想起那段厚德载雾,自强不吸的日子。无图无真相,下图为证。左边的图是去2月份的时候,这样的空气真的难得一见!右边的是吐槽以及我个人第一次买口罩!!!口罩用的还行,因为那个时候做课设,经常要两个校区跑,基本上空气不好我就会带上。题目好像是有关液压及气压的传动系统,手画A0图...这应该是快两前的事了,时光飞逝呐。所以这回先对2017天津的空...
python数据可视化北上广深空气质量分析
03-29
Python数据可视化2018北上广深空气质量分析,作出AQI值走势图,以及PM2.5走势图,并对北上广深空气质量情况进行分析,得出优良天气占比。
python数据分析简介
最新发布
weixin_58425848的博客
09-20 1650
NumPy(Numerical Python) 是Python数据分析必不可少的第三方库,NumPy的出现一定程度上解决了Python运算性能不佳的问题,同时提供了更加精确的数据类型,使其具备了构造复杂数据类型的能力。是一个运行速度非常快的数学库,主要用于数组计算,包含:高性能科学计算和数据分析的基础包ndarray,多维数组,具有矢量(向量)运算能力,快速、节省空间矩阵运算,无需循环,可完成类似Matlab(商业数学软件)中的矢量运算用于读写磁盘数据的工具以及用于操作内存映射文件的工具。
爬取北上广深的全天气质量并制图分析
12-26
python网络爬虫爬取了2018截至到目前为止,北上广深这四个城市的空气质量的数据,并对此做出了分析,用python画图库,实现数据的可视化
python空气质量分析与预测_AQI(空气质量指数)分析与预测(一)
weixin_29045585的博客
01-30 4446
任务说明期望能够运用数据分析的相关技术,对全国城市空气质量进行研究与分析,希望能够解决如下疑问:哪些城市的空气质量较好/较差?【描述性统计分析空气质量在地理位置上,是否具有一定的规律?【描述性统计分析】临海城市的空气质量是否有别于内陆城市?【推断统计分析空气质量主要受哪些因素影响?【相关系数分析】全国城市空气质量普遍处于何种水平?【区间估计】怎样预测一个城市的空气质量?【统计建模】数据集描述我...
python空气质量分析报告_Python数据可视化2018北上广深空气质量分析
weixin_39678163的博客
12-15 1169
原标题:Python数据可视化2018北上广深空气质量分析作者:法纳斯特,Python爱好者,专注爬虫,数据分析可视化就在这周偶然看到一个学弟吐槽天津的空气,不禁想起那段厚德载雾,自强不吸的日子。无图无真相,下图为证。 左边的图是去2月份的时候,这样的空气真的难得一见!右边的是吐槽以及我个人第一次买口罩!!!口罩用的还行,因为那个时候做课设,经常要两个校区跑,基本上空气不好我就会带上。题目...
Python数据可视化2018北上广深空气质量分析
简书博客搬家测试账号
11-28 1238
感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定! 对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣的同学加微信:tstoutiao,邀请你进入数据爱好者交流群,数据爱好者们都在这儿。 作者:法纳斯特,Python爱好者,专...
2018北上广深空气质量数据爬取与可视化分析
"这篇资源是关于使用Python网络爬虫技术获取和分析2018北上广深四个城市空气质量数据的实践项目。作者通过爬取天气后报网站的数据,包括空气质量等级、AQI指数、PM2.5指数等,然后运用Python的数据分析可视化库...
Python数据分析练习:北京、广州PM2.5空气质量分析
08-18
这些知识点包括了数据的读取、数据清洗、数据分析数据可视化等方面,是Python数据分析实践中非常重要的内容。特别是在处理大量的环境数据时,使用pandas库进行数据处理将大大简化程序的编写,提高数据处理的效率。...
Python数据分析练习:北京、广州PM2.5空气质量分析(1)
热门推荐
xiexf189的博客
08-18 2万+
原创文章,通过一个PM2.5数据分析的案例,练习Python数据分析的技术,包括从csv文件中读取数据,使用pandas DataFrame对数据进行处理,数据可视化等技术。
python获取空气质量指数
04-07
利用python 爬虫工具,可以获取空气质量指数ppt和空气质量指数,
爬取全国空气质量监测网代码.py
05-28
爬取空气质量检测网的部分城市的历每天质量数据 思路----------------------------------------- 从某城市的空气质量网页获取某市每月的链接,再爬取每个月的表格数据。连云港市:https://www.aqistudy.cn/historydata/daydata.php?city=连云港 连云港20145月的空气质量:https://www.aqistudy.cn/historydata/daydata.php?city=连云港&month=2014-05 遇到的问题----------------------------------------- 获取的网页中的表格数据隐藏,尝试requests无法获取。判断可能是动态加载的网页 尝试----------------------------------------- 1. 通过XHR,js查找隐藏数据的加载网页,没有找到。 2. 使用phantomjs.get() result=pd.read_html ,可以获得隐藏的表格数据,但是并不稳定,只是偶尔出现加载的表格数据,无法大规模的获取 解决方法----------------------------------------- 查找资料得知这个网站的表格数据在Console里的items中, 使用selenium的webdriver.firefox(),driver.execute_script("return items") 数据可获得。 仍遇到的问题:----------------------------------------- 爬取一个网页可获得数据,但是连续的获取网页,会出现两个错误。 1.Message: ReferenceError: items is not defined 2.connection refused 解决方法: 1.connection refused问题,可能是网页开太多,使用driver.quit() 2. 如果 execute_script 还是出错,可尝试pd.read_html获取信息。之前用phantomjs获取的时候输出空的表格,可能由于加载不够,用 Waite直到table出现之后再获取网页 Element=wait.until(EC.element_to_be_clickable((By.XPATH,"/html/body/div[3]/div[1]/div[1]/table/tbody"))) 3.之后出现偶尔出现输出为空,使用循环,如果输出表格为空,再重新获取。 if len(result)>1: filename = str(month) + '.xls' result.to_excel('E:\python\案例程序\data\\' + filename) print('成功存入'+filename) driver.quit() else: driver.quit() return getdata(monthhref,month)
北上广深历史天气分析.ipynb
07-25
北上广深历史天气分析.ipynb
python空气质量分析与预测_python 空气质量AQI数据分析与预测 ---分析,相关系数矩阵...
weixin_36051235的博客
02-21 1124
#每天一点点#python 空气质量AQI数据分析与预测#四:数据分析#3:空气质量主要受哪些因素影响?点击可以查看 分析空气质量指标城市排名,临海城市是否优于内陆城市点击可以查看 分析:用到的库,数据集,数据清洗#相关系数分析data.corr() #相关系数矩阵分析,执行可看到任意两款之间的相关系数plt.figure(figsize = (10,10) #自己调节大小sns....
使用python及相关库实现AQI分析与预测
vin56的博客
06-01 1959
AQI分析与预测一、项目背景二、提出问题三、数据预览四、数据清洗五、数据分析六、总结 一、项目背景 AQI(Air Quality Index),即空气质量指数,用来衡量空气清洁或污染的程度。值越小,表示空气质量越好。近来因为环境问题,空气质量也越来越受到人们重视。 分析旨在通过采集到的国内各城市数据,运用数据分析相关技术,对全国城市空气质量进行研究与分析。 二、提出问题 空气质量较好/较差的城市是哪些? 空气质量在地理位置分布上是否具有一定规律性? 临海城市的空气质量是否有别于内陆城市? 空气质量主要
基于Python空气质量网络数据爬虫,构建面向深度学习数据预测的空气质量数据集
weixin_43408232的博客
12-31 5240
目录1.目标2. 思路3.算法3.1 算法流程3.2 开发环境4 核心代码4.1 Header伪装4.2 get_html_soup函数4.3 get_city_link_list函数4.4 get_city_historical_link_list函数4.5 get_pages_data函数4.6 main函数5 测试结果6 感想 1.目标 基于编制一个爬虫算法和程序,制作一个用于数据预测的数据集。 2. 思路 随着硬件的不断发展,计算机的算力得到不断地发展
python空气质量_python基础学习之空气质量可视化(六)数据可视化
weixin_39581964的博客
12-17 1468
本次使用jupyter lab 进行数据可视化import pandas as pdfrom pyecharts.globals import CurrentConfig, NotebookTypeCurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_LABimport pyecharts.options as optsfrom pyecharts....
Python分析上海的空气质量指数
cpzzy123的博客
07-28 1199
一.学习知识准备 在数据可视化分析中,按上篇文章,我们要学习numpy科学计算库以及matplotlip可视化分析,这边我用了request库下载了上海的空气质量指数的html文本,并爬取了数据进行json封装,因此我们也要学会从文本获取json数据并解析,然后需要构建numpy数组,用折线图显示出来 第一个知识点:request库 Requests 是⽤Python语⾔编写,基于urllib...
写文章

热门文章

  • 用 Python 对数据进行相关性分析 95966
  • 用 Python 进行多元线性回归分析(附代码) 93376
  • Python 调用 kafka 构建完整实例分析与应用 88609
  • Python 中删除文件的几种方法 68148
  • Java 10的10个新特性,将彻底改变你写代码的方式! 54985

最新评论

  • 基于LSTM的多变量多步预测模型

    dubinski: 求完整代码

  • 用 Python 实现 RSI 指标线与股价的顶背离、底背离

    m0_72805247: getpeaks函数16行明显失误:应该是data[f'{key}_lows']=data[f'{key}_lows']..fill().fillna(0),却被抄成了data[f'{key}_lows']=data[f'{key}_highs'].fill().fillna(0)

  • 用 python-docx 创建浮动图片

    eternal_moon: 浮空图片怎么样能嵌入在父级元素(para)里而不是生成在页面左上角?如果使用pos_x指定图片位置,我该如何预先获取指定para的坐标信息?

  • 用 Python 中的蒙特卡洛模拟预测股票收益

    lrypower: 博主,按你给的代码,这里的时间T好像有点问题,不管时间改长改短结果差异并不大,我把T改成1也差不多

  • 用 python-docx 创建浮动图片

    不染pigpig: 真的牛,解决了

大家在看

  • 活着就好20241023
  • 分支与循环:猜数字游戏的代码实现 1028
  • Subsequence Addition (Easy Version) 946
  • 图像基础知识
  • python之爬取豆瓣排行与可视化

最新文章

  • 朝夕光年困境:字节跳动游戏业务前途未卜
  • 收藏!35句提示词,数据科学的灵感源泉
  • Chatbot开发三剑客:LLAMA、LangChain和Python
2023年10篇
2022年36篇
2021年281篇
2020年276篇
2019年352篇
2018年291篇
2017年48篇

目录

目录

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳坪山网站建设公司大庆网站建设优化建站网站排名优化厂商定制张家港优化手机网站优化公司网站完善火2星寮步东莞企业网站优化技术门头沟专业网站优化百度优化网站策略网站优化推广效果怎么样资阳网站优化青浦区公司网站优化平台怎么做网站搜索引擎优化成都网站seo优化培训优化推广需要自己有网站吗郑州网站优化哪个最好怎么优化网站代码商丘外贸网站优化报价连云港网站搜索优化企业网站单页优化技巧教育网站视频加载优化许昌搜索引擎网站优化上排名推广seo教程网站优化北京网站建设优化公司哪家好推广型网站和优化型网站区别如何外贸网站优化延安优化网站关键词游戏行业网站优化策划给网站做优化刷活跃要收费吗贵阳正规的网站优化seo零售批发行业网站优化三明市网站排名优化香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声卫健委通报少年有偿捐血浆16次猝死汪小菲曝离婚始末何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言男子被猫抓伤后确诊“猫抓病”周杰伦一审败诉网易中国拥有亿元资产的家庭达13.3万户315晚会后胖东来又人满为患了高校汽车撞人致3死16伤 司机系学生张家界的山上“长”满了韩国人?张立群任西安交通大学校长手机成瘾是影响睡眠质量重要因素网友洛杉矶偶遇贾玲“重生之我在北大当嫡校长”单亲妈妈陷入热恋 14岁儿子报警倪萍分享减重40斤方法杨倩无缘巴黎奥运考生莫言也上北大硕士复试名单了许家印被限制高消费奥巴马现身唐宁街 黑色着装引猜测专访95后高颜值猪保姆男孩8年未见母亲被告知被遗忘七年后宇文玥被薅头发捞上岸郑州一火锅店爆改成麻辣烫店西双版纳热带植物园回应蜉蝣大爆发沉迷短剧的人就像掉进了杀猪盘当地回应沈阳致3死车祸车主疑毒驾开除党籍5年后 原水城县长再被查凯特王妃现身!外出购物视频曝光初中生遭15人围殴自卫刺伤3人判无罪事业单位女子向同事水杯投不明物质男子被流浪猫绊倒 投喂者赔24万外国人感慨凌晨的中国很安全路边卖淀粉肠阿姨主动出示声明书胖东来员工每周单休无小长假王树国卸任西安交大校长 师生送别小米汽车超级工厂正式揭幕黑马情侣提车了妈妈回应孩子在校撞护栏坠楼校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变老人退休金被冒领16年 金额超20万西藏招商引资投资者子女可当地高考特朗普无法缴纳4.54亿美元罚金浙江一高校内汽车冲撞行人 多人受伤

深圳坪山网站建设公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化