从2001年到2018年马德里的不同污染水平数据集

从2001年到2018年马德里的不同污染水平数据集

数据说明:

近年来,马德里在某些干旱时期的高污染迫使当局采取措施,限制在市中心使用汽车,并被用作对城市规划进行重大调整的理由。得益于马德里市议会公开数据网站,已经上传的空气质量数据可以公开获取。有几个文件可供使用,包括2001年至2018年登记的每日和每小时水平的历史数据,以及用于污染和其他颗粒物分析的站点列表。

然而,当从数据分析和时间序列的角度来探索这些数据时,我们发现这种格式在某种程度上令人困惑,而目并不常见数据集中的一些设计决策还远未达到最优水平:小时数据被拆分为月文件,其中包含不同格式的年文件,这些文件同样不常见:行是特定日期的特定度量,每个行包含24列(每天每小时一列》,其中包含一个控制字符。如果测量值有效则该控制字符为V,如果测量值无效,则大部分 (但不排除) 为N。

在探索历史数据时,这些障碍可能会破坏开放数据的目的,被公开审计,自由探索和用于实验。出于这个原因,在Decide中,我们发布了我们自己的数据版本,它使用通用标准和性能格式设计为易干使用。这样可以提供更快、更小更方便和更直观的结构化数据集。

所有数据都是从原始文件中提取出来的,并经过处理,以形成一种更方便的格式,用于典型的Kaggle用途。

原始数据包括不同列的小时数和不同行的测量值,这个版本的结构则相反:每行都有时间戳,列是某个站点在该时间点执行的不同测量值。这样可以更快地准备时间序列分析和预测任务。

该数据集将测站定义为更高层次:每个测站的历史可以从文件中单独提取,以供进一步研究。在每个观测站的DataFrame中,所有观测站在2001/01-2018/04期间记录的粒子测量值(如果在整个时间段内都是活跃的)。不是每个站都有相同的设备,因此每个站只能测量特定的颗粒子集。

数据来自网络收集整理,如有侵权请联系网站管理人员,及时删除!
探险家的数据窝 » 从2001年到2018年马德里的不同污染水平数据集

提供各类遥感影像数据服务

立即查看 了解详情