本项目的任务是处理和分析中国各个城市的天气数据。具体任务分为以下几个步骤:
-
合并城市天气数据:
- 从文件夹中读取各个城市各个月份的天气数据。
- 将所有城市所有月份的数据合并到一个名为
cn_temperature.csv的全国天气数据表中。 - 数据表字段包括:
id,城市,日期,最高温,最低温,天气,风力风向,空气质量指数。
-
合并经纬度数据:
- 将中国城市经纬度表与
cn_temperature.csv合并,增加城市经纬度信息。 - 合并后字段包括:
id,城市,日期,最高温,最低温,天气,风力风向,空气质量指数,经度,维度。
- 将中国城市经纬度表与
-
数据清理和转换:
- 将数据中的日期列分割为日期和星期两列。
- 将风力风向列分割为风力和风向两列。
- 将最高温和最低温列去掉度符号并转化为数字类型。
-
计算温度统计:
- 计算每个城市每月的最高温、最低温和平均气温。
-
增加舒适度列:
- 根据最低温数据,增加一列舒适度信息。
- 其中18~25度为舒适,18度以下为较冷,25度以上为较热。
-
计算舒适天气天数:
- 计算每个城市每年舒适天气的天数。
为了完成上述任务,项目中可能会使用以下Python库:
- pandas:用于数据读取、处理和分析。
- numpy:用于数值计算。
- datetime:用于处理日期和时间数据。