# ASHRAE - Great Energy Predictor III

Assessing the value of energy efficiency improvements can be challenging as there's no way to truly know how much energy a building would have used without the improvements. The best we can do is to build counterfactual models. Once a building is overhauled the new (lower) energy consumption is compared against modeled values for the original building to calculate the savings from the retrofit. More accurate models could support better market incentives and enable lower cost financing.

This competition challenges you to build these counterfactual models across four energy types based on historic usage rates and observed weather. The dataset includes three years of hourly meter readings from over one thousand buildings at several different sites around the world.

## 项目简单分析

- 项目简单描述：通过对各种能源（冷水、电、天然气、热水和蒸汽表）消耗的预测达到节约能源的目的（未采取措施 vs 采取措施），数据来源于1000栋建筑3年的数据；
- 预测单位：单栋建筑的各项能源消耗；
- 是否时间序列：是；
- 数据量级：三年×1000栋建筑；
- 特点：未采取措施的建筑能源消耗 vs 采取措施的建筑能源消耗；
- 评估函数：RMSLE(Root Mean Squared Logarithmic Error)；
- TIMELINE：2019年12月12日；

## 数据文件

- weather.csv:各个site每小时的天气信息，7M；
- building.csv:每个建筑的元信息, 40+K；
- train.csv:每个建筑每小时的读数信息，600+M；
- 测试文件大于训练文件；

## 字段描述

- train.csv:
  - building_id：建筑表的外键；
  - meter：资源代码{0: electricity, 1: chilledwater, 2: steam, 3: hotwater}，PS：不是所有建筑都有所有资源消耗的数据；
  - timestamp：读数时间；
  - meter_reading - 千瓦时的真实读数，注意这个是带有误差的真实数据；
  - test.csv：多一个row_id，少meter_reading；
  - 间隔是1小时；
- building_meta.csv：
  - site_id - 天气表的外键；.
  - building_id - 训练表的外键；
  - primary_use - 建筑主要活动、用途类别指标（离散型，应该有很大相关性）；
  - square_feet - 建筑总面积，不知道包不包含每层楼，如果包含，那么跟floor_count就有重复，如果不包含，可以考虑构建一个总面积的特征；
  - year_built - 建筑开始使用年份，越老越费电？？
  - floor_count - 楼层总数，预计线性关系；
- weather[train/test].csv（尽可能接近建筑的天气信息）：
  - site_id - 天气表外键；
  - air_temperature - 空气摄氏温度；
  - cloud_coverage - Portion of the sky covered in clouds, in oktas
  - dew_temperature - [露点温度](https://baike.baidu.com/item/%E9%9C%B2%E7%82%B9/1574011?fr=aladdin)摄氏度；
  - precip_depth_1_hr - Millimeters
  - sea_level_pressure - 海平面压力，Millibar/hectopascals；
  - wind_direction - 风向，0~360；
  - wind_speed - 风速，米每秒；
  - 间隔是1小时；