pangu-weather-verify

本项目将提供一套简洁有效的流程来对盘古气象模型以及 ECMWF、GFS 的预报效果进行检验对比，以验证盘古模型在真实气象场中的预报效果。

背景

根据华为盘古气象模型团队在 arxiv 和 nature 发表的论文显示，其模型准确率已经超越了 ECMWF 的 IFS 模型，但是这些论文中的检验结果都是在人工构造的理想化气象场中（ERA5）进行的，因此我们需要在真实的气象观测场中对盘古气象模型进行检验，以验证其在真实气象场中的准确率。

得益于盘古气象模型团队将其模型开源，我们可以在自己个人电脑上搭建盘古气象模型进行预报检验，开源仓库地址。

数据来源

本项目的所有数据均来源于互联网上的公开数据集，且数据获取的方式合理合法、公开透明。

SURF 观测站数据

本项目将使用中国大陆地区在中央气象台网站上公布的2167个站点的观测数据作为检验的真值。观测站点信息来自于中国气象数据网，原始站点表格下载地址，在项目中站点列表（csv文件）对原始列表做了一些经纬度表示方法的转换，主要是将度分秒表示法转换为十进制表示法，以便于后续处理。本项目以爬虫的方式抓取中央气象台网站上的观测站点数据，受网络环境影响，在实际运行中抓取的数据无法保证100%完整，会有个别站点数据缺失，属于正常现象。

ERA5 再分析数据

本项目使用的 ERA5 再分析数据作为盘古模型推理的原始输入数据，ERA5 数据集是免费公开的，但获取数据需要用户在 cds 网站上注册账号，并获取自己的 api_key 才能进行下载，本项目不提供测试 api_key。

ECMWF 预报数据

ECMWF 的预报产品有多种品类，本项目使用的是其中对外免费公开的实时预报数据集，获取渠道可以参考这里。本项目中 ECMWF 的实时预报数据作为盘古模型的对比预报数据（陪跑），用于对比盘古模型的预报效果。

GFS 预报数据

我们使用 0.25 度分辨率的 GFS 预报数据作为另一个陪跑的对比预报，GFS 的获取链接：这里。

使用方法

本项目不作为 pip 包分发，您需要将本项目代码克隆到本地。

$ git clone https://github.com/Clarmy/pangu-weather-verify.git

建议使用 conda 创建虚拟环境：

$ conda create -n pwv -y python=3.8
$ conda activate pwv

有一些包我们从 conda 进行安装会方便一些：

$ conda install -y -c conda-forge pygrib

其他包我们可以直接使用 pip 进行批量安装：

$ pip install -r requirements/cpu.txt # CPU 版本
$ pip install -r requirements/gpu.txt # GPU 版本

将本项目以包的形式安装：

$ python setup.py install

配置 cds 的 api_key，先将自己的 api_key 填入 pwv/secret.toml.template 文件中：

cds_api_key = 'xxxxx:d76c469b-xxxx-yyyy-zzzz-fac92ea9f5f8'

然后将 pwv/secret.toml.template 改名为 pwv/secret.toml 即可完成配置。

下载模型文件：

pangu_weather_1.onnx: Google云盘/百度网盘
pangu_weather_3.onnx: Google云盘/百度网盘
pangu_weather_6.onnx: Google云盘/百度网盘
pangu_weather_24.onnx: Google云盘/百度网盘

我们需要将模型文件存放在 pwv/static 目录下，static 内的文件结构如下：

.
├── pangu_weather_1.onnx
├── pangu_weather_24.onnx
├── pangu_weather_3.onnx
├── pangu_weather_6.onnx
└── station_info.csv

如果您只想做一次测评，可以执行任务：

$ python pwv/main.py

剩下的交给时间即可，最终结果在当前目录会新建一个 resullts 的目录，目录内生成两个文件: compare-*.csv 和 verification_results-*.json，其中 compare-*.csv 存储的是三套预报以及观测数据在每个观测站点上的对比列表。verification_results-*.json 存储的是每个观测站点上的检验指标结果。

如果您想每小时做一次测评，可以执行任务：

$ python scheduler.py

以下是一次测评的结果 verification_results-*.json 文件的内容：

{
    "pangu": {
        "temperature": {
            "rmse": 2.7101,
            "mae": 2.0384,
            "accuracy_ratio_within_1deg": 32.3782,
            "accuracy_ratio_within_2deg": 59.0735,
            "accuracy_ratio_within_3deg": 78.51
        },
        "wind": {
            "speed_rmse": 1.7176,
            "speed_mae": 1.2681,
            "speed_accuracy_ratio_within_1ms": 51.1939,
            "speed_accuracy_ratio_within_2ms": 79.6084,
            "speed_accuracy_ratio_within_3ms": 93.2187,
            "scale_stronger_ratio": 36.0554,
            "scale_weaker_ratio": 25.5014,
            "scale_accuracy": 38.4432,
            "speed_score": 0.7185,
            "direction_score": 0.4326
        },
        "init_time": "2023-07-11T16:00:00+00:00",
        "forecast_hour_delta": 119
    },
    "ecmwf": {
        "temperature": {
            "rmse": 2.6694,
            "mae": 2.0125,
            "accuracy_ratio_within_1deg": 31.7574,
            "accuracy_ratio_within_2deg": 60.9838,
            "accuracy_ratio_within_3deg": 78.7966
        },
        "wind": {
            "speed_rmse": 1.6073,
            "speed_mae": 1.1812,
            "speed_accuracy_ratio_within_1ms": 52.9131,
            "speed_accuracy_ratio_within_2ms": 84.4317,
            "speed_accuracy_ratio_within_3ms": 94.2216,
            "scale_stronger_ratio": 34.8615,
            "scale_weaker_ratio": 24.4508,
            "scale_accuracy": 40.9742,
            "speed_score": 0.7326,
            "direction_score": 0.456
        },
        "init_time": "2023-07-16T00:00:00+00:00",
        "forecast_hour_delta": 15
    },
    "gfs": {
        "temperature": {
            "rmse": 3.2771,
            "mae": 2.5773,
            "accuracy_ratio_within_1deg": 22.6361,
            "accuracy_ratio_within_2deg": 46.4183,
            "accuracy_ratio_within_3deg": 66.8099
        },
        "wind": {
            "speed_rmse": 1.6419,
            "speed_mae": 1.2061,
            "speed_accuracy_ratio_within_1ms": 54.0115,
            "speed_accuracy_ratio_within_2ms": 81.4231,
            "speed_accuracy_ratio_within_3ms": 93.362,
            "scale_stronger_ratio": 35.9121,
            "scale_weaker_ratio": 21.5377,
            "scale_accuracy": 42.5979,
            "speed_score": 0.7402,
            "direction_score": 0.4563
        },
        "init_time": "2023-07-16T12:00:00+00:00",
        "forecast_hour_delta": 3
    },
    "observation_datetime": "2023-07-16T15:00:00+00:00"
}

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
pwv		pwv
requirements		requirements
.flake8		.flake8
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
scheduler.py		scheduler.py
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

pwv

pwv

requirements

requirements

.flake8

.flake8

.gitignore

.gitignore

LICENSE

LICENSE

README.md

README.md

scheduler.py

scheduler.py

setup.py

setup.py

Repository files navigation

pangu-weather-verify

背景

数据来源

SURF 观测站数据

ERA5 再分析数据

ECMWF 预报数据

GFS 预报数据

使用方法

About

Releases

Packages

Languages

License

Clarmy/pangu-weather-verify

Folders and files

Latest commit

History

Repository files navigation

pangu-weather-verify

背景

数据来源

SURF 观测站数据

ERA5 再分析数据

ECMWF 预报数据

GFS 预报数据

使用方法

About

Resources

License

Stars

Watchers

Forks

Languages