このリポジトリは、データ分析コンペティションサイト"SIGNATE"の「ウェザーニューズ × SIGNATE: Weather Challenge:雲画像予測」( https://signate.jp/competitions/169 )にて入賞候補となった際に、最終審査用提出物として作成したファイルが元となっています。
当コンペティションの解法の概要を以下のページに記述しています。合わせて御覧ください。 https://signate.jp/competitions/169/discussions/3
当コンペティションは、現在でも以下のページから、データのダウンロードが可能です。 https://signate.jp/competitions/169/data
Windows10にて動作確認を行いました。 Python及び、各主要ライブラリのバージョンは以下のとおりです。
Python 3.6.9
tensorflow-gpu 1.14 numpy 1.17.3 pandas 0.25.3 opencv-python 4.1.1.26
上記のWebページからダウンロードしたZIPデータを展開し、
- testフォルダ
- trainフォルダ(add_met_data内の3つのファイルを正しい場所に追加したもの)
- inference_terms.csv
- sample_submit.csv
が存在するディレクトリ内で、
- preprocess.py
- train.py
- predict.py
の順番にpythonファイルを実行することで、提出フォーマットに沿った予測ファイルが生成されるようになっています。 (preprocess.pyを実行すると、PCの容量を数百ギガバイト消費します。 また、train.pyには、7つのモデルが含まれており、それらを全て実行するには数日の時間を要します。ご注意ください。)
preprocess.pyは、配布されたデータに対して前処理を行い、モデルの学習・予測に使用するデータセットを作成する処理を行うファイルです。
train.pyは、ディープラーニングモデルの学習を行い、学習済みのモデル情報をhdf5ファイルとして出力するファイルです。
predict.pyは、学習済みのモデルを使ってテストデータの予測を行い、提出用フォーマットに則ったファイルを出力するファイルです。
当コンペティションは、参加規約上で、参加者によるソースコードの公開が許可されています。(https://signate.jp/competitions/169#terms)