Skip to content

kfsky/Nishika_second-hand_apartment_price_forecast-

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 

Repository files navigation

Nishika_中古マンション価格予測

内容

テーマは国内の中古マンションの価格推定
データ内容
https://www.nishika.com/competitions/11/data

評価方法

  • 目的変数は、取引価格(総額)について常用対数をとった、「取引価格(総額)_log」
  • 予測精度の評価はMAE
  • テストデータの約50%により暫定スコアが計算され、残りの約50%により最終スコアが計算される

最終順位

Public:20位、Private:22位

フォルダ構成

input:データ格納フォルダ
notebook:前処理から予測までのnotebookを格納

方針

過去のコンペのSolutionを参考に、以下の様なフローで実施。
参考:Probspace Re:不動産取引価格予測コンペ
https://oregin-ai.hatenablog.com/entry/2020/08/11/200829

image

追加データ

特徴量

基本的な集計などを実施。
前処理に関しては、Baselineを参考に実施。
https://www.nishika.com/competitions/11/topics/79

  • CountEncoding
  • OneHotEncoding
  • OrdinalEncoding
  • aggregation("count", "sum", "mean", "max", "min")

model

1層目は二つのモデルを使用(seed averagingは使用せず)

  • LightGBM(kfold=5)
  • CatBoost(kfold=5)

2層目:DNN

反省点

  • GPUを使用できなかったので、学習に時間がかかる中、明確な方針を持って特徴量作成ができなかった。
  • trainデータが大きいためにメモリとの戦いだった。。。(ダウンサンプリングなどを実施してもよかった)
  • 期間が長い中で、実験方法含めてないことが多かった。
  • DNNの結果がずれるのが、不明でロス(seedは固定していたのに)

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published