Skip to content
master
Switch branches/tags
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time
 
 
 
 
 
 
 
 
 
 
 
 

Quick, Draw! Doodle Recognition Challenge

本仓库是我在kaggle比赛Quick, Draw! Doodle Recognition Challenge的所有代码(带注释),有兴趣的可以看看,顺便给个star。另外本次比赛的详细总结(包括大佬们的top方案分析)见可我的博客

这个比赛于12.05早上结束,最终结果是排在69/1316、铜牌,离银牌区差4名,还是比较遗憾的。不过这是我第一次花大量时间和精力在图像分类问题上,作为一个novice能拿到牌还算满意。

代码组织结构:

  • shuffle_csv.ipynb对应的是博客2.1.1节,作用是将340个csv文件混合在一起然后再随机分成100份分别存储。
  • sketch_entropy.ipynb对应博客2.1.3节,用熵(entropy)来分析数据中的outliers。(本次比赛未实际应用)
  • xception.py对应博客2.2.1、2.2.2、2.2.3节,是本次比赛最后用的pytorch模型程序,依赖data_loader提供数据。
  • data_loader.py对应博客2.1.2节,作用是为xception.py提供数据。
  • bug.ipynp对应博客2.2.4节,是我在本次比赛遇到的一个教训。
  • rnn_model.py为我写的简单的RNN模型,由于准确率不高所以最后并没有使用,也放在这里留作参考。
  • keras_model文件夹为最开始使用的keras模型,后期未使用,留作参考。

另外输入文件组织如下:

- input
  - test_simplified.csv
  - sample_submission.csv
  - train_csv
    - airplane.csv
    - alarm clock.csv
    ...
  - shuffled_csv
    - train_100_1.csv.gz
    - train_100_2.csv.gz
    ...
    - train_100_100.csv.gz

其中shuffled_csv是经过shuffle_csv.ipynb处理得到的后续要使用的训练数据,其他的文件都可在比赛数据页下载。

About

kaggle Quick, Draw! Doodle Recognition Challenge 代码

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published