2023年、大学4年生の時に、GCI 2023 Winterを受講した。GCIは、あらゆる分野で武器となるデータの解析・分析スキルを身につけ、一人前のデータサイエンティストとして活躍することを目指す講座である。GCIの講義を通して、Numpy、Pandas、Matplotlib、教師あり学習、教師なし学習、SQL、モデルの検証方法とチューニング方法、特徴量エンジニアリング、マーケティング基礎・応用を学んだ。また、コンペや最終課題では、講義を通して学んだことを生かし、自らの力で機械学習モデルを構築した。
- 内容:KaggleのTitanic: Machine Learning from Disasterのデータを用いて、タイタニック号乗船者の生死を予測する課題
- 順位:8位/1360人
- スコア:0.82535
- モデル:ランダムフォレスト
- 内容:KaggleのHome Credit Default Riskの一部のデータを用いて、債務不履行リスクを予測する課題
- 順位:9位/1085人
- スコア:0.76088
- モデル:LightGBM
- 内容:4つのデータセットから1つ選択し、データ分析と機械学習に基づく事業提案をプレゼンする課題
- 選択したデータセット:時系列解析が必要なデータセット