Skip to content
This repository has been archived by the owner on Apr 18, 2024. It is now read-only.

sh1nj1/2022_DL_competition_study

 
 

Repository files navigation

스터디 - 데이터 경진대회 참여하자

데이터 경진 대회에 참여하기 위한 풀 싸이클을 돌아 봅니다. 그것도 딥러닝으로. 그런데 도구로써의 딥러닝입니다. 심오한 수학이나 통계, 없습니다. 개발자 수준으로 가져다 쓰는 딥러닝 입니다.

그냥 데이터 경진대회 참여하려는데 이에 대한 가이드 혹은 도움을 드리는 스터디 입니다.

시간

격주 금요일 7시부터 9시까지

대상

코딩은 익숙. 파이썬... 맨코딩은 아니라도 가져다 쓸수 있는


진행 방법

실제 데이터를 가지고 딥러닝 코딩을 통해 대회에 참여하는 것을 목적으로 합니다. 대회에 참여한다고 해서 상위 입상을 목적으로 하지 않습니다. 그보다는 데이터 입수와 처리, 딥러닝 적용, 튜닝, 결과물 생성 등의 전체 흐름을 해보고 딥러닝 데이터 처리의 자신감을 얻고자 합니다. 심오한 딥러닝이 아닌 가져다 쓰는 도구의 관점으로 딥러닝을 대하려 합니다. 수식이나 통계 몰라도 됩니다. Spring 내부 몰라도 잘만 쓸 수 있잖아요. 아래 커리큘럼을 보시면 딥러닝에 대한 사항은 6차 중에 겨우 1차 뿐입니다. 가져다 쓰는 딥러닝입니다.

매 스터디 때에는 미션안내와 피드백을 스터디 리더가 진행합니다. 미션을 수행하기 위한 자료들은 일단 제공합니다. 자료 활용과 공부와 미션수행은 스스로 하는 것이고. 스터디 시간에는 진행된 것에 대한 피드백을 제공합니다. 모든 분에 대하여 피드백을 제공할 수는 없고, 두분 정도가 적당할 것 같습니다. 피드백 이후에 다음 미션에 대한 자세한 설명을 드립니다.

스터디에 참여하시고 미션의 설명을 듣고, 다음 스터디 때까지 전달된 자료를 가지고 미션을 수행하시고, 스터디 시에는 자신의 혹은 다른 분의 결과물에 대한 피드백을 받고. 실제 데이터를 가지고 대회에 참가하는 것인데, 스터디를 통해서 가이드를 혹은 도움을 받는 형태로 진행하는 겁니다.


커리큘럼

0차 : OT

진행방법 설명
자료 설명
1차 미션 설명

1차 : 기반 환경과 데이터 준비, 로딩

colab or kaggle vm
linux command
다양한 소스(kaggle, http, github, db, google drive, AWS S3)
다양한 포멧(zip, tar, npy, csv, xlx)

미션


2차 : 데이터 전처리, 시각화

데이터 전처리 : 결측치, 이상치, 코드성 데이터 인코딩, 정규화
pandas로 데이터 전처리
numpy로 데이터 전처리
데이터 시각화 : histogram, image 그리기, 선 그래프 그리기

미션


3차 : ML(머신러닝)으로

대회의 데이터를 가지고
SVM, Decision Tree, Gaussian Process, Random Forest, linear regression
classification, regression

미션


4차 : DL(딥러닝)으로

3차에서 ML로 했던 것을 DL로.
regression
classification

미션


5차 : 대회 출품

결과물 만들기
성능 개선
오버피팅 처리
데이터 증강
결과물 출품

미션


6차 : 개선 혹은 한번 더

성능 개선
혹은 다른 데이터로 한번 더

미션


학습 자료

material_index.md

About

데이터 경진대회 참가 스터디

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 99.4%
  • Other 0.6%