MachineLearningClass

머신러닝 수업·Kaggle InClass 대회 코드 모음

국민대학교 AI빅데이터융합경영학과 머신러닝(2023) 과정에서 수행한 팀 그룹과제(Salary 회귀·Pipeline) 와 KML Challenge 2023F(패널 설문 응답 예측) 작업을 프로젝트별 폴더로 분리해 정리하였다.

01_course_salary_regression: 독립변수로 임금(Salary)을 예측하며, 피처 엔지니어링부터 CatBoost·선형·트리/MLP Pipeline과 OOF·Voting 앙상블까지 sklearn Pipeline 기반으로 비교·구현하였다.
02_kml_challenge_2023f: 패널·설문 특성을 활용해 온라인 설문 응답 여부(STATUS)를 분류 예측하고, 피처 엔지니어링·튜닝·Hard Voting·OOF·DNN 앙상블까지 확장 실험하였다.

저장소 구성 (2개 프로젝트)

프로젝트	폴더	문제	평가 지표
수업 그룹과제	`01_course_salary_regression/`	설명변수 → Salary 회귀	RMSE
KML Challenge 2023F	`02_kml_challenge_2023f/`	패널·설문 매칭 → STATUS(응답 여부) 분류	Accuracy

01. Salary 예측 회귀 & sklearn Pipeline

목적

이전의 과제에서 다룬 임금 예측 문제에 대해, 피처 엔지니어링 → ColumnTransformer·Pipeline → OOF·Voting 앙상블까지 한 흐름으로 구현한다. CatBoost·선형모형·OneHot+트리/MLP 등 서로 다른 Pipeline 패턴을 비교한다.

주요 노트북

파일	내용
`01_feature_engineering.ipynb`	범주 인코딩·파생 변수·결측 처리
`02_modeling_oof_ensemble.ipynb`	OOF, Voting, 가중 평균 제출
`03_pipeline_catboost.ipynb`	CatBoost + Pipeline (PowerTransformer, OrdinalEncoder)
`04_pipeline_linear_models.ipynb`	Ridge / Lasso / ElasticNet Pipeline
`05_onehot_encoder_tree_mlp.ipynb`	OneHot + RandomForest·MLP 회귀

데이터

수업에서 제공된 데이터(X_train, y_train, X_test)는 저작권 문제로 미포함.

02. KML Challenge 2023F (설문 응답 예측)

목적

"각 패널에게 어떤 온라인 설문을 보내야 응답할까?" — 패널 인구·가입 설문(SQ/DQ), 설문 데이터(IR, LOI, TITLE, CPI 등)를 이용해 STATUS(응답 여부) 를 예측한다. feature engineering(응답률, 제목 토큰, KMeans·SHAP 등)·Hard Voting·OOF·하이퍼파라미터 튜닝·DNN 실험까지 확장하였다.

권장 읽기 순서

순서	노트북	설명
0	`00_official_baseline_v1.ipynb`	대회 공식 베이스라인(LGBM)
1	`01_baseline_v2_best_snapshot.ipynb`	v2 + SHAP·KMeans 요약 스냅샷
2	`02_feature_engineering.ipynb`	피처 생성(1218)
3	`03_tuned_models_hard_voting.ipynb`	튜닝 모델 + Hard Voting OOF
4	`04_reference_consolidated.ipynb`	팀 참고·정리본(다중 모델·가중 평균)
5	`05_dnn_ensemble.ipynb`	Keras Tuner + 앙상블 시도
6	`06_oof_hard_voting.ipynb`	OOF Hard Voting 변형
7	`07_voting_ensemble_minimal.ipynb`	Voting 최소 예제

notebooks/experiments/에는 동일 대회의 중간 실험본(Optuna, MinMaxScaler, Log 변환, 시각별 제출본 등)을 보관한다.

submission

02_kml_challenge_2023f/submissions/에 베이스라인·OOF Hard Voting 등 32개 제출 CSV를 저장하였다.

데이터

디렉터리 구조

MachineLearningClass/
├── README.md
├── requirements.txt
├── .gitignore
├── 01_course_salary_regression/
│   ├── data/
│   │   └── README.md
│   └── notebooks/
│       ├── 01_feature_engineering.ipynb
│       ├── 02_modeling_oof_ensemble.ipynb
│       ├── 03_pipeline_catboost.ipynb
│       ├── 04_pipeline_linear_models.ipynb
│       └── 05_onehot_encoder_tree_mlp.ipynb
└── 02_kml_challenge_2023f/
    ├── data/
    │   └── README.md
    ├── notebooks/
    │   ├── 00_official_baseline_v1.ipynb
    │   ├── 01_baseline_v2_best_snapshot.ipynb
    │   ├── 02_feature_engineering.ipynb
    │   ├── 03_tuned_models_hard_voting.ipynb
    │   ├── 04_reference_consolidated.ipynb
    │   ├── 05_dnn_ensemble.ipynb
    │   ├── 06_oof_hard_voting.ipynb
    │   ├── 07_voting_ensemble_minimal.ipynb
    │   └── experiments/          # 중간 실험 노트북 (10개)
    └── submissions/              # 대회 제출 CSV (32개)

기술 스택

Python: pandas, scikit-learn, category_encoders, LightGBM, CatBoost, XGBoost, Optuna, SHAP(일부 노트북), PyTorch/Keras(DNN 노트북)
R: (본 저장소에는 미포함)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MachineLearningClass

저장소 구성 (2개 프로젝트)

01. Salary 예측 회귀 & sklearn Pipeline

목적

주요 노트북

데이터

02. KML Challenge 2023F (설문 응답 예측)

목적

권장 읽기 순서

submission

데이터

디렉터리 구조

기술 스택

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
01_course_salary_regression		01_course_salary_regression
02_kml_challenge_2023f		02_kml_challenge_2023f
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Folders and files

Latest commit

History

Repository files navigation

MachineLearningClass

저장소 구성 (2개 프로젝트)

01. Salary 예측 회귀 & sklearn Pipeline

목적

주요 노트북

데이터

02. KML Challenge 2023F (설문 응답 예측)

목적

권장 읽기 순서

submission

데이터

디렉터리 구조

기술 스택

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages