- 길벗 (시노다 히로유키 저/ 조태호 역)의 소스코드 모음입니다.
캐글 경진 대회 도전 1 : 타이타닉 생존자 예측하기
- 데이터 불러오기
- 데이터 개요 확인
- 데이터의 시각화
- 데이터 전처리와 특징값 생성
- 머신 러닝 모델의 실행
- [보충1] 타이타닉에는 어떤 사람이 승선하고 있었는가
- [보충2] 특정 클러스터에 주목해 보기
캐글 경진 대회 도전 2 : 주택 가격 예측하기
- 데이터 분석 준비
- 벤치마크용 베이스라인 작성하기
- 목적 변수의 전처리_목적 변수의 분포 확인하기
- 설명 변수의 전처리 _ 결측치 확인하기
- 이상치 제외하기
- 설명 변수 확인하기 _ 특징량 생성
- 하이퍼파라미터 최적화하기
- 여러 가지 머신 러닝 기법에 의한 앙상블
- [보충1] 통계 기법을 사용해 클러스터 분석을 해보자
- [보충2] 고급 주택의 조건을 분석하고 시각화하기
이 코드를 실행하기 위해 필요한 라이브러리와 각 버전은 다음과 같습니다.
- graphviz 0.14.1
- Jupyter 1.0.0
- lightgbm 2.3.1
- Matplotlib 3.2.2
- NumPy 1.19.0
- optuna 2.0.0
- pandas 1.0.5
- pydotplus 2.0.2
- seaborn 0.10.1
- scikit-learn 0.23.2
- six 1.15.0
- xgboost 1.1.1