Skip to content

쉽게 시작하는 캐글 데이터 분석 (길벗) 소스코드 모음입니다.

Notifications You must be signed in to change notification settings

taehojo/getting_started_with_kaggle

Repository files navigation

<쉽게 시작하는 캐글 데이터 분석>

정오표

- 길벗 (시노다 히로유키 저/ 조태호 역)의 소스코드 모음입니다.

예스24, 교보문고, 알라딘, 인터파크


캐글 경진 대회 도전 1 : 타이타닉 생존자 예측하기

  1. 데이터 불러오기
  2. 데이터 개요 확인
  3. 데이터의 시각화
  4. 데이터 전처리와 특징값 생성
  5. 머신 러닝 모델의 실행
  6. [보충1] 타이타닉에는 어떤 사람이 승선하고 있었는가
  7. [보충2] 특정 클러스터에 주목해 보기

캐글 경진 대회 도전 2 : 주택 가격 예측하기

  1. 데이터 분석 준비
  2. 벤치마크용 베이스라인 작성하기
  3. 목적 변수의 전처리_목적 변수의 분포 확인하기
  4. 설명 변수의 전처리 _ 결측치 확인하기
  5. 이상치 제외하기
  6. 설명 변수 확인하기 _ 특징량 생성
  7. 하이퍼파라미터 최적화하기
  8. 여러 가지 머신 러닝 기법에 의한 앙상블
  9. [보충1] 통계 기법을 사용해 클러스터 분석을 해보자
  10. [보충2] 고급 주택의 조건을 분석하고 시각화하기

이 코드를 실행하기 위해 필요한 라이브러리와 각 버전은 다음과 같습니다.

  • graphviz 0.14.1
  • Jupyter 1.0.0
  • lightgbm 2.3.1
  • Matplotlib 3.2.2
  • NumPy 1.19.0
  • optuna 2.0.0
  • pandas 1.0.5
  • pydotplus 2.0.2
  • seaborn 0.10.1
  • scikit-learn 0.23.2
  • six 1.15.0
  • xgboost 1.1.1

About

쉽게 시작하는 캐글 데이터 분석 (길벗) 소스코드 모음입니다.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published