<따라 하며 배우는 데이터 과학> (2017) 소스코드
Switch branches/tags
Clone or download

README.md

<따라하며 배우는 데이터 과학> (2017) 소스코드

"Introduction to Practical Data Science (IPDS)" (2017)

책 웹사이트: https://dataninja.me/ipds-kr/

목차:

  1. 데이터 과학이란?
  2. 데이터 분석 환경 구성하기
  3. 데이터 취득과 데이터 가공: SQL과 dplyr
  4. 데이터 시각화 I: ggplot2
  5. 코딩 스타일
  6. 통계의 기본 개념 복습
  7. 데이터 종류에 따른 분석 기법
  8. 빅데이터 분류분석 I: 기본개념과 로지스틱 모형
  9. 빅데이터 분류분석 II: 라쏘와 랜덤 포레스트
  10. 빅데이터 분류분석 III: 암 예측
  11. 빅데이터 분류분석 IV: 스팸 메일 예측
  12. 분석결과 정리와 공유, R 마크다운
  13. 빅데이터 회귀분석 I. 부동산 가격 예측
  14. 빅데이터 회귀분석 II. 와인 품질 예측
  15. 데이터 시각화 II: 단어 구름을 사용한 텍스트 데이터의 시각화
  16. 실리콘 밸리에서 데이터 과학자 되기

사용 전에 깔아야 할 소프트웨어

코드 사용법: R

  • 컴퓨터에 git clone 클론해서 사용하세요.
  • 각 서브디렉토리는 RStudio 프로젝트입니다.
  • 각 서브디렉토리 안에 있는 *.Rproject 파일을 열면 R스튜디오 프로젝트가 열립니다.
  • *.R 파일들을 열어서 책을 따라 실행해 보세요.

코드 사용법: 파이썬

주피터 노트북을 notebooks 폴더에서 시작하면 됩니다. 자세한 내용은 https://dataninja.me/ipds-kr/python-setup 을 참조.

Credits

The gapminder data file notebooks/data/gapminder.tsv is copied from https://github.com/jennybc/gapminder/blob/master/data-raw/07_gap-merged-with-continent.tsv by Jennifer Bryan (NA). gapminder: Data from Gapminder. https://github.com/jennybc/gapminder, http://www.gapminder.org/data/, https://doi.org/10.5281/zenodo.594018.