R을 활용한 통계 분석, 머신러닝, 시각화를 중심으로 학습 중입니다.
- 강의 개념과 실습 코드 정리
- 데이터 분석 결과 시각화
- 학습 과정 기록 및 공유
- 회귀 분석: 표준 회귀 vs PCA 기반 회귀
- k-NN: 최적 k 탐색 및 분류
- CUSUM: 시계열 변화 탐지
- 시각화:
ggplot2
로 결과 분석
PCA의 주성분별 설명된 분산과 누적 분산을 시각화. 90% 이상 분산을 설명하는 주성분을 선택했습니다.
표준 회귀와 PCA 기반 회귀의 계수를 비교. 변수별 기여도를 직관적으로 확인할 수 있습니다.
실제 범죄율과 두 모델의 예측값 비교. 대시선은 이상적인 예측선을 나타냅니다.
- 언어: R
- 라이브러리:
ggplot2
,caret
,dplyr
,kknn
,reshape2
- 도구: RStudio
- 고급 모델링 기법 학습
- 추가 실습 및 프로젝트 업로드
- 코드와 시각화 개선
- 강의: Introduction to Analytics Modeling
- 데이터셋:
uscrime.txt
,credit_card_data-headers.txt
,temps.txt
⭐ 피드백이나 질문은 Issue/PR로 환영합니다!
학습이 진행됨에 따라 더 많은 분석과 시각화를 추가할 예정입니다.