Skip to content

lima1016/data-modeling

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📊 Introduction to Analytics Modeling

R을 활용한 통계 분석, 머신러닝, 시각화를 중심으로 학습 중입니다.

🎯 목적

  • 강의 개념과 실습 코드 정리
  • 데이터 분석 결과 시각화
  • 학습 과정 기록 및 공유

📝 학습 내용

  • 회귀 분석: 표준 회귀 vs PCA 기반 회귀
  • k-NN: 최적 k 탐색 및 분류
  • CUSUM: 시계열 변화 탐지
  • 시각화: ggplot2로 결과 분석

📊 시각화 결과

1. Explained Variance by Principal Components

Explained Variance Plot
PCA의 주성분별 설명된 분산과 누적 분산을 시각화. 90% 이상 분산을 설명하는 주성분을 선택했습니다.

2. Comparison of Regression Coefficients

Coefficients Comparison
표준 회귀와 PCA 기반 회귀의 계수를 비교. 변수별 기여도를 직관적으로 확인할 수 있습니다.

3. Actual vs Predicted Crime Rate

Actual vs Predicted Plot
실제 범죄율과 두 모델의 예측값 비교. 대시선은 이상적인 예측선을 나타냅니다.

🛠️ 기술 스택

  • 언어: R
  • 라이브러리: ggplot2, caret, dplyr, kknn, reshape2
  • 도구: RStudio

📈 앞으로의 계획

  • 고급 모델링 기법 학습
  • 추가 실습 및 프로젝트 업로드
  • 코드와 시각화 개선

📚 참고

  • 강의: Introduction to Analytics Modeling
  • 데이터셋: uscrime.txt, credit_card_data-headers.txt, temps.txt

피드백이나 질문은 Issue/PR로 환영합니다!
학습이 진행됨에 따라 더 많은 분석과 시각화를 추가할 예정입니다.

About

R을 활용한 통계 분석, 머신러닝, 시각화를 중심으로 학습

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages