- R 설치
- R 활용 시각화(산점도, boxplot 차트)
- 자료형 factor
- list
- 매출액 분석
- summay(mtcars) 분석
- dataframe
- 데이터프레임 만들기
- iris 데이터셋
- 공공데이터(csv)파일 불러오기
- 기술통계(summary)
- 빈도수계산(factor, table)
- 매트릭스
- 빈도수분석(설문지에서 많이 나온 단어수로 이슈 찾기)
- 데이터프레임
- 공공데이터를 이용한 데이터프레임 처리(조건, 계산)
- character를 factor로 변환
- 컬럼명 정리
- 필요한 컬럼만 모아서 별도의 데이터셋 제작
- 조건에 맞는 자료만 필터링 해서 새로운 데이터셋 제작(subset)
- 자료셋을 새로 제작해서 csv로 저장
- NA(결측치)개수 시각화 / 기술통계 plot창 해석
- 공공데이터를 이용한 데이터프레임 처리(조건, 계산)
- 탐색적 데이터 분석(EDA)
- 패키지 활용(say)
- 종업원의 팁 계산
- 자료파악 : 변수의 성격과 해설
- 가설과 검증(귀무가설/대립가설)
- 평균구하기(colMeans)
- 데이터의 성별, 인원수 이슈 확인 -> 성별과 인원수의 상관관계
- 산점도그래프(plot)
- 피어슨상관계수(cor)
- 상관분석(Correlation)
- 인공지능/머신러닝
- 이상치(boxplot)
- 스케일링(scale)
- 데이터 전처리
- 자료 오류 확인(결측치 확인/시각화)
- 장바구니 분석
- 지지도/신뢰도/향상도
- 매트릭스차트/네트워크차트
- R 활용한 유통 데이터 분석 및 실시간 추천 실습
- 그룹별 구매 패턴 분석
- 워드클라우드
- 데이터프레임
- 데이터프레임 만들기
- 외부 데이터를 이용하여 데이터 프레임 만들기
- 데이터 확인 및 컨트롤하기
- 데이터 확인
- 데이터 컨트롤
- 데이터 전처리
- 데이터 가공하기
- 조건에 맞는 데이터만 추출하기
- 필요한 변수만 추출하기
- 함수 조합하기, 일부만 출력하기
- 순서대로 정렬하기
- 파생변수 추가하기
- mutate()에 ifelse() 적용하기
- 추가한 변수를 dplyr패키지에 활용
- 집단별로 요약하기
- 데이터 합치기
- 가로로합치기 / 세로로 합치기
- 데이터 정제
- 결측치 정제하기
- 이상치 정제하기
- 그래프 만들기
- 산점도(변수 간 관계 표현)
- 평균막대그래프(집단 간 차이 표현)
- 빈도막대그래프
- 그래프 만들기
- 선그래프
- 시계열그래프
- 상자그림(boxplot)
- 데이터 분석 프로젝트
- welfare(한국복지패널데이터) 분석
- 텍스트 마이닝
- KoNLP 설치/테스트
- 텍스트마이닝
- 워드클라우드
- 국정원 트윗 텍스트 마이닝
- 대통령 4명의 연설문 워드클라우드 키워드 빈도 분석
- 지도데이터
- 미국 주별 강력 범죄율 단계 구분도 생성
- 대한민국 시도별 인구, 결핵 환자 수 단계 구분도 생성
- 인터랙티브 그래프
- 인터랙티브 시계열 그래프
- JDBC이용한 오라클 접속 및 데이터 입력/수정/삭제
- 웹스크래핑
- 1.웹 스크래핑 대상 URL 할당
- 2.웹 문서 가져오기
- 3.특정 태그의 데이터 추출
- 4.데이터 정제
- 5.데이터 프레임 만들기
- 오픈 API 기반 자료수집