R에 이어서 판다스를 공부하고 있다.
R의 기초적인것은 다 배웠고, 그래프를 더 잘 다루기위해 RGraphicCookBook 이라는 오라일리의 책과 함께 판다스를 병행중이다.
chapter 1
- 딕셔너리 -> 시리즈 변환
- 시리즈 인덱스
- 시리즈 원소 선택
- 딕셔너리 -> 데이터프레임 변환
- 행 인덱스/열 이름 설정
- 행 인덱스/열 이름 변경
- 행 삭제
- 열 삭제
- 행 선택
- 열 선택
- 원소 선택
- 열 추가
- 행 추가
- 원소 값 변경
- 행, 열 바꾸기
- 특정 열을 행 인덱스로 설정
- 새로운 배열로 행 인덱스 재지정
- 정수형 위치 인덱스로 초기화
- 데이터프레임 정렬
- 열 기준 정렬
- 시리즈를 숫자로 나누기
- 시리즈 사칙연산
- NaN값이 있는 시리즈 연산
- 연산 메소드 사용 - 시리즈 연산
- 데이터프레임에 숫자 더하기
- 데이터프레임끼리 더하기
chapter2
- Csv 파일 읽기
- Excel 파일 읽기
- Json 파일 읽기
- 웹에서 표 정보 읽기
- 미국 ETF리스트 가져오기
- 구글 지오코딩 위치 정보
- Csv 파일로 저장
- Json 파일로 저장
- Excel 파일로 저장
- ExcelWriter() 활용
chapter3
- 데이터 살펴보기
- 데이터 개수 확인
- 통계함수
- 선 그래프 그리기
- 막대 그래프
- 히스토그램
- 산점도
- 박스 플롯
chapter4
- 선 그래프
- 차트 제목, 축 이름 추가
- 한글 폰트 오류 해결
- 그래프 꾸미기
- 스타일 서식 지정 등
- Matplotlib 스타일 리스트 출력
- Matplotlib 스타일 리스트 출력2
- Matplotlib 소개
- axe 객체 그래프 꾸미기
- 같은 화면에 그래프 추가
- 화면 4분할 그래프
- Matplotlib 스타일 리스트 출력3
- 면적 그래프 그리기
- 면적 그래프 그리기2
- axes 객체 속성 변경하기
- 세로형 막대 그래프
- 가로형 막대 그래프
- 2축 그래프 그리기
- 히스토그램
- 산점도
- 버블차트
- 그림 파일로 저장
- 파이 차트
- 박스 플롯
- titanic 데이터셋
- 회귀선이 있는 산점도
- 히스토그램/커널밀도함수
- 히트맵
- 범주형 데이터의 산점도
- 막대 그래프
- 빈도 그래프
- 박스 플롯/바이올린 그래프
- 조인트 그래프
- 조건에 맞게 화면 분할
- 이변수 데이터 분포
- 지도 만들기
- 지도 스타일 적용
- 지도에 마커 표시하기
- 지도에 원형 마커표시
- 지도 영역에 단계구분도 표시하기
chapter5
- 누락 데이터 확인
- 누락 데이터 제거
- 평균으로 누락 데이터 바꾸기
- 가장 많이 나타나는 값으로 바꾸기
- 이웃하고 있는 값으로 바꾸기
- 중복 데이터 확인
- 중복 데이터 제거
- 단위 환산
- 자료형 변환
- 데이터 구간 분할
- 더미 변수
- 원핫인코딩
- 정규화
- 정규화2
- 문자열을 Timestamp로 변환
- Timestamp를 Period로 변환
- Timestamp 배열 만들기
- Period 배열 만들기
- 날짜 데이터 분리
- 날짜 인덱스 활용
chapter6
- 시리즈의 원소에 apply() 적용
- 데이터프레임 원소에 applymap() 적용
- 데이터프레임에 apply(axis=0) 적용
- 데이터프레임에 apply(axis=0) 적용2
- 데이터프레임에 apply() 적용
- 데이터프레임에 pipe() 적용
- 열 순서 바꾸기
- 열 분리하기
- 불린 인덱싱
- isin() 필터링
- 데이터프레임 연결(concat)
- 데이터프레임 합치기(merge)
- 데이터프레임 합치기(join)
- 그룹 연산-분할
- 데이터 집계
- 그룹 연산 데이터 변환
- 그룹 객체 필터링
- 그룹 객체에 함수 매핑
- 멀티 인덱스
- 피벗테이블
chapter7
- 단순회귀분석
- 다항회귀분석
- 다중회귀분석
- KNN 분류 알고리즘
- SVM 모형
- Decision Tree 모형
- k-means 군집 분석
- DBSCAN 군집 분석