# 데이터 시각화 하기

- matplotlib - python에서 그리프를 그리기 위한 메인 라이브러리
- matplotlib.pyplot - MATLAB 스타일의 그래프를 그리는 서브 라이브러리
- import matplotlib.pyplot as plt - as는 별칭

참고자료
- https://matplotlib.org/
- https://datascienceschool.net/view-notebook/d0b1637803754bb083b5722c9f2209d0/
- https://wikidocs.net/2875
- https://www.scipy-lectures.org

Matplotlib Gallery Click
- https://matplotlib.org/gallery.html

## Matplotlib 그림의 구조

Matplotlib가 그리는 그림은 Figure 객체, Axes 객체, Axis 객체 등으로 구성된다. Figure 객체는 한 개 이상의  Axes 객체를 포함하고 Axes 객체는 다시 두 개 이상의 Axis 객체를 포함한다.  다음 그림은 이 구조를 설명하고 있다.

<img src="https://datascienceschool.net/upfiles/4e20efe6352e4f4fac65c26cb660f522.png" style="width: 50%">

Figure는 그림이 그려지는 캔버스나 종이를 뜻하고 Axes는 하나의 플롯, 그리고 Axis는 가로축이나 세로축 등의 축을 뜻한다. Axes와 Axis의 철자에 주의한다.

## 1. 선 그래프 그리기 (line plot)

### plot함수 : 값을 서로 연결해서 라인 형태의 그래프를 그리는 함수

In [None]:
# 1. 그래프 라이브러리 임포트
import matplotlib.pyplot as plt

# 2. 데이터 리스트를 plot 함수에 넣기
data = [1,2,3,4] # y축 값을 리스트로 저장
plt.plot(data) # data 리스트로 그래프 만들기
               # plot 함수는 값을 서로 연결해서 라인 형태의 그래프를 그리는 함수

# 3. 그래프 보여주기
plt.show() 

In [None]:
import matplotlib.pyplot as plt

ydata = [1,2,3,4] # y축 값을 리스트로 저장
xdata = [10,40,20,30] # x축 값을 리스트로 저장
plt.plot(ydata, xdata) # data 리스트로 그래프 만들기
plt.show() # 그래프 보여주기

In [None]:
import matplotlib.pyplot as plt

# (1,10), (10, 40), (4,30), (6,20)을 순서대로 연결한 그래프 만들기
plt.plot([1,10,4,6], [10,40,30,20]) 
plt.show() 

In [None]:
import matplotlib.pyplot as plt
x = range(0, 100)
y = [v*v for v in x]
plt.plot(x, y)
plt.show()

## 2. 그래프 꾸미기

### 1) 스타일 지정하기

- 색깔 : b / g / r / c / m / y / k / w
- 마커(데이터 위치 나타내는 기호) : . / , / o / v / ^ / s / + / * 
- 선 스타일 : - / -- / -. / :

In [None]:
import matplotlib.pyplot as plt
plt.plot([10,20,30,40], [1,4,9,16], 'rs--')
plt.show()

### 2) 제목 표현하기 - title 함수

In [None]:
import matplotlib.pyplot as plt

plt.plot([1,2,3,4])
plt.title('title')
plt.show()

### 3) 한글 표현하기

In [None]:
import matplotlib.pyplot as plt

#제목이 한글일 때 폰트 지정하기
plt.rc('font', family='Malgun Gothic') 

plt.plot([1,2,3,4])
plt.title('제목')
plt.show()

### 4) 여러개의 선 그리기

- 하나의 `plot` 명령이 아니라 복수의 `plot` 명령을 하나의 그림에 겹쳐서 그릴 수도 있다. 
- Matplotlib 2.0부터는 모든 플롯 명령에 `hold(True)`가 자동 적용된다.
- plt.hold(True) : 기존 그림 위에 겹쳐서 그린다. 
- plt.hold(True) : 겹쳐서 그리기를 종료한다.

In [None]:
import matplotlib.pyplot as plt

plt.plot([1,2,3,4])
plt.plot([4,3,2,1])

plt.show()

In [None]:
plt.plot([1,2,3,4], [1,4,2,5], 'r', [0,2,5,6], [1,2,3,6], 'g')  # 값을 바꿔보세요!
plt.show()

### 5) 범례 표시하기

- plt.plot(label = 레이블) : 레이블 설정
- plt.legend() : 범례를 표시

In [None]:
import matplotlib.pyplot as plt

#한 화면에 그래프 두개 그리기
plt.plot([1,2,3,4], label = 'type A') #레이블 설정
plt.plot([4,3,2,1], label = 'type B')
plt.legend() #범례를 그래프에 표시함

plt.show()

### 6) 범례 위치 정하기

- Location String : best / upper right / upper left / lower left / lower right / right / center left / center right / lower center / upper center / center

In [None]:
import matplotlib.pyplot as plt

#한 화면에 그래프 두개 그리기
plt.plot([1,2,3,4], label = 'type A') #레이블 설정
plt.plot([4,3,2,1], label = 'type B')
plt.legend(loc='upper right') #범례를 그래프에 표시함

plt.show()

### 7) 파일 저장하기

- plt.savefig(파일이름) : 원하는 이름으로 그래프를 저장

In [None]:
import matplotlib.pyplot as plt

#한 화면에 그래프 두개 그리기
plt.plot([1,2,3,4], label = 'type A')
plt.plot([4,3,2,1], label = 'type B')
plt.legend() #범례를 그래프에 표시함

plt.savefig('data.png') #원하는 파일 이름으로 그래프 저장

### 8) 그래프 크기 설정하기

- plt.figure(figsize=(가로,세로), dpi=해상도) : 그래프 크기 및 해상도 조절

In [None]:
import matplotlib.pyplot as plt
plt.figure(figsize = (4,2), dpi = 150) # 그래프 크기 및 해상도 조절

plt.rc('font',family='Malgun Gothic') # 한글 폰트설정
plt.plot([1, 2, 3, 4], label = 'type A')
plt.plot([4, 3, 2, 1], label = 'type B')

plt.title('제목') # 제목 넣기

plt.xlim(0,3) # x축 값 범위 : 0~3
plt.ylim(1,4) # y축 값 범위 : 1~4

plt.xticks(range(4),['가','나','다','라']) # x축 내용
plt.yticks(range(5)) # y축 내용

plt.xlabel('x축') # x축 레이블
plt.ylabel('y축') # y축 레이블

plt.legend() # 범례
plt.savefig('data.png') # 파일 저장

plt.show() # 그래프 보여주기

### 9) 한 화면에 여러 개의 그래프 그리기

- subplot 함수 : 그리려는 그래프 개수만큼 subplot을 만든다 
- .subplot(1,2,1)의 첫번째와 두번째 인자는 (행x열)을 의미, 즉 1x2(행x열)의 subplot을 생성 
- 세번째 인자 1은 생성된 두 개의 subplot 중 첫 번째 subplot임을 의미 

In [None]:
plt.subplot(1,2,1) #1행2열 중 첫 번째 subplot
plt.plot(range(100,10000), '_')  

plt.subplot(1,2,2) #1행2열 중 두 번째 subplot
plt.plot(range(100,1,-1), '_')
plt.show()