# Ch6-1. matplotlib

python에서 차트나 플롯으로 데이터를 시각화하기 위한 모듈로, 사용이 간편하고 다양한 그래프를 제공해서 많이 사용된다. 비슷한 모델로 seaborn과 bokeh 라는 모듈이 있다.  

그릴 수 있는 대표적인 그래프는 다음과 같다.
> line plot : 꺾은선 그래프  
scatter plot : 산점도  
bar plot : 막대 그래프  
histocram : 히스토그램  
box plot : 박스 플롯  

pandas의 객체에서도 메서드로 matplotlib의 함수를 사용할 수 있다. 굳이 임포트 하지 않더라도 판다스 내부적으로도 사용할 수 있는 편리함 때문에 많이 사용된다.  



## 기초 환경설정

`pyplot.rcParams` 를 이용한 폰트 설정 및 그래프 크기 설정

`rcParams["font.family"]` : 폰트 설정(특히 한글을 사용할 때 반드시 필요)  
`rcParams["font.size"]` : 글씨 크기 설정  
`rcParams["figure.figsize"]` : (x, y)꼴의 튜플로 그래프 크기를 설정  

## 쥬피터에서 그래프 그리기

쥬피터의 매직 키워드인 `%matplotlib inline` 을 이용하면 셀에 그래프를 직접 출력할 수 있다. 이를 사용하면 .show() 하지 않더라도 자동으로 그래프가 출력되고, 파일을 저장할 수 있다.  

쥬피터를 사용하지 않는 경우에는 plt.figure(), plt.show()를 사용해서 그래프 객체를 일일이 생성하고 저장해야 한다. 쥬피터에서는 한 셀에서 그래프를 그릴 때마다 하나의 객체가 생성되므로 그럴 필요가 없다.  
- 한 셀에서 plt 함수를 사용하여 그래프를 그리면 하나의 객체에 누적해서 그래프가 생성됨.  
- 그래프를 다 그린 후에는 plt.savefig(file, dpi)를 사용하여 그래프를 저장할 수 있다.  

쥬피터로 그릴 때 하나의 셀이 하나의 그래프와 대응된다는 점!
```
plt.scatter(x, y) #그래프1
plt.scatter(x+3, y+3) #그래프2
plt.savefig('fig1.png', dpi = 300)  # 저장할 때
```
라고 했을 때 한 셀에 그린 모든 것이 중첩이 된다. 겹쳐그리고 싶지 않으면 다른 셀에 그리면 된다. 
`%matplotlib inline`

## 자주 사용되는 색상 설정

입력 : 약어  
blue : b  
green : g  
red : r  
yellow : y  
black : k  


## 자주 사용되는 마커 및 선 스타일 설정

마커란 하나의 데이터 포인트(샘플)을 나타내는 기호를 나타낸다.  
선 스타일은 꺾은선 그래프의 선 스타일을 의미한다.  
![%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA%202022-07-31%2021.21.56.png](attachment:%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA%202022-07-31%2021.21.56.png)


## label 및 title 설정

label은 축의 이름을 의미하며, `plt.xlable`, `plt.ylabel` 을 사용하여 정의할 수 있다.  

`plt.xlable(label, **kwargs)` : label(string)으로 설정  
`plt.ylabel(label, **kwargs)` : label(string)으로 설정  

`**kwargs` : 텍스트의 특성을 설정하는 키워드를 말한다.  
fornproperies, fontsize, fontstyle 등등.  

title이란 그래프의 이름을 의미하며, `plt.title`을 사용하여 정의할 수 있다.  
`plt.title(label, loc)` : label(string)으로 설정, loc로 위치 지정(center, left, right)  



## tick 설정

tick 이란 그래프에서 나타내는 **눈금**을 의미하며, `plt.xticks`, `plt.yticks`를 이용하여 설정할 수 있다. 해당 눈금 위치에 붙일 라벨을 설정하는데, 길이는 각각 같아야 한다.  

`plt.xticks(ticks, labels)` : ticks(위치)에 labels를 입력(x축)  
`plt.yticks(ticks, labels)` : ticks(위치)에 labels를 입력(y축)  

예시 : `plt.xticks([1, 2, 3, 4, 5], ['a', 'b', 'c', 'd', 'e'])`


## legend 설정
범례를 표시한다. `plt.legend(loc)`을 사용하여 범례를 표시할 수 있다.  

loc:범례 위치를 뜻하며, 숫자로 쓸 수도 있다.  
'upper right' (1), 'upper left' (2),  
'lower right' (4), 'lower left' (5),  
'center' (10). 

범례를 표시하려면 그래프를 그릴 때 label 키워드를 사용하여 범례를 정의해야 한다. 그래프를 겹쳐그릴 경우 범례 표시가 어려울 수 있다.  


## 축 범위 설정

`plt.xlim(left, right)` : x축의 범위를 left, right로 설정  
`plt.ylim(bottom, top)` : y축의 범위를 bottom, top으로 설정  