---

# Python을 활용한 데이터 분석 및 시각화
## - Package: Matplotlib, Seaborn

---

---

# Part 1: Matplotlib을 활용한 데이터 시각화

## 1. Matplotlib 패키지 기본 사용법 및 차트 설정하기

>1. 패키지 import 및 기본 사용법
>2. 축 레이블 설정 및 차트 타이틀 설정
>3. 범례 표시
>4. 축 범위 및 스케일 지정
>5. 선 종류, 마커, 색상 등 지정하기
---

## matplotlib 차트(figure)의 기본 구조

![nn](https://matplotlib.org/stable/_images/anatomy.png)

### 1-1. 패키지 설치 및 기본 사용법

>matplotlib.pyplot 모듈은 MATLAB과 비슷하게 명령어 스타일로 동작하는 함수의 모음입니다. <br>
>matplotlib.pyplot 모듈의 각각의 함수를 사용해서 간편하게 그래프를 만들고 변화를 줄 수 있습니다. <br>
>예를 들어, 그래프 영역을 만들고, 몇 개의 선을 표현하고, 레이블로 꾸미는 등의 일을 할 수 있습니다.

#### (1) 패키지 설치 및 pyplot import 하기

In [None]:
# 패키지 설치 및 import
!pip install matplotlib
import matplotlib
import matplotlib.pyplot as plt #pyplot

#한글 깨짐 방지
plt.rcParams['font.family'] = 'Malgun Gothic' 
matplotlib.rcParams['axes.unicode_minus'] = False
# 차트 전체 크기 기본 설정
plt.rcParams['figure.figsize'] = (8, 6)

#### (2) 기본 사용 1: 단일 리스트
> pyplot.plot() 함수에 하나의 숫자 리스트를 입력함으로써 아래와 같은 그래프가 그려집니다. <br>
> plot() 함수는 리스트의 값들이 y 값들이라고 가정하고, x 값 [0, 1, 2, 3]을 자동으로 만들어냅니다.<br>
> matplotlib.pyplot 모듈의 show() 함수는 그래프를 화면에 나타나도록 합니다.

In [None]:
# 기본 그래프
x_1 = [1,2,3,4] 
plt.plot(x_1)
plt.show()

#### (2) 기본 사용 2: 두 개의 리스트
>plot() 함수는 다양한 기능을 포함하고 있어서, 임의의 개수의 인자를 받을 수 있습니다. <br>
>예를 들어, 아래와 같이 입력하면, x-y 값을 그래프로 나타낼 수 있습니다.

In [None]:
plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
plt.show()

#### (3) 기본 스타일 지정
>아래 표의 문자에 따른 색상과 마커를 참조하여, 색상 및 마커의 조합으로 스타일을 지정할 수 있다.

|문자|색상||문자|마커|
|---|--- |---|:-----|:---|
|b |blue ||.	|point|
|g |green ||,	|pixel|
|r |red ||o	|circle|
|c |cyan ||v	|triangle down|
|m |magenta ||^	|triangle up|
|y |yellow ||<	|triangle left|
|k |black ||>	|triangle right|
|w |white ||1	|triangle down 2|
| | ||2	|triangle up 2|
| | ||3	|triangle left 2|
| | ||4	|triangle right 2|
| | ||s	|square|
| | ||p	|pentagon|
| | ||*	|star|
| | ||h	|hexagon 1|
| | ||H	|hexagon 2|
| | ||+	|plus|
| | ||x	|x|
| | ||D	|diamond|
| | ||d	|thin diamond|
| | ||–	|hline|

#### (4) 하나의 플롯에 여러 그래프 중첩하여 그리기

>Matplotlib에서는 일반적으로 NumPy 어레이를 이용하게 되는데, <br>
>사실 NumPy 어레이를 사용하지 않더라도 모든 시퀀스는 내부적으로 NumPy 어레이로 변환됩니다. <br>
>이 예제는 다양한 스타일을 갖는 여러 개의 곡선을 하나의 그래프로 나타냅니다.<br><br>
><b>* 예시 데이터: 200ms 간격으로 균일하게 샘플된 시간</b>

In [None]:
t = np.arange(0., 5., 0.2) #numpy가 import 된 상태여야 함

# 빨간 대쉬, 파란 사각형, 녹색 삼각형
plt.plot(t, t, 'r--', t, t**2, 'bs', t, t**3, 'g^')
plt.show()

#### (5) 레이블이 있는 데이터의 그래프 그리기

>파이썬 딕셔너리와 같이 레이블이 있는 데이터를 그래프로 나타낼 수 있습니다. <br>
> 아래 예제에서와 같이, 먼저 plot() 함수에 데이터의 레이블 (딕셔너리의 키)을 입력해주고,data 파라미터에 딕셔너리를 지정해줍니다.

In [None]:
data_dict = {'data_x': [1, 2, 3, 4, 5], 'data_y': [2, 3, 5, 10, 8]} # 딕셔너리 타입의 데이터 선언

# x와 y 위치에 딕셔너리의 키를 이용해 데이터를 입력
plt.plot('data_x', 'data_y', data=data_dict)
# 그래프 출력
plt.show()

---

### 1-2. 축 레이블 설정 및 차트 제목 설정

#### (1) 축 레이블 기본 설정
> matplotlib.pyplot 모듈의 title() 함수를 이용해서 그래프의 타이틀 (Title)을 설정할 수 있습니다. <br> 
> plt.title() 함수의 loc 파라미터를 ‘right’로 설정하면, 타이틀이 그래프의 오른쪽 위에 나타나게 됩니다.<br>
>> {‘left’, ‘center’, ‘right’} 중 선택할 수 있으며 디폴트는 ‘center’입니다.


In [None]:
plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
plt.xlabel('X-Label')
plt.ylabel('Y-Label')
plt.show()

#### (2) 축 레이블 여백 지정
> xlabel(), ylabel() 함수의 labelpad 파라미터는 축 레이블의 여백 (Padding)을 지정하며, <br>
> 예제에서는 X축 레이블에 대해서 15pt, Y축 레이블에 대해서 20pt 만큼의 여백을 지정하였습니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis', labelpad=15)
plt.ylabel('Y-Axis', labelpad=20)
plt.show()

#### (3) 축 레이블 위치 지정
> xlabel() 함수의 loc 파라미터는 X축 레이블의 위치를 지정합니다. ({‘left’, ‘center’, ‘right’}) <br>
> ylabel() 함수의 loc 파라미터는 Y축 레이블의 위치를 지정합니다. ({‘bottom’, ‘center’, ‘top’}) <br><br>
> <b> - Note:  loc 파라미터는 Matplotlib 3.3 이후 버전부터 적용 </b>

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis', loc='right')
plt.ylabel('Y-Axis', loc='top')
plt.show()

#### (4) 축 레이블 폰트(글꼴) 지정
> xlabel(), ylabel() 함수의 fontdict 파라미터를 사용하면 축 레이블의 폰트 스타일을 설정할 수 있습니다. <br>
> 예제에서는 ‘family’, ‘color’, ‘weight’, ‘size’와 같은 속성을 사용해서 축 레이블 텍스트를 설정했습니다. <br>
> 폰트 설정 값을 딕셔너리 타입의 변수로 설정하면, 편리하게 재사용 할 수 있습니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis', labelpad=15, fontdict={'family': 'serif', 'color': 'b', 'weight': 'bold', 'size': 14})
plt.ylabel('Y-Axis', labelpad=20, fontdict={'family': 'fantasy', 'color': 'deeppink', 'weight': 'normal', 'size': 'xx-large'})
plt.show()

In [None]:
# 폰트 설정에 대한 딕셔너리 변수 선언
font_style_1 = {
    'family': 'serif',
    'color': 'blue',
    'weight': 'bold',
    'size': 12
}

font_style_2 = {
    'family': 'fantasy',
    'color': 'red',
    'weight': 'normal',
    'size': 18
}
# 딕셔너리 변수 활용 폰트 설정
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis', labelpad=15, fontdict=font_style_1)
plt.ylabel('Y-Axis', labelpad=20, fontdict=font_style_2)
plt.show()

#### (5) 차트 제목 기본 설정
> matplotlib.pyplot 모듈의 title() 함수를 이용해서 그래프의 타이틀 (Title)을 설정할 수 있습니다. <br> 
> 예제에서는 title() 함수를 이용해서 그래프의 타이틀을 ‘Graph Title’로 설정했습니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis', labelpad=15, fontdict={'family': 'serif', 'color': 'b', 'weight': 'bold', 'size': 14})
plt.ylabel('Y-Axis', labelpad=20, fontdict={'family': 'fantasy', 'color': 'deeppink', 'weight': 'normal', 'size': 'xx-large'})
plt.title('Graph Title')
plt.show()

#### (6) 차트 제목 위치와 간격 지정
> plt.title() 함수의 loc 파라미터를 ‘right’로 설정하면, 타이틀이 그래프의 오른쪽 위에 나타나게 됩니다. <br>
> {‘left’, ‘center’, ‘right’} 중 선택할 수 있으며 디폴트는 ‘center’입니다. <br><br>
> pad 파라미터는 타이틀과 그래프와의 간격을 포인트 단위로 설정합니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis', labelpad=15, fontdict={'family': 'serif', 'color': 'b', 'weight': 'bold', 'size': 14})
plt.ylabel('Y-Axis', labelpad=20, fontdict={'family': 'fantasy', 'color': 'deeppink', 'weight': 'normal', 'size': 'xx-large'})
plt.title('Graph Title', loc='right', pad=20)
plt.show()

#### (7) 차트 제목 폰트 설정
> fontdict 파라미터에 딕셔너리 형태로 폰트 스타일을 설정할 수 있습니다. <br>
>‘fontsize’를 16으로, ‘fontweight’를 ‘bold’로 설정했습니다. <br>
>‘fontweight’에는 {‘normal’, ‘bold’, ‘heavy’, ‘light’, ‘ultrabold’, ‘ultralight’}와 같이 설정할 수 있습니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis', labelpad=15, fontdict={'family': 'serif', 'color': 'b', 'weight': 'bold', 'size': 14})
plt.ylabel('Y-Axis', labelpad=20, fontdict={'family': 'fantasy', 'color': 'deeppink', 'weight': 'normal', 'size': 'xx-large'})

plt.title('Graph Title', loc='right', pad=20)

# 제목에 사용할 딕셔너리 정의 (P)



# 제목 폰트서식, 위치 왼쪽, 간격 20  설정 (P)



plt.show()

### 1-3. 범례(legend) 표시
>범례 (Legend)는 그래프에 데이터의 종류를 표시하기 위한 텍스트입니다. <br>
> matplotlib.pyplot 모듈의 legend() 함수를 사용해서 그래프에 범례를 표시할 수 있습니다.

#### (1) 범례 기본 설정
> 그래프 영역에 범례를 나타내기 위해서는 우선 plot() 함수에 label 문자열을 지정하고, <br>
matplotlib.pyplot 모듈의 legend() 함수를 호출합니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10], label='Price ($)')
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.legend()

plt.show()

#### (2) 범례 위치 설정
> legend() 함수의 loc 파라미터를 이용해서 범례가 표시될 위치를 설정할 수 있습니다. <br>
loc 파라미터를 숫자 쌍 튜플로 지정하면, 해당하는 위치에 범례가 표시됩니다. <br>
loc=(0.0, 0.0)은 데이터 영역의 왼쪽 아래, loc=(1.0, 1.0)은 데이터 영역의 오른쪽 위 위치입니다.<br>
loc 파라미터에 여러 숫자 쌍을 입력하면서 범례의 위치를 확인해봅시다.

In [None]:
#plt.legend(loc=(0.0, 0.0))
#plt.legend(loc=(0.5, 0.5))
#plt.legend(loc=(1.0, 1.0))

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10], label='Price ($)')
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.legend(loc=(1, 1))

plt.show()

> loc 파라미터는 예제에서와 같이 문자열로 지정할 수도 있고, 숫자 코드를 사용할 수도 있습니다. <br>
loc=’lower right’와 같이 지정하면 아래와 같이 오른쪽 아래에 범례가 표시됩니다.
아래 표를 참조하여 위치를 변경하며 확인해봅시다.

|Location String | Location Code|
|---|---|
|'best' (Axes only)|	0|
|'upper right'	|1|
|'upper left'	|2|
|'lower left'	|3|
|'lower right'	|4|
|'right'	|5|
|'center left'	|6|
|'center right'	|7|
|'lower center'	|8|
|'upper center'	|9|
|'center'	|10|

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10], label='Price ($)')
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.legend(loc='lower right') #String or Code

plt.show()

#### (3) 여러 y 값인 경우, 범례 열 개수 지정하기
> legend() 함수의 ncol 파라미터는 범례에 표시될 텍스트의 열의 개수를 지정합니다. <br>
기본적으로 범례 텍스트는 첫 번째 예시와 같이 1개의 열로 표시되며, <br>
ncol=2로 지정하면 아래 두번째 그림과 같이 표시됩니다.

#### (4) 폰트 크기 설정
> legend() 함수의 fontsize 파라미터는 범례에 표시될 폰트의 크기를 지정합니다. <br>
예시는 폰트 크기를 14로 지정한 것입니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10], label='Price ($)')
plt.plot([1, 2, 3, 4], [3, 5, 9, 7], label='Demand (#)')
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')

#범례 설정하기 (위치, 형태, 글꼴크기) (P)


plt.show()

### 1-4. 축 범위 및 스케일 지정
>matplotlib.pyplot 모듈의 xlim(), ylim(), axis() 함수를 사용하면 그래프의 X, Y축이 표시되는 범위를 지정할 수 있습니다. <br>
>>xlim() - X축이 표시되는 범위를 지정하거나 반환합니다.<br>
ylim() - Y축이 표시되는 범위를 지정하거나 반환합니다.<br>
axis() - X, Y축이 표시되는 범위를 지정하거나 반환합니다.

#### (1) 축 범위 기본 설정 - xlim(), ylim() 활용
> xlim() 함수에 xmin, xmax 값을 각각 입력하거나 리스트 또는 튜플의 형태로 입력합니다. <br>
ylim() 함수에 ymin, ymax 값을 각각 입력하거나 리스트 또는 튜플의 형태로 입력합니다. <br>
입력값이 없으면 데이터에 맞게 자동으로 범위를 지정합니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
# X축의 범위: [xmin, xmax] (P)

# Y축의 범위: [ymin, ymax] (P)

plt.show()

#### (2) 축 범위 기본 설정 - axis()활용
> axis() 함수에 [xmin, xmax, ymin, ymax]의 형태로 X, Y축의 범위를 지정할 수 있습니다. <br>
axis() 함수에 입력한 리스트 (또는 튜플)는 반드시 네 개의 값 (xmin, xmax, ymin, ymax)이 있어야 합니다.<br>
입력값이 없으면 데이터에 맞게 자동으로 범위를 지정합니다.

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10])
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
# X, Y축의 범위: [xmin, xmax, ymin, ymax] (P)


plt.show()

#### (3) 축 스케일 기본 설정
> matplotlib.pyplot 모듈의 xscale(), yscale() 함수를 사용해서 그래프의 축 스케일을 다양하게 지정할 수 있습니다. <br>
축은 기본적으로 ‘linear’ 스케일로 표시되지만 ‘log’, ‘symlog’, ‘logit’으로 변경할 수 있습니다.

In [None]:
# x축 스케일 변경 예제
x = np.linspace(-10, 10, 100)
y = x ** 3

plt.plot(x, y)
plt.title("Linear Scale (Default)")
plt.show()

#x축을 symlog스케일로 바꾸고, 그래프 제목을 "x axis Symmetrical Log Scale"로 설정 (P)





In [None]:
#y축 스케일 변경 예제

x = np.linspace(0, 5, 100)
y = np.exp(x)

plt.plot(x, y)
plt.title("Linear Scale (Default)")
plt.show()

#y축을 log스케일로 바꾸고, 그래프 제목을 "y-axis Log Scale"로 설정 (P)





### 1-5. 색상, 선 종류, 마커 설정

#### (1) 색상 기본 설정
> plot() 함수의 color 키워드 인자 또는 Hex code를 이용하여 색상을 설정할 수 있습니다.


In [None]:
# 키워드 사용 예시
plt.plot([1, 2, 3, 4], [2.0, 3.0, 5.0, 10.0], color = 'red')
plt.plot([1, 2, 3, 4], [2.0, 2.8, 4.3, 6.5], color = 'green')
plt.plot([1, 2, 3, 4], [2.0, 2.5, 3.3, 4.5], color = 'blue')
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.title("Color Setting using Keyword")
plt.show()

#Hex code 사용 예시
plt.plot([1, 2, 3, 4], [2.0, 3.0, 5.0, 10.0], color = '#ff7f0e')
plt.plot([1, 2, 3, 4], [2.0, 2.8, 4.3, 6.5], color = '#8c564b')
plt.plot([1, 2, 3, 4], [2.0, 2.5, 3.3, 4.5], color = '#bcbd22')
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.title("Color Setting using Hex code")
plt.show()

### ** 참조: CSS 색상 코드
> 아래 명칭들을 키워드로 활용해 다양한 색상을 지정할 수 있음

![nn](https://wikidocs.net/images/page/92085/set_color_05.PNG)

#### (2) 선 종류 기본 설정
> plot() 함수의 linestyle 파라미터 값을 활용하여 선의 종류를 지정할 수 있습니다. <br>

In [None]:
plt.plot([1, 2, 3], [4, 4, 4], linestyle='solid', color='Black', label="'solid'")
plt.plot([1, 2, 3], [3, 3, 3], linestyle='dashed', color='Black', label="'dashed'")
plt.plot([1, 2, 3], [2, 2, 2], linestyle='dotted', color='Black', label="'dotted'")
plt.plot([1, 2, 3], [1, 1, 1], linestyle='dashdot', color='Black', label="'dashdot'")
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.axis([0.8, 3.2, 0.5, 5.0])
plt.legend(loc='upper center', ncol=4)
plt.show()

#### (2) 선 종류 커스터마이징 (튜플 이용)
> 튜플을 사용해서 선의 종류를 커스터마이즈할 수 있습니다. <br>
예를 들어, (0, (1, 1))은 ‘dotted’와 같고, (0, (5, 5))는 ‘dashed’와 같습니다. 또한 (0, (3, 5, 1, 5))는 ‘dashdotted’와 같습니다. <br>
숫자를 바꿔가면서 다양한 선의 종류를 만들어보세요.

In [None]:
plt.plot([1, 2, 3], [4, 4, 4], linestyle=(0, (1, 1)), color='blue', label='(0, (1, 1))')
plt.plot([1, 2, 3], [3, 3, 3], linestyle=(0, (1, 5)), color='blue', label='(0, (1, 5))')
plt.plot([1, 2, 3], [2, 2, 2], linestyle=(0, (5, 1)), color='blue', label='(0, (5, 1))')
plt.plot([1, 2, 3], [1, 1, 1], linestyle=(0, (3, 5, 1, 5)), color='blue', label='(0, (3, 5, 1, 5))')
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.axis([0.8, 3.2, 0.5, 5.0])
plt.legend(loc='upper right', ncol=2)
plt.tight_layout()
plt.show()

#### (3) 마커 기본 설정
> plot() 함수의 marker 파라미터를 사용하여 다양한 마커 형태를 지정할 수 있습니다. (아래 표 참조) <br>
예제에서는 5가지 마커를 이용해서 지정한 결과입니다.

### ** 참조: Matplotlib의 마커 종류
![nn](https://wikidocs.net/images/page/92083/set_marker_10.png)

In [None]:
plt.plot([4, 5, 6], marker="H")
plt.plot([3, 4, 5], marker="d")
plt.plot([2, 3, 4], marker="x")
plt.plot([1, 2, 3], marker=11)
plt.plot([0, 1, 2], marker='$Z$')
plt.show()

In [None]:
plt.plot([1, 2, 3, 4], [2, 3, 5, 10], 'bo-')    # 파란색 + 마커 + 실선
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.title("Blue + Marker + Normal Line")
plt.show()

plt.plot([1, 2, 3, 4], [2, 3, 5, 10], 'ro--')     # 파란색 + 마커 + 점선
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.title("Red + Marker + Dashed Line")
plt.show()

### ** 참조: 다양한 색상, 선 스타일, 마커 스타일 설정 값
![nn](https://wikidocs.net/images/page/92083/set_marker_05.png)

---

---
## 2. 다양한 유형의 시각화 차트 만들기

>1. 수평선/수직선
>2. 막대 그래프
>3. 히스토그램
>4. 에러바 표시
>5. 박스 플롯 & 바이올린 플롯
>6. 파이차트
>7. 산점도 & 히트맵

### 2-1. 수평선/수직선
> 그래프의 특정 위치에 수직선/수평선을 표시하기 위해서 matplotlib.pyplot 모듈은 아래의 네가지 함수를 지원합니다. <br>
>> axhline(): 축을 따라 수평선을 표시합니다. <br>
axvline(): 축을 따라 수직선을 표시합니다. <br>
hlines(): 지정한 점을 따라 수평선을 표시합니다. <br>
vlines(): 지정한 점을 따라 수직선을 표시합니다.

#### (1) 수평선 그리기
>axhline() 함수의 첫번째 인자는 y 값으로서 수평선의 위치가 됩니다. <br>
두, 세번째 인자는 xmin, xmax 값으로서 0에서 1 사이의 값을 입력합니다. 0은 왼쪽 끝, 1은 오른쪽 끝을 의미합니다. <br>
hlines() 함수에 y, xmin, xmax를 순서대로 입력하면, 점 (xmin, y)에서 점 (xmax, y)를 따라 수평선을 표시합니다.

In [None]:
x = np.arange(0, 4, 0.5)

plt.plot(x, x + 1, 'bo')
plt.plot(x, x**2 - 4, 'g--')
plt.plot(x, -2*x + 3, 'r:')

#가로선 그리기 (P)





#### (2) 수직선 그리기
>axvline() 함수의 첫번째 인자는 x 값으로서 수직선의 위치가 됩니다. <br>
두, 세번째 인자는 ymin, ymax 값으로서 0에서 1 사이의 값을 입력합니다. 0은 아래쪽 끝, 1은 위쪽 끝을 의미합니다. <br>
vlines() 함수에 x, ymin, ymax를 순서대로 입력하면, 점 (x, ymin)에서 점 (x, ymax)를 따라 수평선을 표시합니다.

In [None]:
x = np.arange(0, 4, 0.5)


plt.plot(x, x + 1, 'bo')
plt.plot(x, x**2 - 4, 'g--')
plt.plot(x, -2*x + 3, 'r:')

# 수직선 그리기 (P)






### 2-2. 막대그래프 (Bar Chart)
> 막대 그래프 (Bar graph, Bar chart)는 범주가 있는 데이터 값을 직사각형의 막대로 표현하는 그래프입니다. <br>
Matplotlib에서는 matplotlib.pyplot 모듈의 bar() 함수를 이용해서 막대 그래프를 간단하게 표현할 수 있습니다.

In [None]:
x = np.arange(3)
years = ['2018', '2019', '2020']
values = [100, 400, 900]

# 막대그래프 그리기 (P)





In [None]:
x = np.arange(3)
years = ['2018', '2019', '2020']
values = [100, 400, 900]

#노란색으로 변경
plt.bar(x, values, color='y')
plt.xticks(x, years)
plt.show()

#다른색(Hex code = #e35f62)으로 변경
plt.bar(x, values, color='#e35f62')
plt.xticks(x, years)
plt.show()

In [None]:
# 각 막대의 색상 값 리스트로 정의 후, 바 차트에 반영하여 나타내기
colors = ['y', 'dodgerblue', 'C2']

#서로 다른 색상의 막대로 그리기
plt.bar(x, values, color=colors)
plt.xticks(x, years)

plt.show()

---

In [None]:
x = np.arange(3)
years = ['2018', '2019', '2020']
values = [100, 400, 900]

# 가로 폭이 0.2, 0.4, 0.6, 0.8, 1인 그래프 출력해보기 (P)





In [None]:
y = np.arange(3)
years = ['2018', '2019', '2020']
values = [100, 400, 900]

# 가로 형태의 바 차트 만들기 (P)





### 2-3. 히스토그램 (Histogram)
> pyplot의 hist 함수를 활용해 히스토그램 작성이 가능하다. <br>
>> hist() 함수의 bins 파라미터는 히스토그램의 가로축 구간의 개수를 지정 <br>
cumulative 파라미터는 누적 히스토그램 여부를 지정 <br>
histtype 파라미터는 히스토그램의 종류를 지정 <br>


In [None]:
weight = [68, 81, 64, 56, 78, 74, 61, 77, 66, 68, 59, 71,
          80, 59, 67, 81, 69, 73, 69, 74, 70, 65]
#히스토그램 그리기(P)




In [None]:
weight = [68, 81, 64, 56, 78, 74, 61, 77, 66, 68, 59, 71,
          80, 59, 67, 81, 69, 73, 69, 74, 70, 65]

plt.hist(weight)
plt.title('bins=10')
plt.show()

#구간 수 5개로 변경하여 그리기 (P)




In [None]:
weight = [68, 81, 64, 56, 78, 74, 61, 77, 66, 68, 59, 71,
          80, 59, 67, 81, 69, 73, 69, 74, 70, 65]

#일반, 누적 히스토그램 한 그래프에 그리기
plt.hist(weight, cumulative=True, label='cumulative=True')
plt.hist(weight, cumulative=False, label='cumulative=False')
plt.legend(loc='upper left')
plt.show()

In [None]:
x = np.random.standard_normal(10000)
# density = True 이면, 확률밀도함수로 변경되어 총 면적이 1로 변환
# alpha는 투명도를 의미하며, 0이면 완전 투명, 1이면 완전 불투명
plt.hist(x, bins=50, density=True, alpha=0.35, histtype='stepfilled')
plt.show()

In [None]:
a = 2.0 * np.random.randn(10000) + 1.0
b = np.random.standard_normal(10000)
c = 20.0 * np.random.rand(5000) - 10.0

# 데이터 a, 구간 100개, 확률밀도함수 형태, 투명도 50%, stepfilled 형태의 히스토그램 (P)

# 데이터 b, 구간 50개, 확률밀도함수 형태, 투명도 50%, stepstepfilled 형태의 히스토그램 (P)

# 데이터 c, 구간 100개, 확률밀도함수 형태, 투명도 90%, step 형태의 히스토그램 (P)

# 그래프 출력 (P)


### 2-4. 에러바
> 에러바 (Errorbar, 오차막대)는 데이터의 편차를 표시하기 위한 그래프 형태입니다. <br>
matplotlib.pyplot 모듈의 errorbar() 함수를 이용해서 그래프에 에러바를 나타낼 수 있습니다.

In [None]:
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
yerr = [2.3, 3.1, 1.7, 2.5] #y값의 편차 (대칭)

plt.errorbar(x, y, yerr=yerr)
plt.title("에러바 기본 형태")
plt.show()

In [None]:
x = [1, 2, 3, 4]
y = [1, 4, 9, 16]
yerr = [(2.3, 3.1, 1.7, 2.5), (1.1, 2.5, 0.9, 3.9)] #비대칭 편차 (하위 편차, 상위편차)

plt.errorbar(x, y, yerr=yerr)
plt.title("에러바 (비대칭편차)")
plt.show()

In [None]:
np.linspace(0.1, 0.4, 4)

In [None]:
x = np.arange(1, 5)
y = x**2
yerr = np.linspace(0.1, 0.4, 4) #0.1부터 0.4까지 4등분한 값 -> array([0.1, 0.2, 0.3, 0.4]) (추후 넘파이 강의에서 다룸)

plt.errorbar(x, y + 4, yerr=yerr)
plt.errorbar(x, y + 2, yerr=yerr, uplims=True, lolims=True) #양측 편차 모두 기호 표시

upperlimits = [True, False, True, False]
lowerlimits = [False, False, True, True]
plt.errorbar(x, y, yerr=yerr, uplims=upperlimits, lolims=lowerlimits) #설정한 부분만 편차 기호 표시
plt.show()

In [None]:
np.linspace(0.1, 0.4, 4)

### 2-4. 박스플롯 & 바이올린 플롯
> 박스 플롯 (Box plot) 또는 박스-위스커 플롯 (Box-Whisker plot)은 수치 데이터를 표현하는 하나의 방식입니다. <br>
일반적으로 박스 플롯은 Five Number Summary와 사분편차를 사용해서 그립니다.

#### (1) 박스플롯 그리기

In [None]:
# 1. 데이터 준비
np.random.seed(0)
data_a = np.random.normal(0, 2.0, 1000)
data_b = np.random.normal(-3.0, 1.5, 500)
data_c = np.random.normal(1.2, 1.5, 1500)

In [None]:
# 2. 하나의 박스플롯 그리기 (P)







In [None]:
# 1. 데이터 준비
np.random.seed(0)
data_a = np.random.normal(0, 2.0, 1000)
data_b = np.random.normal(-3.0, 1.5, 500)
data_c = np.random.normal(1.2, 1.5, 1500)

# 2. 그래프 그리기 (P)






In [None]:
# 2. 데이터 준비
np.random.seed(0)
data_a = np.random.normal(0, 2.0, 1000)
data_b = np.random.normal(-3.0, 1.5, 500)
data_c = np.random.normal(1.2, 1.5, 1500)

# 3. 그래프 그리기 (P)
fig, ax = plt.subplots()

ax.boxplot([data_a, data_b, data_c], vert=False) #vert 값은 설정 안하면 True로 세로형, False이면 가로형 출력
ax.set_xlim(-10.0, 10.0)
ax.set_xlabel('Value')
ax.set_ylabel('Data Type')

plt.title("박스플롯 여러 개 그리기(가로)")
plt.show()

#### (2) 바이올린 플롯
> 바이올린 플롯 (Violin plot)은 데이터의 분포와 범위를 한눈에 보기 쉽게 나타내는 그래프 형식입니다. <br>
박스 플롯 (Box plot)과 비슷하지만 더 실제에 가까운 분포를 알 수 있다는 장점이 있습니다.

In [None]:
# 1. 데이터 준비
np.random.seed(0)
data_a = np.random.normal(0, 2.0, 1000)
data_b = np.random.normal(-3.0, 1.5, 500)
data_c = np.random.normal(1.2, 1.5, 1500)

# 2. 그래프 그리기 (P)







> showmeans 파라미터는 데이터 분포에서 평균값의 위치에 직선을 표시합니다. (Default: False) <br>
showextrema는 최대/최소값에 직선을 표시합니다. (Default: True) <br>
showmedians는 중간값에 직선을 표시합니다. (Default: False)

In [None]:
# 3. 최대, 최소, 중앙값, 평균값 표시 (P)







### 2-5. 파이 차트
> 파이 차트 (Pie chart, 원 그래프)는 범주별 구성 비율을 원형으로 표현한 그래프입니다. <br>
위의 그림과 같이 부채꼴의 중심각을 구성 비율에 비례하도록 표현합니다.

In [None]:
# 기본 사용
ratio = [34, 32, 16, 18]
labels = ['Apple', 'Banana', 'Melon', 'Grapes']

plt.pie(ratio, labels=labels, autopct='%.1f%%') #소수점 이하 한자리
plt.title("파이차트 기본형")
plt.show()

plt.pie(ratio, labels=labels, autopct='%.2f%%') #소수점 이하 두자리
plt.title("파이차트 기본형")
plt.show()

In [None]:
# 시작각도와 방향 설정하기
ratio = [34, 32, 16, 18]
labels = ['Apple', 'Banana', 'Melon', 'Grapes']

plt.pie(ratio, labels=labels, autopct='%.1f%%', startangle=180, counterclock=False)
plt.show()

In [None]:
# 중심에서 떨어진 형태 만들기
ratio = [34, 32, 16, 18]
labels = ['Apple', 'Banana', 'Melon', 'Grapes']
explode = [0, 0.10, 0, 0.10] # 각 요소별로 중심에서 떨어진 정도를 설정 (0.1 = 10%)

plt.pie(ratio, labels=labels, autopct='%.1f%%', startangle=260, counterclock=False, explode=explode)
plt.show()

In [None]:
# 색상 변경하기
ratio = [34, 32, 16, 18]
labels = ['Apple', 'Banana', 'Melon', 'Grapes']
explode = [0.05, 0.05, 0.05, 0.05]
colors = ['#ff9999', '#ffc000', '#8fd9b6', '#d395d0']

#그리기 (P)




In [None]:
# 도넛 형태 만들기
ratio = [34, 32, 16, 18]
labels = ['Apple', 'Banana', 'Melon', 'Grapes']
colors = ['#ff9999', '#ffc000', '#8fd9b6', '#d395d0']
wedgeprops={'width': 0.7, 'edgecolor': 'w', 'linewidth': 5}

#그리기 (P)




### 2-6. 산점도와 히트맵

#### (1) 산점도
> 산점도 (Scatter plot)는 두 변수의 상관 관계를 직교 좌표계의 평면에 점으로 표현하는 그래프입니다. <br>
matplotlib.pyplot 모듈의 scatter() 함수를 이용하면 산점도를 그릴 수 있습니다.

In [None]:
np.random.seed(0)

n = 50
x = np.random.rand(n)
y = np.random.rand(n)

# 기본 산점도 그리기
plt.scatter(x, y)
plt.show()

In [None]:
# 마커의 크기와 색상 지정하기
plt.scatter(x, y, s = 10, c = "red")
plt.show()

In [None]:
# 난수들을 이용한 기능 구현해보기
# 1. 데이터 정의
n = 50
x = np.random.rand(n)
y = np.random.rand(n)
area = (30 * np.random.rand(n))**2
colors = np.random.rand(n)

In [None]:
# 크기와 색깔 설정
plt.scatter(x, y, s=area, c=colors)
plt.show()

In [None]:
# 투명도와 컬러맵 설정 (P)





#### (2) 히트맵
>히트맵 (Heatmap)은 다양한 값을 갖는 숫자 데이터를 열분포 형태와 같이 색상을 이용해서 시각화한 것입니다. <br>
matplotlib.pyplot 모듈의 matshow() 함수를 이용해서 2차원 어레이 형태의 숫자 데이터를 히트맵으로 나타내보자.

In [None]:
# 데이터 준비
arr = np.random.standard_normal((30, 40))

#히트맵 그려보기 (P)




In [None]:
# 컬러맵 추가하기
plt.matshow(arr)
# colorbar() 함수의 shrink 파라미터는 컬러바의 크기를 결정
# aspect 파라미터는 컬러바의 종횡비 (Aspect ratio)를 결정
plt.colorbar(shrink=0.8, aspect=10)
plt.show()

In [None]:
# 색상범위 지정
plt.matshow(arr)
plt.colorbar(shrink=0.8, aspect=10)
plt.clim(-1.0, 1.0)
#plt.clim(-3.0, 3.0)

plt.show()

In [None]:
# cmap = plt.get_cmap('PiYG')
# cmap = plt.get_cmap('BuGn')
# cmap = plt.get_cmap('Greys')
# 여러 컬러맵으로 출력해보기 (P)





#### ** 컬러맵 명칭 참조

![nn](https://matplotlib.org/stable/_images/sphx_glr_colormaps_004.png)

## 3. Matplotlib 패키지 추가 설정 및 부가 기능

>1. 여러 곡선 그리기
>2. 그래프 영역 채우기
>3. 그리드 설정, 눈금표시
>4. 이미지 저장
>5. 그래프 스타일 설정
>6. 축 위치 조절, 이중 Y축 표시
>7. 두 종류의 그래프 그리기

### 3-1. 여러 곡선 그리기
#### (1) 일반형
![nn](https://wikidocs.net/images/page/141537/subplot_03.png)

In [None]:
# 데이터 준비
x1 = np.linspace(0.0, 5.0)
x2 = np.linspace(0.0, 2.0)

y1 = np.cos(2 * np.pi * x1) * np.exp(-x1)
y2 = np.cos(2 * np.pi * x2)

In [None]:
# 전체 작성해보기 (P)
# 첫 번째 그래프 (nrows=2, ncols=1, index=1)




# 두번째 그래프(nrows=2, ncols=1, index=2)




# 차트 여백 줄이기




In [None]:
# 전체 작성해보기 (P) - 이전 셀 내용 복사해서 활용
# 첫 번째 그래프 (nrows=1, ncols=2, index=1)





# 두번째 그래프(nrows=1, ncols=2, index=2)





# 차트 여백 줄이기



In [None]:
# 축 공유하기

# 첫 번째 그래프 (nrows=2, ncols=1, index=1)
ax1 = plt.subplot(2, 1, 1)                
plt.plot(x1, y1, 'o-')
plt.title('1st Graph')
plt.ylabel('Damped oscillation')
# 두번째 그래프(nrows=2, ncols=1, index=2)
ax2 = plt.subplot(2, 1, 2, sharex=ax1)                
plt.plot(x2, y2, '.-')
plt.title('2nd Graph')
plt.xlabel('time (s)')
plt.ylabel('Undamped')
# 차트 여백 줄이기
plt.tight_layout()
plt.show()

#### (2) 객체지향 인터페이스

In [None]:
# fig, ax 정의하여 그래프 영역 정의
fig = plt.figure()
ax = fig.add_axes([0, 0, 1, 1])
plt.show()

In [None]:
# plt.subplots() 사용하여 정의
fig, ax = plt.subplots()
plt.show()

In [None]:
# 행과 열 설정하기 (기본)
fig, ax = plt.subplots(2, 1)
plt.show()


In [None]:
# 행과 열 설정하기 (축 공유)
fig, ax = plt.subplots(2, 1, sharex=True, sharey=True)
plt.show()

In [None]:
# 데이터 준비
x1 = np.linspace(0.0, 5.0)
x2 = np.linspace(0.0, 2.0)

y1 = np.cos(2 * np.pi * x1) * np.exp(-x1)
y2 = np.cos(2 * np.pi * x2)

In [None]:
# fig, ax로 그래프 그리기 (1)
fig, ax = plt.subplots(2, 1)
ax[0].plot(x1,y1)
ax[1].plot(x2,y2)
plt.show()

In [None]:
# fig, ax로 그래프 그리기 (2)
x = np.arange(1, 5)     # [1, 2, 3, 4]

x = np.arange(1, 5)     # [1, 2, 3, 4]

# 직접 그려보기 (P)













### 3-2. 그래프 영역 채우기

>matplotlib.pyplot 모듈에서 그래프의 영역을 채우는 아래의 세가지 함수에 대해 소개합니다. <br>
>> fill_between() - 두 수평 방향의 곡선 사이를 채웁니다.<br>
fill_betweenx() - 두 수직 방향의 곡선 사이를 채웁니다.<br>
fill() - 다각형 영역을 채웁니다.

In [None]:
# 데이터 준비
x = [1, 2, 3, 4]
y = [2, 3, 5, 10]

In [None]:
# x축과의 사이 공간 채우기
plt.plot(x, y)
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
# 두번째 좌표와 세 번째 좌표, x축 사이 채우기
# 네 점 (x[1], y[1]), (x[2], y[2]), (x[1], 0), (x[2], 0)을 잇는 영역
plt.fill_between(x[1:3], y[1:3], alpha=0.5)
plt.show()

In [None]:
# y축과의 사이 공간 채우기
plt.plot(x, y)
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
# 두번째 좌표와 세 번째 좌표, y축 사이 채우기
# 네 점 (x[2], y[2]), (x[3], y[3]), (0, y[2]), (0, y[3])을 잇는 영역
plt.fill_betweenx(y[2:4], x[2:4], alpha=0.5)
plt.show()

In [None]:
# 데이터 준비
x = [1, 2, 3, 4]
y1 = [2, 3, 5, 10]
y2 = [1, 2, 4, 8]

In [None]:
# 두 그래프 사이의 공간 채우기 (P)







In [None]:
# 다각형 영역 채우기
plt.plot(x, y1)
plt.plot(x, y2)
plt.xlabel('X-Axis')
plt.ylabel('Y-Axis')
plt.fill([1.9, 1.9, 3.1, 3.1], [1.0, 4.0, 6.0, 3.0], color='lightgray', alpha=0.5)

plt.show()

### 3-3. 그리드 설정

>데이터의 위치를 더 명확하게 나타내기 위해 그래프에 그리드 (Grid, 격자)를 표시할 수 있습니다. <br>
이 페이지에서는 matplotlib.pyplot 모듈의 grid() 함수를 이용해서 그래프에 다양하게 그리드를 설정해봅시다.

In [None]:
x = np.arange(0, 2, 0.2)

In [None]:
# 기본 격자 그리드
plt.plot(x, x, 'bo')
plt.plot(x, x**2, color='#e35f62', marker='*', linewidth=2)
plt.plot(x, x**3, color='springgreen', marker='^', markersize=9)
#그리드 설정(P)


plt.show()

In [None]:
# x축 그리드만 설정
plt.plot(x, x, 'bo')
plt.plot(x, x**2, color='#e35f62', marker='*', linewidth=2)
plt.plot(x, x**3, color='forestgreen', marker='^', markersize=9)
#그리드 설정(P)


plt.show()

In [None]:
# y축 그리드만 설정
plt.plot(x, x, 'bo')
plt.plot(x, x**2, color='#e35f62', marker='*', linewidth=2)
plt.plot(x, x**3, color='forestgreen', marker='^', markersize=9)
#그리드 설정(P)


plt.show()

In [None]:
# 그리드 스타일 설정
x = np.arange(0, 2, 0.2)

plt.plot(x, x, 'bo')
plt.plot(x, x**2, color='#e35f62', marker='*', linewidth=2)
plt.plot(x, x**3, color='springgreen', marker='^', markersize=9)
plt.grid(True, axis='y', color='red', alpha=0.5, linestyle='--')

plt.show()

### 3-4. 차트를 이미지 파일로 저장하기.

In [None]:
x1 = np.linspace(0.0, 5.0)
x2 = np.linspace(0.0, 2.0)

y1 = np.cos(2 * np.pi * x1) * np.exp(-x1)
y2 = np.cos(2 * np.pi * x2)

plt.subplot(2, 1, 1)                # nrows=2, ncols=1, index=1
plt.plot(x1, y1, 'o-')
plt.title('1st Graph')
plt.ylabel('Damped oscillation')

plt.subplot(2, 1, 2)                # nrows=2, ncols=1, index=2
plt.plot(x2, y2, '.-')
plt.title('2nd Graph')
plt.xlabel('time (s)')
plt.ylabel('Undamped')

plt.tight_layout()
# plt.show()
# 파일명 "savefig_default.png"로 저장하기 (기본) (P)



### 3-5. 그래프 스타일 설정

In [None]:
# 활용 가능한 스타일 확인
print(plt.style.available)

In [None]:
# 스타일 설정
plt.style.use('default')
#plt.style.use('bmh')
# plt.style.use('ggplot')
# plt.style.use('classic')
# plt.style.use('Solarize_Light2')
# plt.style.use('default')

plt.plot([1, 2, 3, 4], [4, 6, 2, 7])
plt.show()

### 3-7. 축 이동하기

In [None]:
plt.style.use('default')
#plt.rcParams['figure.figsize'] = (6, 3)
#plt.rcParams['font.size'] = 12


fig, ax = plt.subplots()

ax.set_title('Mean Squared Error', pad=20)
ax.set_xlim(-3, 3)
ax.set_ylim(0, 3)
ax.set_xticks([-3, -2, -1, 0, 1, 2, 3])
ax.set_yticks([1, 2, 3])

ax.spines['left'].set_position('center')        # 왼쪽 축을 가운데 위치로 이동
ax.spines['right'].set_visible(False)          # 오른쪽 축을 보이지 않도록
ax.spines['top'].set_visible(False)            # 위 축을 보이지 않도록
ax.spines['bottom'].set_position(('data', 0))   # 아래 축을 데이터 0의 위치로 이동

x = np.linspace(-3, 3, 100)
ax.set_xlabel('y_true - y_pred', fontdict={'fontsize': 14}, labelpad=10)
ax.plot(x, x**2, color='#4799FF', linewidth=5)

plt.show()

### 3-8. 이중 Y축 표시하기

In [None]:
x = np.arange(0, 3)
y1 = x + 1
y2 = -x - 1

fig, ax1 = plt.subplots()
ax1.set_xlabel('X-Axis') # x축 레이블
ax1.set_ylabel('1st Y-Axis') # 첫 번째 y축레이블
ax1.plot(x, y1, color='green', label='1st Data') # 첫번째 데이터 레이블
ax1.legend(loc='upper right') #첫번째 데이터 레이블 범례

ax2 = ax1.twinx() #ax1과 x축을 공유하는 새로운 Axes 객체를 생성
ax2.set_ylabel('2nd Y-Axis') # 두 번째 y축레이블
ax2.plot(x, y2, color='deeppink', label='2nd Data') # 두번째 데이터 레이블
ax2.legend(loc='lower right') #두번째 데이터 레이블 범례

plt.show()

In [None]:
# 두 그래프의 범례 함께 표현하기
fig, ax1 = plt.subplots()
ax1.set_xlabel('X-Axis')
ax1.set_ylabel('1st Y-Axis')
line1 = ax1.plot(x, y1, color='green', label='1st Data')

ax2 = ax1.twinx()
ax2.set_ylabel('2nd Y-Axis')
line2 = ax2.plot(x, y2, color='deeppink', label='2nd Data')

#작성해보기(P)






---
# Part 2: seaborn을 활용한 데이터 시각화

  - 이 파트는 전부 작성하면서 진행.

### ** 패키지 설치 및 import

In [None]:
!pip install seaborn
import numpy as np
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns

# 테마 설정: darkgrid , whitegrid , dark , white , ticks


### ** 통계적 관계의 시각화 (Scatter Plot)

In [None]:
# Data
tips = sns.load_dataset("tips")
display(tips)

In [None]:
# Scatter Plot (Basic)


In [None]:
# Scatter Plot with Color & Marker by Catefory



### ** 분포의 시각화

In [None]:
#Data
penguins = sns.load_dataset("penguins")
display(penguins)

In [None]:
# Univariate
# bins: 구간 수, binwidth:각 구간 막대 폭



In [None]:
# Bivariate



In [None]:
# Add Category



In [None]:
# Joint & Marginal Distribution



In [None]:
# Pair Plot (Scatter Plot Matrix)



In [None]:
# 데이터 준비
glue = sns.load_dataset("glue").pivot("Model", "Task", "Score")
display(glue)

In [None]:
# 히트맵(기본)



In [None]:
# 히트맵 (값 표시)



In [None]:
# 히트맵 (값 표시)
# fmt:자릿 수 설정, linewidth: 사각형 사이 간격 설정




### ** 범주형 자료의 시각화

In [None]:
#Data
tips = sns.load_dataset("tips")
display(tips)

In [None]:
# Categorical Scatter Plot (stripplot)



In [None]:
# Box Plot



In [None]:
# Box Plot (Category 추가)



In [None]:
# Violin Plot (Normal)




In [None]:
# Violin Plot (Split)




### ** 단순선형회귀 적합 검토

In [None]:
# Data
tips = sns.load_dataset("tips")
display(tips)

In [None]:
# scatter plot & linear fit
# 직선=단순선형회귀선, 음영구간=95% 신뢰구간


In [None]:
# scatter plot & linear fit (신뢰구간 제외)
# 직선=단순선형회귀선


In [None]:
# scatter plot & linear fit by Category



In [None]:
# using jointplot

