## 데이터 시각화

### 관련 라이브러리 호출

In [None]:
# 관련 라이브러리를 호출합니다.
import os
import chardet
import joblib
import numpy as np
import pandas as pd

### 작업 경로 확인 및 변경

In [None]:
# 현재 작업 경로를 확인합니다.
os.getcwd()

In [None]:
# data 폴더로 작업 경로를 변경합니다.
os.chdir(path = '../data')

In [None]:
# 현재 작업 경로에 있는 폴더명과 파일명을 출력합니다.
os.listdir()

### 실습 데이터셋 준비

In [None]:
# z 파일을 읽고 데이터프레임 apt에 할당합니다.
apt = joblib.load(filename = 'APT_Price_Merged.z')

In [None]:
# apt의 정보를 확인합니다.
apt.info()

In [None]:
# apt의 처음 5행을 출력합니다.
apt.head()

### 시각화 라이브러리 호출

In [None]:
# 관련 라이브러리를 호출합니다.
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm

In [None]:
# 테스트용 그래프를 그립니다.
sns.histplot(data = apt, x = '거래금액');

### 한글폰트명 탐색

In [None]:
# 현재 사용 중인 컴퓨터에 설치한 전체 폰트 파일명을 리스트로 반환합니다.
fontList = fm.findSystemFonts(fontext = 'ttf')

In [None]:
# 리스트에서 특정 문자열(폰트명)을 포함하는 파일명만 선택합니다.
fontPath = [font for font in fontList if 'Gowun' in font]

In [None]:
# 반복문으로 컴퓨터에 설치된 폰트명을 출력합니다.
for font in fontPath:
    print(fm.FontProperties(fname = font).get_name())

### 그래픽 파라미터 설정

In [None]:
# 한글폰트와 글자 크기를 설정합니다.
plt.rc(group = 'font', family = 'Gowun Dodum', size = 10)

In [None]:
# 그래프 크기와 해상도를 설정합니다.
plt.rc(group = 'figure', figsize = (8, 4), dpi = 150)

In [None]:
# 축에 유니코드 마이너스를 출력하지 않도록 설정합니다.
plt.rc(group = 'axes', unicode_minus = False)

In [None]:
# 범례에 채우기 색과 테두리 색을 추가합니다.
plt.rc(group = 'legend', frameon = True, fc = '1', ec = '0')

### 히스토그램 그리기

In [None]:
# 막대 개수를 지정한 히스토그램을 그립니다.
sns.histplot(data = apt, x = '거래금액', bins = 75, fc = '1', ec = '0');

In [None]:
# 막대 너비를 지정한 히스토그램을 그립니다.
sns.histplot(data = apt, x = '거래금액', binwidth = 2, fc = '1', ec = '0');

### [참고] 색상 목록

In [None]:
# 관련 모듈을 호출합니다.
from matplotlib import colors

In [None]:
# 148가지 색이름과 Hex Code를 딕셔너리로 출력합니다.
colors.CSS4_COLORS

### 히스토그램에 계급 추가

In [None]:
# 거래금액의 최솟값을 확인합니다.
apt['거래금액'].min()

In [None]:
# 거래금액의 최댓값을 확인합니다.
apt['거래금액'].max()

In [None]:
# 히스토그램에 막대 개수와 범위(막대 경계)로 계급을 지정합니다.
sns.histplot(data = apt, x = '거래금액', bins = 30, binrange = (0, 60), 
             fc = '1', ec = '0');

### 히스토그램 막대 채우기 색 변경

In [None]:
# 금액구간(범주형 변수)에 따라 채우기 색을 다르게 설정합니다.
# [참고] hue 매개변수에 지정한 범주형 변수의 범주별로 채우기 색을 다르게 설정합니다.
sns.histplot(data = apt, x = '거래금액', bins = 30, binrange = (0, 60), 
             hue = '금액구간', ec = '0');

In [None]:
# 채우기 색 배합을 다른 팔레트로 변경합니다.
sns.histplot(data = apt, x = '거래금액', bins = 30, binrange = (0, 60), 
             hue = '금액구간', ec = '0', palette = 'Set1');

### [참고] 팔레트 탐색: Color Brewer

In [None]:
# Color Brewer Palettet를 탐색합니다.
sns.choose_colorbrewer_palette(data_type = 'qualitative');

### [참고] 컬러맵 목록

In [None]:
# plt.cm 모듈에 있는 속성 목록을 출력합니다. '_r'이 있는 문자열 쌍이 컬러맵입니다.
# [참고] 마지막에 '_r'이 추가된 것은 색의 순서를 거꾸로 뒤집었다는 의미입니다.
dir(plt.cm)

In [None]:
# Sequential 범주의 대표적인 컬러맵의 색상을 확인합니다.
plt.cm.Greys

In [None]:
# Diverging 범주의 대표적인 컬러맵의 색상을 확인합니다.
plt.cm.Spectral

In [None]:
# Qualitative 범주의 대표적인 컬러맵의 색상을 확인합니다.
plt.cm.Set1

### 팔레트 설정

In [None]:
# 기본 팔레트 색을 출력합니다.
# [참고] 기본 팔레트는 'tab10'입니다.
sns.color_palette()

In [None]:
# 기본 팔레트를 'Set1'으로 변경합니다.
sns.set_palette(palette = 'Set1')

In [None]:
# 새로 설정한 기본 팔레트 색을 확인합니다.
sns.color_palette()

### 사용자 팔레트 적용

In [None]:
# 원하는 색이름을 원소로 갖는 리스트(사용자 팔레트)를 생성합니다.
myPal1 = ['silver', 'red', 'darkred']

In [None]:
# 기존 그래프에 사용자 팔레트를 적용합니다.
# [참고] hue_order 매개변수에 범주의 순서를 지정합니다.
sns.histplot(data = apt, x = '거래금액', bins = 30, binrange = (0, 60), 
             hue = '금액구간', ec = '0', palette = myPal1, 
             hue_order = ['5천 이상', '5천 미만']);

### [참고] 범주별 팔레트를 직접 지정

In [None]:
# 금액구간별 채우기 색을 딕셔너리로 지정합니다.
myPal2 = {'5천 이상': 'silver', '5천 미만': 'red'}

# 금액구간별 채우기 색을 반영합니다.
sns.histplot(data = apt, x = '거래금액', bins = 30, binrange = (0, 60), 
             hue = '금액구간', ec = '0', palette = myPal2);

### 히스토그램에 제목 및 축이름 추가

In [None]:
# 히스토그램에 제목, x축이름 및 y축이름을 추가합니다.
sns.histplot(data = apt, x = '거래금액', bins = 30, binrange = (0, 60), 
             hue = '금액구간', ec = '0', palette = myPal2)
plt.title(label = '거래금액의 분포')
plt.xlabel(xlabel = '매매가격')
plt.ylabel(ylabel = '매매건수');

### 히스토그램에 커널 밀도 추정 곡선 추가

In [None]:
# 히스토그램의 y축을 밀도로 변경합니다.
sns.histplot(data = apt, x = '거래금액', bins = 30, binrange = (0, 60),
             fc = '1', ec = '0.8', stat = 'density')

# 커널 밀도 추정 곡선을 추가합니다.
sns.kdeplot(data = apt, x = '거래금액', c = 'red', lw = 0.5, ls = '-')

# x축을 제한합니다.
plt.xlim(-3, 63);

### 관심 지역 선택

In [None]:
# apt에서 관심 지역을 선택하고 sub에 할당합니다.
sub = apt[apt['구'].str.contains(pat = '강[남동북]')]

In [None]:
# sub의 구별 빈도수, 거래금액 평균 및 표준편차를 확인합니다.
pd.pivot_table(data = sub, 
               values = '거래금액', 
               index = '구', 
               aggfunc = [np.size, np.mean, np.std])

### 히스토그램을 겹쳐서 그리기

In [None]:
# 구별 히스토그램을 겹쳐서 그립니다.
sns.histplot(data = sub, x = '거래금액', bins = 30, binrange = (0, 60),
             hue = '구', ec = '0', palette = myPal1, 
             hue_order = ['강남구', '강동구', '강북구']);

In [None]:
# 커널 밀도 추정 곡선을 겹쳐서 그리는 것이 더 낫습니다.
sns.kdeplot(data = sub, x = '거래금액', hue = '구', palette = myPal1, 
            hue_order = ['강남구', '강동구', '강북구'], fill = True)

# x축을 제한합니다.
plt.xlim(-3, 63);

### 일변량 상자 수염 그림 그리기

In [None]:
# 거래금액으로 상자 수염 그림을 그립니다.
sns.boxplot(data = apt, y = '거래금액', color = '0.8', linewidth = 0.5,
            fliersize = 3);

In [None]:
# 이상치 관련 속성을 딕셔너리로 생성합니다.
outlier = {'marker': 'o', 
            'markersize': 3, 
            'markerfacecolor': 'pink',
            'markeredgecolor': 'red', 
            'markeredgewidth': 0.5}

In [None]:
# 상자 수염 그림에 이상치 관련 속성을 추가합니다.
sns.boxplot(data = apt, y = '거래금액', color = '0.8', linewidth = 0.5, 
            flierprops = outlier);

### 이변량 상자 수염 그림 그리기

In [None]:
# apt의 구별 거래금액 중위수를 오름차순 정렬한 grp를 생성합니다.
grp = apt.groupby(by = '구')['거래금액'].median().sort_values()
grp.head()

In [None]:
# x축에 구, y축에 거래금액을 지정하고 이변량 상자 수염 그림을 그립니다.
sns.boxplot(data = apt, x = '구', y = '거래금액', linewidth = 0.5, 
            flierprops = outlier, order = grp.index)

# 거래금액의 중위수를 가로 직선으로 추가합니다.
plt.axhline(y = apt['거래금액'].median(), c = 'red', lw = 0.5)

# x축 눈금명을 90도 회전시킵니다.
plt.xticks(rotation = 90);

### 일변량 막대 그래프 그리기

In [None]:
# apt의 구별 빈도수를 내림차순 정렬한 grp를 생성합니다.
grp = apt['구'].value_counts()
grp.head()

In [None]:
# 구별 빈도수로 일변량 막대 그래프를 그립니다.
sns.countplot(data = apt, x = '구', width = 0.8, order = grp.index)

# x축을 제한하여 텍스트가 axes 경계 바깥으로 넘어가지 않도록 공간을 확보합니다.
# [주의] x축은 범주형 변수에서 중복을 제거한 개수만큼의 정수 인덱스로 결정됩니다.
plt.xlim(-1, 25)

# y축을 제한하여 막대 위에 텍스트를 출력할 공간을 확보합니다.
# [주의] 데이터마다 빈도수 범위가 다르므로 미리 확인하고 설정합니다.
plt.ylim(0, 14000)

# x축 눈금명을 90도 회전시킵니다.
plt.xticks(rotation = 90)

# 막대 위에 구별 빈도수를 텍스트로 추가합니다.
for i, v in enumerate(grp):
    plt.text(x = i, y = v, s = f'{v:,}', 
             ha = 'center', va = 'bottom', 
             c = 'black', fontsize = 7, 
             fontweight = 'bold')

### 특정 막대의 채우기 색 강조

In [None]:
# 모든 막대의 채우기 색을 밝은 회색으로 설정하는 사용자 팔레트를 생성합니다.
myPal3 = np.tile(A = 'silver', reps = 25)

# myPals3에서 0번 인덱스(첫 번째) 원소를 빨간색으로 변경합니다.
myPal3[0] = 'red'

# 세로 막대 그래프를 코드에 사용자 팔레트를 적용합니다.
sns.countplot(data = apt, x = '구', width = 0.8, order = grp.index, 
              palette = myPal3)

# x축을 제한하여 텍스트가 axes 경계 바깥으로 넘어가지 않도록 공간을 확보합니다.
# [주의] x축은 범주형 변수에서 중복을 제거한 개수만큼의 정수 인덱스로 결정됩니다.
plt.xlim(-1, 25)

# y축을 제한하여 막대 위에 텍스트를 출력할 공간을 확보합니다.
# [주의] 데이터마다 빈도수 범위가 다르므로 미리 확인하고 설정합니다.
plt.ylim(0, 14000)

# x축 눈금명을 90도 회전시킵니다.
plt.xticks(rotation = 90)

# 막대 위에 구별 빈도수를 텍스트로 추가합니다.
for i, v in enumerate(grp):
    plt.text(x = i, y = v, s = f'{v:,}', 
             ha = 'center', va = 'bottom', 
             c = 'black', fontsize = 7, 
             fontweight = 'bold')

### 가로 막대 그래프 그리기

In [None]:
# 현재 Cell의 그래프 크기를 설정합니다. [참고] 다른 Cell에는 적용되지 않습니다.
plt.figure(figsize = (8, 8))

# 가로 막대 그래프를 그립니다. [참고] x 매개변수를 y로 변경합니다.
sns.countplot(data = apt, y = '구', order = grp.index)

# x축을 제한하여 막대 오른쪽에 텍스트를 출력할 공간을 확보합니다.
plt.xlim(0, 14000)

# y축을 제한합니다. [참고] 가로 막대 그래프에서 y축은 바닥에서 시작합니다.
plt.ylim(25, -1)

# 막대 오른쪽에 구별 빈도수를 텍스트로 추가합니다.
for i, v in enumerate(grp):
    plt.text(x = v, y = i, s = f'{v:,}', ha = 'left', va = 'center', 
             c = 'black', fontsize = 7)

### 특정 막대의 텍스트 색 강조

In [None]:
# 모든 막대의 텍스트 색을 검정색으로 설정하는 사용자 팔레트를 생성합니다.
myPal4 = np.tile(A = 'black', reps = 25)

# myPals4에서 0번 인덱스(첫 번째) 원소를 빨간색으로 변경합니다.
myPal4[0] = 'red'

# 현재 Cell의 그래프 크기를 설정합니다. [참고] 다른 Cell에는 적용되지 않습니다.
plt.figure(figsize = (8, 8))

# 가로 막대 그래프를 그립니다. [참고] x 매개변수를 y로 변경합니다.
sns.countplot(data = apt, y = '구', order = grp.index)

# x축을 제한하여 막대 오른쪽에 텍스트를 출력할 공간을 확보합니다.
plt.xlim(0, 14000)

# y축을 제한합니다. [참고] 가로 막대 그래프에서 y축은 바닥에서 시작합니다.
plt.ylim(25, -1)

# 가로 막대 그래프의 텍스트를 추가하는 코드에 zip() 함수를 추가합니다.
for (i, v), c in zip(enumerate(grp), myPal4):
    plt.text(x = v, y = i, s = f'{v:,}', ha = 'left', va = 'center', 
             color = c, fontsize = 7)

### [참고] 파이 차트 그리기

In [None]:
# sub의 구별 빈도수를 내림차순 정렬한 grp를 생성합니다.
grp = sub['구'].value_counts()
grp.head()

In [None]:
# grp로 파이 차트를 그립니다.
plt.pie(x = grp.values, 
        explode = [0, 0, 0.1], 
        labels = grp.index, 
        autopct = '%.1f%%');

In [None]:
# 파이 차트의 다양한 그래픽 요소를 변경합니다.
plt.pie(x = grp.values, explode = [0, 0, 0.1], 
        labels = grp.index, autopct = '%.1f%%', 
        colors = myPal1, 
        startangle = 90, 
        counterclock = False,
        textprops = dict(c = '0', size = 12),
        wedgeprops = dict(ec = '0', lw = 0.5));

### 이변량 막대 그래프 그리기

In [None]:
# apt의 구별 거래금액 평균을 오름차순 정렬한 grp를 생성합니다.
grp = apt.groupby(by = '구')['거래금액'].mean().sort_values()
grp.head()

In [None]:
# 구별 거래금액 평균으로 이변량 막대 그래프를 그립니다.
sns.barplot(data = apt, x = '구', y = '거래금액', order = grp.index, 
            estimator = np.mean, errorbar = None)

# y축을 제한하여 막대 위에 텍스트를 출력할 공간을 확보합니다.
plt.ylim(0, 22.5)

# x축 눈금명을 90도 회전시킵니다.
plt.xticks(rotation = 90)

# 막대 위에 거래금액 평균을 텍스트로 추가합니다.
for i, v in enumerate(grp):
    plt.text(x = i, y = v, s = f'{v:.1f}', 
             ha = 'center', va = 'bottom',
             c = 'black', fontsize = 7)

### 선 그래프 그리기

In [None]:
# apt를 거래년도와 거래월로 오름차순 정렬하고 apt에 재할당합니다.
apt = apt.sort_values(by = ['거래년도', '거래월'])

In [None]:
# 거래월별 거래금액 평균으로 선 그래프를 그립니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', c = 'red', 
             estimator = np.mean, errorbar = None);

In [None]:
# 선 그래프에 점을 추가합니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', c = 'red', 
             estimator = np.mean, errorbar = None, marker = 'o');

### 선 그래프를 겹쳐서 그리기

In [None]:
# 거래년도별로 선 그래프를 겹쳐서 그립니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', hue = '거래년도', 
             estimator = np.mean, errorbar = None, marker = 'o');

In [None]:
# 거래년도별로 점의 모양과 선의 종류를 다르게 설정합니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', hue = '거래년도', 
             estimator = np.mean, errorbar = None, markers = True, 
             style = '거래년도');

### [참고] 범주별 점의 모양을 직접 지정

In [None]:
# 거래년도별 점의 모양을 리스트로 지정합니다.
markers = ['o', '^', 's']

# 거래년도별 점의 모양을 리스트로 지정합니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', hue = '거래년도', 
             estimator = np.mean, errorbar = None, markers = markers, 
             style = '거래년도', dashes = False);

### [참고] 범주별 선의 종류를 직접 지정

In [None]:
# 거래년도별 선의 종류를 딕셔너리로 지정합니다.
dashes = {2020: (4, 1.5), 2021: (1, 1), 2022: (3, 1, 1.5, 1)}

# 거래년도별 선의 종류를 반영합니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', hue = '거래년도', 
             estimator = np.mean, errorbar = None, markers = markers, 
             style = '거래년도', dashes = dashes);

### [참고] 범례 위치 변경

In [None]:
# 거래년도별 선의 종류를 반영합니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', hue = '거래년도', 
             estimator = np.mean, errorbar = None, markers = markers, 
             style = '거래년도', dashes = dashes)

# 범례를 그래프 바깥으로 이동시킵니다.
plt.legend(loc = 'lower center', bbox_to_anchor = (0.5, 1), ncol = 3);

### x축을 공유하는 두 그래프 그리기

In [None]:
# 전체 그래프 영역을 설정합니다.
# [참고] 현재 Cell에 적용할 figsize와 dpi 매개변수를 추가할 수 있습니다.
fig = plt.figure()

# 첫 번째 그래프를 그릴 영역을 추가합니다.
# [참고] ax는 axes를 의미합니다. axes는 axis의 복수형입니다.
ax1 = fig.add_subplot()

# 첫 번째 그래프 영역에 막대 그래프를 그립니다.
sns.barplot(data = apt, x = '거래월', y = '거래금액', fc = '0.8', 
            estimator = np.size, ax = ax1)

# 왼쪽 y축을 제한하여 두 번째 그래프와 겹치는 부분을 최소화합니다.
ax1.set_ylim(0, 30000)

# 왼쪽 y축 이름을 변경합니다.
ax1.set_ylabel(ylabel = '거래건수')

# 첫 번째 그래프와 x축을 공유하는 두 번째 그래프를 그릴 영역을 설정합니다.
# [참고] 두 번째 그래프의 y축을 오른쪽으로 적용합니다.
ax2 = ax1.twinx()

# 두 번째 그래프 영역에 선 그래프를 그립니다.
# [참고] estimator 매개변수의 기본 인수는 평균입니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', marker = 'o', 
             errorbar = None, ax = ax2)

# 오른쪽 y축을 제한하여 첫 번째 그래프와 겹치는 부분을 최소화합니다.
ax2.set_ylim(0, 11)

# 오른쪽 y축 이름을 변경합니다.
ax2.set_ylabel(ylabel = '평균 거래금액')

# 전체 그래프의 제목을 추가합니다.
plt.title(label = '월별 거래건수와 평균 거래금액의 변화');

### 영역을 분리하여 두 그래프 그리기

In [None]:
# 전체 그래프 영역을 2행 1열로 나누고 x축을 공유하도록 설정합니다.
fig, (ax1, ax2) = plt.subplots(nrows = 2, ncols = 1, sharex = True)

# 첫 번째 그래프 영역에 막대 그래프를 그립니다.
sns.countplot(data = apt, x = '거래월', fc = '0.8', ax = ax1)

# 첫 번째 y축을 제한합니다.
ax1.set_ylim(0, 25000)

# 첫 번째 y축 이름을 변경합니다.
ax1.set_ylabel(ylabel = '거래건수')

# 첫 번째 x축 이름을 삭제합니다.
ax1.set_xlabel(xlabel = None)

# 첫 번째 x축 눈금 표시를 제거합니다.
ax1.tick_params(axis = 'x', which = 'both', bottom = False)

# 두 번째 그래프 영역에 선 그래프를 그립니다.
# [참고] estimator 매개변수의 기본 인수는 평균입니다.
sns.lineplot(data = apt, x = '거래월', y = '거래금액', marker = 'o', 
             errorbar = None, ax = ax2)

# 두 번째 y축을 제한합니다.
ax2.set_ylim(7, 11)

# 두 번째 y축 이름을 변경합니다.
ax2.set_ylabel(ylabel = '평균 거래금액')

# 두 그래프 사이의 여백을 조정합니다.
# [참고] pad 매개변수에 여백의 크기를 지정합니다.(기본값: 1.08)
plt.tight_layout(pad = 0)

# 첫 번째 그래프 제목을 추가합니다.
# [주의] plt.title()은 두 그래프 사이에 제목을 출력합니다.
ax1.set_title(label = '월별 거래건수와 평균 거래금액 비교');

### 산점도 그리기

In [None]:
# 전용면적과 거래금액으로 산점도를 그립니다.
sns.scatterplot(data = apt, x = '전용면적', y = '거래금액', 
                fc = '0.3', ec = '0.8', s = 20, alpha = 0.2);

### 점의 채우기 색 변경

In [None]:
# apt를 세대수로 오름차순 정렬하고 apt에 재할당합니다.
apt = apt.sort_values(by = '세대수')

In [None]:
# 세대수(연속형 변수)에 따라 채우기 색을 다르게 설정합니다.
sns.scatterplot(data = apt, x = '전용면적', y = '거래금액', 
                hue = '세대수', ec = 'yellowgreen', 
                palette = 'YlGn', s = 20, alpha = 0.2);

### 강남구 데이터로 산점도 그리기

In [None]:
# apt에서 강남구만 선택하고 gng에 할당합니다.
gng = apt[apt['구'].eq('강남구')]

In [None]:
# gng로 산점도를 그립니다.
sns.scatterplot(data = gng, x = '전용면적', y = '거래금액', 
                hue = '세대수', ec = 'yellowgreen', 
                palette = 'YlGn', s = 20, alpha = 0.2);

### 산점도에 회귀직선, 수직선 및 수평선 추가

In [None]:
# 점과 회귀직선 관련 그래픽 요소를 딕셔너리로 생성합니다.
scatter = dict(fc = '0.3', ec = '0.8', s = 20, alpha = 0.2)
regline = dict(color = 'red', lw = 1.5)

In [None]:
# 산점도에 회귀직선, 수직선(x 평균) 및 수평선(y 평균)을 추가합니다.
sns.regplot(data = gng, x = '전용면적', y = '거래금액', ci = None, 
            scatter_kws = scatter, line_kws = regline)
plt.axvline(x = gng['전용면적'].mean(), c = '0', lw = 0.5, ls = '--')
plt.axhline(y = gng['거래금액'].mean(), c = '0', lw = 0.5, ls = '--');

### 산점도 행렬 그리기

In [None]:
# 산점도 행렬을 그릴 일부 변수명으로 리스트를 생성합니다.
cols = ['전용면적', '층', '세대수', '거래금액']

In [None]:
# 선택한 변수로 산점도 행렬을 그립니다.
sns.pairplot(data = gng[cols], plot_kws = scatter);

In [None]:
# x축에 입력변수, y축에 목표변수를 지정하면 산점도 행렬을 간결하게 그립니다.
sns.pairplot(data = gng, 
             x_vars = ['전용면적', '층', '세대수'], 
             y_vars = '거래금액', 
             kind = 'reg', 
             plot_kws = dict(scatter_kws = scatter,
                             line_kws = regline));

### 히트맵 그리기

In [None]:
# 현재 Cell의 그래프 크기를 설정합니다.
plt.figure(figsize = (8, 6))

# 상관계수 행렬로 히트맵을 그립니다.
sns.heatmap(data = gng.corr(numeric_only = True), 
            cmap = 'coolwarm_r', 
            annot = True, 
            annot_kws = dict(size = 8))
plt.axhline(y = 3); plt.axhline(y = 4)
plt.axvline(x = 3); plt.axvline(x = 4);

## End of Document