## 목차
1. [수치형 데이터 시각화](#수치형-데이터-시각화)  
    1.1. [히스토그램(histplot)](#히스토그램histplot)  
    1.2. [커널밀도추정 함수 그래프(kdeplot)](#커널밀도추정-함수-그래프kdeplot)  
    1.3. [분포도(displot)](#분포도displot)  
    1.4. [러그플롯(rugplot)](#러그플롯rugplot)  
2. [범주형 데이터 시각화](#범주형-데이터-시각화)  
    2.1. [막대 그래프(barplot)](#막대-그래프barplot)  
    2.2. [포인트플롯(pointplot)](#포인트플롯pointplot)  
    2.3. [박스플롯(boxplot)](#박스플롯boxplot)  
    2.4. [바이올린플롯(violinplot)](#바이올린플롯violinplot)  
    2.5. [카운트플롯(countplot)](#카운트플롯countplot)  
    2.6. [파이크래프(pie)](#파이크래프pie)  
3. [데이터 관계 시각화](#데이터-관계-시각화)  
    3.1. [히트맵(heatmap)](#히트맵heatmap)  
    3.2. [라인플롯(lineplot)](#라인플롯lineplot)  
    3.3. [산점도(scatterplot)](#산점도scatterplot)  
    3.4. [회귀선을 포함한 산점도 그래프(regplot)](#회귀선을-포함한-산점도-그래프regplot)  
    3.5. [회귀선을 포함한 산점도 그래프(lmplot)](#회귀선을-포함한-산점도-그래프lmplot)  

<a name="수치형-데이터-시각화"></a>
# 수치형 데이터 시각화

<a name="히스토그램histplot"></a>
## 히스토그램(histplot)

* x : 파악하려는 feature
* bins : 나타내려는 x의 구간 갯수 [default : '10']
* hue : 비교해보려는 범주형 feature
* multiple : hue의 겹침을 나타내는 유형 [default : 'layer', 'dodge', 'stack', 'fill']
* element : bins를 나타내는 유형 [default : 'bars', 'step', 'poly']
* kde : kde 그래프를 같이 표현 [default : False, True]
* stat : 그래프에서 나타낼 y축 [default : 'count', 'frequency', 'probability', 'percent', 'density']
* y(*) : 파악하려는 feature 밀도에 따라 색의 체도를 달리 표현
* discrete(*) : 파악하려는 feature를 unique하게 표시(bins무시) [default : False, True]
* cbar : 밀도 표현이 있을때 밀도표 제공 [default : False, True]

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.histplot(data=titanic, x='age', bins=10, hue='alive', multiple='stack')

<a name="커널밀도추정-함수-그래프kdeplot"></a>
## 커널밀도추정 함수 그래프(kdeplot)

* x : 파악하려는 feature
* hue : 비교해보려는 범주형 feature
* multiple : hue의 겹침을 나타내는 유형 [default : 'layer', 'stack', 'fill']
* fill : 색채우기 [default : False, True]
* gridsize : 그래프의 꼭짓점 수 [default : 200]
* cut : 표현하려는 범위를 설정(방식 이해X) [default : 30]
* y(*) : 파악하려는 feature
* levels(*) : y가 있을때 밀도를 표현하는 scale [default : 10]
* thresh(*) : levels가 있을때 표현하는 최소치 [default : 0.05]
* cbar : 밀도 표현이 있을때 밀도표 제공 [default : False, True]

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.kdeplot(data=titanic, x='age')

<a name="분포도displot"></a>
## 분포도(displot)

* x : 파악하려는 feature
* hue : 비교해보려는 범주형 feature
* kind : 나타내려는 그래프 형태 [default : 'hist', 'kde', 'ecdf']
* kde : kde 그래프를 같이 표현 [default : False, True]
* height : 그래프의 상하 크기 [default : 5]
* aspect : 그래프의 좌우 크기 [default : 1]
* kde : kde 그래프를 같이 표현 [default : False, True]
* y(*) : 파악하려는 feature

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.displot(data=titanic, x='age')

<a name="러그플롯rugplot"></a>
## 러그플롯(rugplot)

* x : 파악하려는 feature
* hue : 비교해보려는 범주형 feature
* height : 그래프 높이 [default : 0.025]
* legend : legend 표기 [default : True, False]
* y(*) : 파악하려는 feature

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.rugplot(data=titanic, x='age')

<a name="범주형-데이터-시각화"></a>
# 범주형 데이터 시각화

<a name="막대-그래프barplot"></a>
## 막대 그래프(barplot)

* x : 파악하려는 범주형 feature
* y : 파악하려는 수치형 feature
* hue : 비교해보려는 범주형 feature
* estimator : y의 feature를 나타내려는 방식(functional) [default : 'mean', len, np.median, ...]
* errorbar : ('ci', 95)
    * ('ci', 95) : Confidence interval
    * ('pi', 95) : Percentile interval(*잘 이해안감)
    * ('se', 1) : Standard error
    * ('sd', 1) : Standard deviation
* width : [default : 0.8]
* errcolor : 에러바 색상 [default : '.26']
* errwidth : 에러바 너비 [default : None, <num>]
* dodge : hue 표기시 겹치기 비허용 [default : True, False]

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.barplot(data=titanic, x='class', y='fare')

<a name="포인트플롯pointplot"></a>
## 포인트플롯(pointplot)

* x : 파악하려는 범주형 feature
* y : 파악하려는 수치형 feature
* hue : 비교해보려는 범주형 feature
* estimator : y의 feature를 나타내려는 방식(functional) [default : 'mean', len, np.median, ...]
* errorbar : ('ci', 95)
    * ('ci', 95) : Confidence interval
    * ('pi', 95) : Percentile interval(*잘 이해안감)
    * ('se', 1) : Standard error
    * ('sd', 1) : Standard deviation
* width : [default : 0.8]
* errwidth : 에러바 너비 [default : None, <num>]
* markers : [default : 'o', ]
* linestyles : [default : '-', ]
* dodge : hue 표기시 겹치기 비허용 [default : False, True]

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.pointplot(data=titanic, x='class', y='fare')

<a name="박스플롯boxplot"></a>
## 박스플롯(boxplot)

* x : 파악하려는 범주형 feature
* y : 파악하려는 수치형 feature
* hue : 비교해보려는 범주형 feature

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.boxplot(data=titanic, x='class', y='fare')

<a name="바이올린플롯violinplot"></a>
## 바이올린플롯(violinplot)

* x : 파악하려는 범주형 feature
* y : 파악하려는 수치형 feature
* hue : 비교해보려는 범주형 feature
* bw : 커널 대역폭 배율 [default : 'scott', 'silverman', float]
* cut : 높이 조절 [default : 2]
* scale : 폭 조절 [default : 'area', 'count', 'width']
* inner : 내부 표현법  [default : 'box', 'quartile', 'point', 'stick', None]
* split : hue가 2개로 나뉠때 반반 표현법 [default : False, True]

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.violinplot(data=titanic, x='class', y='fare')

<a name="카운트플롯countplot"></a>
## 카운트플롯(countplot)

* x : 파악하려는 범주형 feature
* y : 파악하려는 수치형 feature
* hue : 비교해보려는 범주형 feature
* dodge : hue 표기시 겹치기 비허용 [default : True, False]

In [None]:
import seaborn as sns
titanic = sns.load_dataset('titanic')

sns.countplot(data=titanic, x='class')

<a name="파이크래프pie"></a>
## 파이크래프(pie)

* x : 리스트형 비율 
* labels : 리스트형 이름
* autopct : 비율 표기법 [default : '%.1f%%']
* pctdistance : 중심서부터 비율 표기 위치 [default : 0.6]
* labeldistance : 중심서부터 이름 표기 위치 [default : 1.1]
* startangle : 시작 각도 [default : 0]
* radius : 원의 크기 [default : 1]

In [None]:
import matplotlib.pyplot as plt
x=[10,20,70]
labels=["A","B","C"]
plt.pie(x=x, labels=labels, autopct='%.1f%%')

<a name="데이터-관계-시각화"></a>
# 데이터 관계 시각화

<a name="히트맵heatmap"></a>
## 히트맵(heatmap)

* data : value가 수치형인 DataFrame
* vmin : 컬러맵의 최소치 [default : None, float]
* vmax : 컬러맵의 최대치 [default : None, float]
* cmap : 컬러맵 색상 [default : None, string]
* annot : 어노테이션 표기 [default : None, True]
* fmt : 어노테이션 표기법 [default : '.2g']
* cbar : 컬러맵 표기 [default : True, False]

In [None]:
import seaborn as sns
flights = sns.load_dataset('flights')

pivot=flights.pivot(index='month', columns='year', values='passengers')
sns.heatmap(data=pivot)

<a name="라인플롯lineplot"></a>
## 라인플롯(lineplot)

* x : 파악하려는 수치형 feature
* y : 파악하려는 수치형 feature
* hue : 비교해보려는 범주형 feature
* estimator : y의 feature를 나타내려는 방식(functional) [default : 'mean', len, np.median, ...]
* errorbar : ('ci', 95)
    * ('ci', 95) : Confidence interval
    * ('pi', 95) : Percentile interval(*잘 이해안감)
    * ('se', 1) : Standard error
    * ('sd', 1) : Standard deviation

In [None]:
import seaborn as sns
flights = sns.load_dataset('flights')

sns.lineplot(data=flights, x='year', y='passengers')

<a name="산점도scatterplot"></a>
## 산점도(scatterplot)

* x : 파악하려는 수치형 feature
* y : 파악하려는 수치형 feature
* hue : 비교해보려는 범주형 feature

In [None]:
import seaborn as sns
tips = sns.load_dataset('tips')

sns.scatterplot(data=tips, x='total_bill', y='tip')

<a name="회귀선을-포함한-산점도-그래프regplot"></a>
## 회귀선을 포함한 산점도 그래프(regplot) 

* data : 전체적인 데이터
* x : 파악하려는 수치형 feature
* y : 파악하려는 수치형 feature
* scatter : 산점도 표기 [default : True, False]
* fit_reg : 회귀선 표기 [default : True, False]
* ci : ci 확률 [default : 95]
* logx : 회귀선 log함수화 [default : False, True]
* dropna : 산점도 표기를 위한 자동 dropna [default : True, False]
* marker : 마커형태 [default : 'o', ]

In [None]:
import seaborn as sns
tips = sns.load_dataset('tips')

sns.regplot(data=tips, x='total_bill', y='tip')

<a name="회귀선을-포함한-산점도-그래프lmplot"></a>
## 회귀선을 포함한 산점도 그래프(lmplot) 

* data : 전체적인 데이터
* x : 파악하려는 수치형 feature
* y : 파악하려는 수치형 feature
* col : 파악하려는 범주형 feature 가로나열 [default : None]
* row : 파악하려는 범주형 feature 세로나열 [default : None]
* height : 그래프 세로 스케일 [default : 5]
* aspect : 그래프 가로 스케일 [default : 1]
* scatter : 산점도 표기 [default : True, False]
* fit_reg : 회귀선 표기 [default : True, False]
* ci : ci 확률 [default : 95]
* logx : 회귀선 log함수화 [default : False, True]
* marker : 마커형태 [default : 'o', ]

In [None]:
import seaborn as sns
tips = sns.load_dataset('tips')

sns.lmplot(data=tips, x='total_bill', y='tip')