## 08. Seaborn
- Marplotlib 기반의 시각화 라이브러리
- 통계적 데이터 시각화에 특화(Pandas와 연계 좋음)

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

sns.__version__
# conda install seaborn

In [None]:
# 사용 가능한 데이터셋 이름 출력
sns.get_dataset_names()

In [None]:
# 데이터셋 불러오기
df = sns.load_dataset("car_crashes")
df.head()

In [None]:
# 폰트 목록 보기
import matplotlib.font_manager as fm

for f in fm.fontManager.ttflist:
    print(f.name)

In [None]:
# 방법 1
sns.set_style("white")
sns.set_context("notebook")
# sns.set_palette(palette="deep")
# 이후 폰트 깨짐 방지 설정

# 한글 깨짐 방지

# Windows에서 한글 폰트 설정
# plt.rcParams['font.family'] = 'Malgun Gothic'  # '맑은 고딕'이 설치되어 있을 경우
# plt.rcParams['axes.unicode_minus'] = False     # 마이너스(-) 부호 깨짐 방지

# macOS에서 한글 폰트 설정
plt.rcParams['font.family'] = 'AppleGothic'   # macOS 기본 한글 폰트
plt.rcParams['axes.unicode_minus'] = False

In [None]:
# 방법 2
# sns.set_theme(
#     style="whitegrid",
#     rc={
#         "font.family" = 'AppleGothic',
#         "axes.unicode_minus" = False
#     }
# )

### 범주형 데이터 그래프

In [None]:
# countplot

palette = sns.color_palette("deep")
tips = sns.load_dataset("tips")

sns.countplot(data=tips, x="day", hue="sex", edgecolor="black", palette=palette)

plt.title("요일별 방문자수", size=15, pad=20)
plt.grid(linestyle=":", alpha=0.7)
plt.ylabel("count", rotation=0, labelpad=25)

plt.show()

In [None]:
# barplot
# 각 범주의 평균값을 막대로 표현
# 신뢰구간을 함께 시각화

palette = sns.color_palette("pastel6")
sns.barplot(data=tips, x="day", y="tip", palette=palette, saturation=1, width=0.5, linewidth=1)

plt.title("요일별 평균 팁 금액")
plt.grid(linestyle=":", alpha=0.7)
plt.ylabel("tip", rotation=0, labelpad=20)

plt.show()

### 수치형 데이터 그래프

In [None]:
# displot
# 히스토그램 + 커널 밀도(kde)
# kde=True로 하면 kde 그래프 생성
sns.displot(data=tips, x="total_bill", edgecolor="black", alpha=0.5, kde=True, bins=20)

plt.title("Total bill")
plt.grid(linestyle=":", alpha=0.7)
plt.ylabel("count", rotation=0, labelpad=25)
plt.xlabel("total_bill", labelpad=10)

plt.show()

## 관계형 데이터 시각화

In [None]:
# scatter()
# 산점도
palette = sns.color_palette("pastel6")
sns.scatterplot(data=tips, x="total_bill", y="tip", hue="sex", palette=palette)
plt.grid(linestyle=":", alpha=0.7)
plt.ylabel("tip", rotation=0, labelpad=20)

plt.show()

### 다변량 시각화

In [None]:
penguins = sns.load_dataset("penguins")

# heatmap()
# 상관계수행렬의 그래프

# 상관계수행렬
corr = penguins.corr(numeric_only=True)

sns.heatmap(corr, annot=True, fmt=".2f", cmap="coolwarm", square=False)
plt.xticks(rotation=45)
plt.show()

In [None]:
# jointplot()
palette = sns.color_palette("pastel6")
sns.jointplot(data=penguins, x="flipper_length_mm", y="body_mass_g", kind="reg", palette=palette)

plt.ylabel("body_mass_g", rotation=0, labelpad=40)
plt.grid(linestyle=":", alpha=0.7)