이번 유닛에서는 데이터 시각화를 위한 두 가지 주요 라이브러리인 Matplotlib과
Seaborn의 기초를 간단히 학습합니다.
이들 라이브러리를 사용하여 기본적인 그래프를 그리는 방법과 데이터를 효과적으로 시
각화하는 방법을 배웁니다

Matplotlib 소개 및 설치


Matplotlib은 파이썬의 기본적인 시각화 라이브러리입니다.
Matplotlib 임포트:
여기서 plt 는 matplotlib.pyplot의 일반적인 별칭(alias)입니다.
이를 통해 matplotlib.pyplot 대신 plt 로 간단히 참조할 수 있습니다.
import matplotlib.pyplot as plt

Matplotlib으로 여러 그래프 그리기
Matplotlib 라이브러리를 사용하여 라인 플롯, 산점도, 막대 그래프 등을 그릴 수 있습니
다.

In [None]:
import matplotlib.pyplot as plt

라인 플롯 그리기
라인 플롯(Line Plot)은 연속적인 데이터의 변화를 보여주는 데 사용됩니다.
시간에 따른 데이터의 변화나 두 변수 간의 관계를 표현하는 데 적합합니다.
plt.plot() 은 선 그래프를 그리는 함수입니다.

In [None]:
x = [1, 2, 3, 4, 5]
y = [2, 5, 6, 10, 9]

In [None]:
plt.plot(x, y)
plt.title('Simple Line Plot') # 제목 설정
plt.xlabel('X-axis') # x축 레이블
plt.ylabel('Y-axis') # y축 레이블
plt.show() # 그래프 표시

산점도 그리기
산점도(Scatter Plot)는 두 변수 간의 관계를 점으로 표현합니다.
변수 간의 상관관계나 패턴을 시각적으로 확인하는 데 유용합니다.
plt.scatter() 는 산점도를 그리는 함수입니다.


In [None]:
import numpy as np
# 데이터 준비
x = np.random.rand(100)
y = np.random.rand(100)

In [None]:
plt.scatter(x, y)
plt.title('Scatter Plot')
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.show()

막대 그래프 그리기
막대 그래프(Bar Plot)는 범주형 데이터의 값을 비교하는 데 사용됩니다.
각 범주의 값을 높이가 다른 막대로 표현하여 쉽게 비교할 수 있습니다.
plt.bar() 는 막대 그래프를 그리는 함수입니다.


In [None]:
categories = ['A', 'B', 'C', 'D']
values = [3, 7, 2, 5]

In [None]:
plt.bar(categories, values)
plt.title('Bar Plot')
plt.xlabel('Categories')
plt.ylabel('Values')
plt.show()

Seaborn 소개 및 설치
Seaborn은 Matplotlib을 기반으로 만들어진 고수준 시각화 라이브러리입니다.
Matplotlib 임포트:
여기서 sns 는 seaborn의 일반적인 별칭(alias)입니다.
이를 통해 seaborn 대신 sns 로 간단히 참조할 수 있습니다.
import seaborn as sns

Seaborn으로 여러 그래프 그리기
Seaborn 라이브러리를 사용하여 산점도 등 다양한 그래프를 그릴 수 있습니다.

In [None]:
import pandas as pd
import seaborn as sns

산점도 그리기
Seaborn의 scatterplot() 함수는 Matplotlib의 scatter() 와 유사하지만, 더
많은 기능을 제공합니다.
예를 들어, 데이터의 부분집합을 색상이나 마커 크기로 구분하여 표현할 수 있습니
다.

In [None]:
df = pd.DataFrame({
    'x': np.random.rand(100),
    'y': np.random.rand(100)
})
df

In [None]:
sns.scatterplot(x = 'x', y = 'y', data = df)
plt.title('Seaborn Scatter Plot')
plt.show()

In [None]:
df = pd.DataFrame({
    'x': np.random.rand(100),
    'y': np.random.rand(100),
    'group': np.random.choice(['A', 'B', 'C'], 100), # 그룹 분류
    'value': np.random.randint(1, 100, 100) # 마커 크기에 사용될 값
})
df

In [None]:
sns.scatterplot(x = 'x', y = 'y', size = 'value', data = df) # 마커 크기로 표현할 변
plt.title('Seaborn Scatter Plot')
plt.show()

In [None]:
sns.scatterplot(x = 'x', y = 'y', hue = 'group', data = df) # 색상으로 구분할 변수
plt.title('Seaborn Scatter Plot')
plt.show()

데이터 분석과 인공지능에서의 활용
Matplotlib과 Seaborn은 데이터 시각화에서 유용하게 사용되는 라이브러리입니다.

예) 실제 데이터셋을 이용한 시각화
이 예제에서는 식당 팁 데이터를 사용하여 총 지불액과 팁의 관계를 보여주는 산점
도를 그립니다.


In [None]:
import seaborn as sns

내장 데이터셋 로드


In [None]:
# 내장 데이터셋 로드
tips = sns.load_dataset('tips')

In [None]:
tips

산점도 그리기
이 산점도는 총 지불액(total_bill)과 팁(tip) 사이의 관계를 나타냅니다.
두 변수 간의 상관관계나 패턴을 확인할 수 있습니다.


In [None]:
# 산점도 그리기
sns.scatterplot(x = 'total_bill', y = 'tip', data = tips)
plt.title('Tips vs Total Bill')
plt.show()

In [None]:
# 마커 크기로 일행 수 표현
sns.scatterplot(x = 'total_bill', y = 'tip', size = 'size', data = tips)
plt.title('Tips vs Total Bill')
plt.show()

In [None]:
# 색상으로 시간대 구분
sns.scatterplot(x = 'total_bill', y = 'tip', hue = 'time', data = tips)
plt.title('Tips vs Total Bill')
plt.show()

In [None]:
# 색상으로 요일 구분
sns.scatterplot(x = 'total_bill', y = 'tip', hue = 'day', data = tips)
plt.title('Tips vs Total Bill')
plt.show()