# 모듈과 별칭의 필요성

- **matplotlib**은 파이썬에서 가장 널리 쓰이는 시각화 라이브러리임  
- 보통 줄여서 **mpl**이라 부르고, 그 안의 **pyplot 모듈**은 보통 **plt**라는 별칭으로 사용함  

👉 왜 별칭을 쓸까?  
- 코드가 짧아져서 **편리**함  
- 다른 사람이 코드를 읽을 때 **가독성**이 좋아짐  

In [None]:
# matplotlib 전체 라이브러리를 불러오기
import matplotlib as mpl

# pyplot 모듈을 plt라는 이름으로 불러오기
import matplotlib.pyplot as plt

# 기본 그래프 그리기

- `plt.plot([1, 2, 3, 4])`  
  → y 값은 `[1, 2, 3, 4]`  
  → x 값은 생략 가능, 자동으로 `[0, 1, 2, 3]`이 설정됨  

즉, 아래 두 코드는 같은 의미임:  
- `plt.plot([1, 2, 3, 4])`  
- `plt.plot([0, 1, 2, 3], [1, 2, 3, 4])`  

In [None]:
# y 값만 지정 (x 값은 자동으로 0,1,2,3 생성됨)
plt.plot([1, 2, 3, 4])
plt.show()

# 그래프 꾸미기

- `plt.xlabel("x축 이름")` → x축에 이름 붙이기  
- `plt.ylabel("y축 이름")` → y축에 이름 붙이기  
- `plt.show()` → 그래프를 화면에 출력하기 (Colab에서는 생략 가능)

In [None]:
# x축과 y축에 이름 붙이기
plt.plot([1, 2, 3, 4])
plt.xlabel("x label")
plt.ylabel("y label")
plt.show()

# ✔️ 응용해 보기
1. y 값을 `[2, 4, 6, 8]`로 바꿔서 실행해 보기  
2. x 값을 직접 `[10, 20, 30, 40]`으로 넣어보기

# numpy와 브로드캐스팅 활용

- `plot()` 함수 입력값은 **리스트뿐만 아니라 numpy 배열**도 가능함  
- numpy의 **브로드캐스팅 기능**을 활용하면 **수학 함수를 손쉽게 표현**할 수 있음  

예시:  
- 함수: `y = x^2`  
- 범위: `x = 0 ~ 9`  
- 결과: `y 값은 0^2 ~ 9^2 → 0 ~ 81`

In [None]:
import numpy as np

# 0에서 9까지 정수 배열 생성
x = np.arange(10)

# y = x^2 함수 그리기
plt.plot(x**2)
plt.show()

# 축 범위 설정의 중요성

- 데이터에 따라 **축의 범위가 불균형**하게 잡히면 그래프 해석이 어려워짐  
- 예: y = x² 함수는 값이 급격히 커지므로 y축이 자동으로 크게 설정됨  

👉 `plt.axis([xmin, xmax, ymin, ymax])` 형식으로 직접 범위를 지정 가능  
- 예: `plt.axis([0, 100, 0, 100])`  
- 이렇게 하면 **x축과 y축의 스케일을 동일하게 맞춰** 데이터 특성을 더 명확하게 확인할 수 있음  

**결론**: 축 범위 조정은 데이터 시각화에서 중요한 해석 도구임

In [None]:
# 다시 x = 0~9 범위 생성
x = np.arange(10)

# y = x^2 그래프를 그림
plt.plot(x**2)

# x축과 y축 범위를 동일하게 [0, 100]으로 설정
plt.axis([0, 100, 0, 100])

plt.show()

# ✔️ 응용해 보기
1. y = x³ 그래프를 직접 그려보기  
2. y = np.sin(x) 같은 다른 수학 함수도 시각화해 보기

# 여러 함수를 한 화면에 그리기

- 데이터 분석이나 수학적 함수 시각화에서는 여러 함수를 **비교**해야 하는 경우가 많음  
- 각각 따로 그리면 번거롭고, 한눈에 비교하기 어려움  
- 따라서 **한 화면에 동시에 여러 함수**를 표시하는 방법이 필요함  

예시:  
- y₁ = 2x  
- y₂ = (1/3)x² + 5  
- y₃ = -x² - 5

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# -20에서 20까지 정수 생성
x = np.arange(-20, 20)

# 세 가지 함수 정의
y1 = 2 * x
y2 = (1/3) * x**2 + 5
y3 = -x**2 - 5

# plot()의 스타일 옵션 활용

- plt.plot(x, y1, 'g--') → 녹색(green), 점선(--)  
- plt.plot(x, y2, 'r^-') → 빨강(red), 실선(-), 삼각형(^) 마커  
- plt.plot(x, y3, 'b*:') → 파랑(blue), 점선(:), 별(*) 마커  

👉 색상(Color) + 선(Line) + 표식(Marker)을 조합해서  
한 화면에 여러 함수를 **시각적으로 구분**할 수 있음  

- 축 범위도 `plt.axis([xmin, xmax, ymin, ymax])`로 지정 가능

In [None]:
# 세 함수 동시에 그리기 + 스타일 적용
plt.plot(x, y1, 'g--',   # 녹색 점선
         x, y2, 'r^-',   # 빨강 실선 + 삼각형 마커
         x, y3, 'b*:')   # 파랑 점선 + 별 마커

# x축, y축 범위 지정
plt.axis([-30, 30, -30, 30])
plt.show()

# 선 그리기의 의미와 확장성

- plot()은 단순히 선 하나만 그리는 도구가 아님  
- 여러 함수를 **한 화면에 시각화**하면 비교와 분석이 훨씬 직관적임  
- 색, 선 모양, 마커를 적절히 조합하면 시각적으로 명확히 구분 가능  

👉 데이터 사이언스 실무에서도 동일한 원리 적용됨  
- 예: 여러 모델의 **예측 결과 비교**, **데이터 분포 비교**, **추세 비교**  

**결론**: plot() 함수는  
- 단순 선 그리기 도구가 아니라,  
- 데이터 비교와 분석을 위한 **강력한 시각화 수단**

# ✔️ 응용해 보기
1. 각각 다른 색상과 마커를 적용해서 비교하기  
2. plt.legend()를 활용해 범례(legend)를 추가해 보기

# 다양한 데이터와 선 표현의 필요성

- 데이터 분석에서는 단순 직선이 아니라 **복잡한 패턴**을 시각화해야 함  
- 예:  
  - 난수(random) 데이터 → 불규칙적인 패턴  
  - 주기 함수(sin, cos) → 반복적인 파동  

👉 `plt.plot()`은 이런 다양한 데이터를 한 화면에서 표현할 수 있음

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 난수 데이터 시각화
N = 50
x = np.arange(N)
y = np.random.random(size=N) # 0과 1 사이의 무작위 실수를 뽑아내는 함수

# 녹색 점선(:), 삼각형(^) 마커
plt.plot(x, y, 'g^:')
plt.show()

# 난수와 주기 함수 시각화

- `np.random()` → 불규칙한 난수 데이터 생성  
- `np.sin()`, `np.cos()` → 반복적인 파동(주기 함수) 생성  

👉 실제 데이터(잡음 포함)와 이론적 모델(함수)을 비교하는 데 활용 가능

In [None]:
# 0 ~ 2π 범위에서 100개의 값 생성
x = np.linspace(0, np.pi * 2, 100)

# sin(x): 빨강 실선, cos(x): 파랑 점선
plt.plot(x, np.sin(x), 'r-')
plt.plot(x, np.cos(x), 'b:')
plt.show()

# 그래프 저장하기

- 시각화 결과는 화면에 표시할 뿐만 아니라 파일로 저장 가능  
- 주요 함수:  
  - `plt.figure()` → 새 figure 객체 생성  
  - `fig.savefig("파일명.png")` → PNG 파일로 저장  

👉 지원 포맷: PNG, JPG, SVG, TIF, PDF 등 10여 가지 이상  
👉 지원 포맷 확인: `fig.canvas.get_supported_filetypes()`

In [None]:
# sin, cos 그래프를 그리고 파일로 저장
x = np.linspace(0, np.pi * 2, 100)

fig = plt.figure()
plt.plot(x, np.sin(x), 'r-')
plt.plot(x, np.cos(x), 'b:')
fig.savefig('sin_cos_fig.png')  # PNG 파일 저장

# 저장한 이미지 확인하기

- **Colab**  
  출력된 그래프 위에서 **마우스 오른쪽 버튼 → "이미지를 다른 이름으로 저장"** 을 선택하면 다운로드 가능  

- **Jupyter/IPython**  
  `from IPython.display import Image` 를 이용해 저장된 이미지를 노트북 화면에 불러올 수 있음  

- **로컬 실행 환경 (IDLE, VS Code 등)**  
  그래프 창에서 **파일 → 저장** 기능을 통해 직접 저장 가능  

👉 가장 간단한 방법: **출력된 그림에서 마우스 오른쪽 클릭 → "이미지를 저장"**

In [None]:
from IPython.display import Image

# 저장한 이미지 불러오기
Image('sin_cos_fig.png')

# plt.show()에서 DPI 적용하기

- 보통 `plt.show()`는 디폴트 해상도(dpi=100) 정도로 출력됨  
- 더 선명한 그래프를 보고 싶다면 **출력 해상도 자체를 조정**할 수 있음  

방법:  
1. `plt.figure(dpi=값)` → 개별 그래프마다 설정  
2. `plt.rcParams["figure.dpi"] = 값` → 전체 기본값 변경  

👉 Colab에서 그래프를 볼 때,  
- `dpi=72` → 흐릿하게 보임  
- `dpi=150` 이상 → 선명하게 보임

In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(0, np.pi * 2, 100)

# 개별 Figure 해상도 설정 (dpi=150)
plt.figure(dpi=150)
plt.plot(x, np.sin(x), 'r-', label='sin')
plt.plot(x, np.cos(x), 'b:', label='cos')
plt.legend()
plt.title("Sin and Cos Curve (dpi=150)")
plt.show()

In [None]:
# 전체 출력 기본값을 고해상도로 변경 (예: 200 dpi)
plt.rcParams["figure.dpi"] = 200

x = np.linspace(0, np.pi * 2, 100)

plt.plot(x, np.sin(x), 'r-', label='sin')
plt.plot(x, np.cos(x), 'b:', label='cos')
plt.legend()
plt.title("Sin and Cos Curve (Global dpi=200)")
plt.show()

# DPI 변화에 따른 차이

- **72 dpi** → 선이 두껍고 계단현상이 보일 수 있음  
- **150 dpi** → 웹 시각화용으로 적당히 선명함  
- **200~300 dpi** → 확대해도 깔끔, 논문·보고서 시각화에 적합  

👉 Colab에서 직접 `plt.figure(dpi=값)`을 바꿔가며 실행하면  
화면 출력 시 그래프 선명도의 차이를 눈으로 확인할 수 있음

# ✔️ 응용해 보기
1. np.random()으로 100개 난수를 만들어 시각화해 보기  
2. sin(x)와 cos(x)를 같은 화면에 그리되, x 범위를 0~4π로 확장해 보기  
3. dpi(화질 설정)에 따라 출력 결과가 어떻게 달라지는지 비교해 보기

# 그래프 가독성의 필요성

- 단순히 선만 그린 그래프는 데이터의 의미를 이해하기 어려움  
- 따라서 **제목(title)**, **축 레이블(xlabel, ylabel)**, **범례(legend)**를 추가해야 함  
- 이렇게 하면 그래프가 더 **직관적**이고 **설명력** 있게 됨

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# 데이터 준비
x = np.linspace(0, np.pi * 2, 100)

# 제목, 축 레이블, 범례 적용
plt.title('Sin and Cos Curve')              # 그래프 제목
plt.plot(x, np.sin(x), 'r-', label='sin')   # 빨강 실선 + 범례 라벨
plt.plot(x, np.cos(x), 'b:', label='cos')   # 파랑 점선 + 범례 라벨
plt.xlabel('x value')                       # x축 레이블
plt.ylabel('y value')                       # y축 레이블
plt.legend()                                # 범례 출력
plt.show()

# 제목·레이블·범례 추가하기

- `plt.title("제목")` → 그래프의 제목 설정  
- `plt.xlabel("x축 이름")`, `plt.ylabel("y축 이름")` → 축 설명 추가  
- `plt.plot(..., label="설명")` → 각 그래프에 범례 이름 지정  
- `plt.legend()` → label을 불러와 범례 출력  
- `plt.legend(loc="upper right")` → 범례 위치 지정 가능

In [None]:
# 범례 위치를 오른쪽 상단에 표시
x = np.linspace(0, np.pi * 2, 100)

plt.title('Sin and Cos Curve')
plt.plot(x, np.sin(x), 'r-', label='sin')
plt.plot(x, np.cos(x), 'b:', label='cos')
plt.xlabel('x value')
plt.ylabel('y value')
plt.legend(loc='upper right')  # 범례 위치 지정
plt.show()

# 스타일과 시각적 효과

- matplotlib은 기본 스타일 외에도 다양한 테마 제공  
- `plt.style.use("seaborn-v0_8-whitegrid")` → 흰색 배경 + 격자무늬 스타일  
- `plt.style.available` → 사용 가능한 스타일 목록 확인 가능  
- `plt.style.use("default")` → 기본(default) 스타일로 복구  

👉 같은 데이터라도 **스타일 변경**으로 더 깔끔하고 보기 좋은 그래프 표현 가능

In [None]:
# 스타일 적용
plt.style.use('seaborn-v0_8-whitegrid')

x = np.linspace(0, np.pi * 2, 100)

plt.title('Sin and Cos Curve')
plt.plot(x, np.sin(x), 'r-', label='sin')
plt.plot(x, np.cos(x), 'b:', label='cos')
plt.xlabel('x value')
plt.ylabel('y value')
plt.legend()
plt.show()

# 사용 가능한 스타일 목록 확인
print(plt.style.available)

# 디폴트 스타일로 복귀
plt.style.use('default')

# ✔️ 응용해 보기
1. 제목을 "Sine vs Cosine"으로 바꿔보기  
2. 범례 위치를 "lower left"로 변경해 보기

# 단일 plot() 함수의 한계

- `plt.plot()`은 간단한 그래프를 빠르게 그릴 때 유용  
- 하지만 여러 종류의 그래프를 동시에 배치하기에는 한계 존재  
- 따라서 **여러 개의 그래프를 한 화면에 배치**할 수 있는 방법이 필요

# subplots() 함수의 등장

- `plt.subplots(nrows, ncols)` → 행 × 열 구조로 그래프 배치  
- 반환 값: **Figure 객체 + Axes 객체**  
  - **Figure**: 전체 그래프 영역 (큰 틀, 컨테이너)  
  - **Axes**: 실제 그래프가 그려지는 작은 박스  

👉 여러 Axes는 배열로 관리되며, `ax[0,0]`, `ax[1,1]`처럼 인덱스로 접근 가능

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# 2행 2열 subplot 생성
fig, ax = plt.subplots(2, 2)

# 산점도
X = np.random.randn(100)
Y = np.random.randn(100)
ax[0, 0].scatter(X, Y)

# 막대 그래프
X = np.arange(10)
Y = np.random.uniform(1, 10, 10)
ax[0, 1].bar(X, Y)

# 선 그래프
X = np.linspace(0, 10, 100)
Y = np.cos(X)
ax[1, 0].plot(X, Y)

# 2D 이미지
Z = np.random.uniform(0, 1, (5, 5))
ax[1, 1].imshow(Z)

plt.show()

# Axes와 Axis의 구분

- **Axes** (복수형): 그래프를 담는 영역(프레임)  
- **Axis** (단수형): 실제 축(x축, y축)  
- 이름이 비슷해 혼동하기 쉽지만,  
  👉 Axes = 공간 / Axis = 축 으로 기억

# subplot()의 고급 기능

- `plt.subplots()`는 행(row) × 열(col) 구조로 배치  
- 하지만 단순 배치만으로는 **간격 조절**이 어려움  

👉 해결책:  
- `wspace` → 수평 간격 조절  
- `hspace` → 수직 간격 조절  

예:  
- `wspace=0.4` → 좌우 간격 넓게  
- `hspace=0` → 위아래 그래프를 붙여 배치

In [None]:
# 2행 3열 subplot 배치
fig, ax = plt.subplots(2, 3)

# 각 위치에 텍스트로 좌표 표시 (시각 확인용)
for i in range(2):
    for j in range(3):
        ax[i, j].text(0.3, 0.5, str((i, j)), fontsize=11)

plt.show()

# GridSpec을 활용한 고급 배치

- `plt.GridSpec(nrows, ncols, wspace, hspace)` → 세밀한 간격 제어 가능  
- 특정 영역을 병합해서 더 큰 그래프도 배치 가능  

👉 다양한 데이터 시각화를 **대시보드 형태**로 구성 가능

In [None]:
# GridSpec으로 여백 조정 및 영역 병합
fig, ax = plt.subplots(2, 3)

grid = plt.GridSpec(2, 3, wspace=0.4, hspace=0.3)

# 산점도
X = np.random.randn(100)
Y = np.random.randn(100)
plt.subplot(grid[0, 0]).scatter(X, Y)

# 막대 그래프 (0행 1~2열 합침)
X = np.arange(10)
Y = np.random.uniform(1, 10, 10)
plt.subplot(grid[0, 1:]).bar(X, Y)

# 선 그래프 (1행 0~1열 합침)
X = np.linspace(0, 10, 100)
Y = np.cos(X)
plt.subplot(grid[1, :2]).plot(X, Y)

# 2D 이미지
Z = np.random.uniform(0, 1, (5, 5))
plt.subplot(grid[1, 2]).imshow(Z)

plt.show()

# ✔️ 응용해 보기
1. 3행 2열 구조로 subplot 배치 후, 각 위치에 다른 그래프를 넣어보기  
2. wspace, hspace 값을 다양하게 바꿔보며 간격 변화를 확인하기  
3. GridSpec을 이용해 첫 번째 행 전체를 하나의 큰 그래프로 합쳐보기