# Matplotlib · Pandas · Folium 핵심 정리 & 실습 노트
---



## 1. Pandas에서 NaN 채우기
- **앞의 값으로 채우기**: `Series.ffill()` 또는 `DataFrame.ffill()`  
- 그 외:
  - 뒤의 값으로 채우기: `bfill()`
  - 특정 값으로 채우기: `fillna(value)`
  - 결측 삭제: `dropna()`


In [None]:

import pandas as pd

s = pd.Series([1, None, None, 4, None, 6])
print("원본:")
print(s)

print("\nffill(): 앞의 값으로 채우기")
print(s.ffill())

print("\nbfill(): 뒤의 값으로 채우기")
print(s.bfill())

print("\nfillna(0): 0으로 채우기")
print(s.fillna(0))



## 2. `plt.plot()` 기본
- y만 지정하면 x는 0, 1, 2, ... 자동 생성
- x와 y를 함께 지정해도 됨
- 반환값은 `Line2D` 객체의 리스트


In [None]:

import matplotlib.pyplot as plt

# (주의) 이 노트에서는 각 셀에서 하나의 플롯만 그립니다.
y = [1, 3, 2, 5]
plt.plot(y)  # x를 생략하면 0..n-1 자동
plt.title("plt.plot(y) — x는 자동 생성")
plt.show()


In [None]:

x = [0, 1, 2, 3]
y = [1, 3, 2, 5]
plt.plot(x, y)
plt.title("plt.plot(x, y) — x, y 모두 지정")
plt.show()



## 3. Matplotlib 한글 깨짐 해결
- 권장 방법: `from matplotlib import rc` → `rc('font', family='맑은 고딕')` (Windows)  
  또는 시스템에 있는 한글 폰트 지정.  
- 음수 기호 깨짐 방지: `plt.rcParams['axes.unicode_minus'] = False`



In [None]:

from matplotlib import font_manager, rc
import matplotlib

plt.rcParams['axes.unicode_minus'] = False

candidate_fonts = ["Malgun Gothic", "AppleGothic", "NanumGothic", "DejaVu Sans"]
chosen = None
for f in candidate_fonts:
    try:
        rc('font', family=f)
        chosen = f
        break
    except Exception as e:
        pass

print("적용된 폰트:", chosen if chosen else "기본 폰트(시스템 폰트 사용)")

plt.plot([0,1,2],[0,1,0])
plt.title("한글 제목 테스트 (폰트: %s)" % (chosen if chosen else "기본"))
plt.xlabel("가로축")
plt.ylabel("세로축")
plt.show()



## 4. `plt.legend(loc='best')`
- 데이터와 **겹치지 않도록** 가장 좋은 위치를 자동 선택


In [None]:

import numpy as np
x = np.linspace(0, 2*np.pi, 100)
plt.plot(x, np.sin(x), label="sin")
plt.plot(x, np.cos(x), label="cos")
plt.legend(loc='best')  # 자동 배치
plt.title("legend loc='best' 예시")
plt.show()



## 5. 스타일: `plt.style.use('ggplot')`
- ggplot 스타일의 **선 색상/격자** 등 테마가 적용


In [None]:

plt.style.use('ggplot')
plt.plot([1,2,3,4],[10,3,6,8])
plt.title("ggplot 스타일 적용")
plt.show()

# (학습 후 원하면 기본 스타일로 되돌리세요)
# plt.style.use('default')



## 6. Figure vs Axes
- **Figure**: 전체 그래프(그림) 영역의 컨테이너  
- **Axes**: 실제 데이터가 그려지는 영역(좌표계)

`plt.subplots(2,2)` → 1개의 Figure와 4개의 Axes(2×2)


In [None]:

fig, axes = plt.subplots(2, 2, figsize=(6,4))
axes[0,0].plot([0,1],[0,1]); axes[0,0].set_title("좌상")
axes[0,1].plot([0,1],[1,0]); axes[0,1].set_title("우상")
axes[1,0].plot([0,1],[0.5,0.5]); axes[1,0].set_title("좌하")
axes[1,1].plot([0,1],[0.2,0.8]); axes[1,1].set_title("우하")
fig.suptitle("plt.subplots(2,2) 예시")
plt.tight_layout()
plt.show()



## 7. 축/눈금/그리드/범례 요약
- **Axis**: 축(수치 눈금이 붙는 객체)  
- **Tick**: 눈금과 그 레이블  
- **Grid**: 배경 격자(범례가 아님)  
- **Legend**: 선/마커 레이블 모음

그리고 `ax.set_xlim()`, `ax.set_ylim()`으로 축 범위를 설정합니다.


In [None]:

fig, ax = plt.subplots()
ax.plot([0,1,2,3],[3,1,4,2], label="샘플")
ax.set_xlim(-1, 4)
ax.set_ylim(0, 5)
ax.grid(True)
ax.legend(loc='best')
ax.set_title("축 범위 / 그리드 / 범례")
plt.show()



## 8. 선 꾸미기 옵션과 alpha, `subplot(2,2,1)` 의미
- `marker='o'`: 원형 마커
- `markerfacecolor='green'`: 마커 내부색 (예: green)
- `linewidth=2`: 선 두께
- `label='서울'`: **범례 레이블** 지정 (x축 이름 아님)
- `alpha=0.2`: 투명도(0=완전투명, 1=불투명)
- `subplot(2,2,1)`: 2행 2열 그리드 중 **첫 번째 위치** Axes 선택


In [None]:

# (학습용 데모 — 색상은 일부 환경에서 지정이 안 될 수 있어 마커 내부색만 예시로 사용)
plt.plot([0,1,2,3], [0,1,0,1], marker='o', linewidth=2, label='서울')
plt.legend()
plt.title("선/마커 옵션 & label은 범례용")
plt.show()

# alpha 예시
plt.plot([0,1,2,3],[3,3,3,3], alpha=0.3)
plt.title("alpha=0.3 (투명도 예시)")
plt.show()



## 9. `ax.twinx()` — 보조 y축
- 같은 x축을 공유하면서 **두 개의 y축**을 표시합니다.


In [None]:

x = list(range(10))
y1 = [v for v in x]
y2 = [v**2 for v in x]

fig, ax1 = plt.subplots()
ax1.plot(x, y1, label="1차")
ax1.set_xlabel("x")
ax1.set_ylabel("1차")

ax2 = ax1.twinx()
ax2.plot(x, y2, label="2차")
ax2.set_ylabel("2차")

fig.suptitle("twinx() 보조 y축")
plt.show()



## 10. 히스토그램과 산점도
- `plt.hist(..., bins=10)`: 구간(빈, bin)을 10개로 나눔  
- 산점도에서 점 크기: `plt.scatter(..., s=크기)`


In [None]:

import numpy as np
np.random.seed(0)
data = np.random.randn(200)
plt.hist(data, bins=10)
plt.title("bins=10 히스토그램")
plt.show()

x = np.random.randn(50)
y = np.random.randn(50)
sizes = (np.abs(x)+np.abs(y))*50 + 10  # 가변 크기
plt.scatter(x, y, s=sizes, alpha=0.6)
plt.title("산점도 (s로 점 크기 지정)")
plt.show()



## 11. Seaborn 요약 (설명 중심)
- `sns.regplot(x, y, fit_reg=False)`: 산점도에서 **회귀선 제외**  
- `sns.countplot(x=...)`: 각 **범주별 개수**를 막대로 표시

> 이 노트는 Matplotlib 중심으로 시각화하며, Seaborn 사용법은 개념만 정리했습니다.



## 12. 박스 플롯 vs 바이올린 플롯
- **박스 플롯**: 사분위/중앙값/이상치 등 **통계 요약**을 보여줌  
- **바이올린 플롯**: 박스 플롯 정보 + **분포의 밀도** 형태까지 표현

아래는 Matplotlib 박스 플롯 예시입니다.


In [None]:

np.random.seed(1)
g1 = np.random.normal(0, 1, 100)
g2 = np.random.normal(1, 0.5, 100)
plt.boxplot([g1, g2], labels=["그룹1", "그룹2"])
plt.title("박스 플롯 예시")
plt.show()



## 13. Choropleth & Folium CircleMarker
- **Choropleth(단계구분도)**: 지역별 값의 크기를 **색의 농도**로 표현  
- Folium에서 **원형 마커**는 `folium.CircleMarker()` 사용

아래는 서울 중심 좌표에 **원형 마커**를 표시하는 예시입니다.


In [None]:

import folium

# 서울 시청 근처 좌표
seoul_center = (37.5665, 126.9780)
m = folium.Map(location=seoul_center, zoom_start=12)

# 원형 마커 (기본 스타일 사용)
folium.CircleMarker(location=seoul_center, radius=8, popup="서울 시청").add_to(m)

# 노트북에서는 _repr_html_로 바로 표시됩니다.
m
