# 청년순이동률 TOP 5

| 지역 |  청년순이동률 |
| -- | -- |
| 전남 무안군 | 4.9 |
| 충남 아산시 | 4.9 |
| 충남 홍성군 | 3.5 |
| 전북 완주군 | 3.5 |
| 경북 안동시 | 2.8 |

In [None]:
import os

from dotenv import load_dotenv

load_dotenv()

key = os.getenv("KOSIS_API_KEY")


In [None]:
import pandas as pd
import requests as req

base_url = "https://kosis.kr/openapi/statisticsData.do"

params = {
    "method": "getMeta",
    "type": "ITM",
    "apiKey": key,
    "orgId": "101",
    "tblId": "DT_1YL20642",
    "format": "json",
    "jsonVD": "Y",
}

res = req.get(base_url, params=params)

print(res.status_code)

res_text = res.text

print(res_text)

df = pd.DataFrame(res.json())
df.to_csv("../../data/item_code.csv")

In [None]:
import requests as req

url = "https://kosis.kr/openapi/Param/statisticsParameterData.do"
params = {
    "method": "getList",
    "apiKey": key,
    "orgId": "101",
    "tblId": "DT_1YL20642",
    "itmId": "T001",
    "objL1": "ALL",
    "objL2": "ALL",  # 필수
    "prdSe": "Y",
    "newEstPrdCnt": "3",
    "format": "json",
    "jsonVD": "Y",  # 이거 안넣으면 json 형태로 안옴
}

res = req.get(url, params=params)
print(res.status_code)
print(res.text[:300])


In [None]:
import pandas as pd

df = pd.DataFrame(res.json())
df.head()

df.info()

df.describe()

In [None]:
# 1. 데이터 타입 정리
df["DT"] = pd.to_numeric(df["DT"], errors="coerce")
df["PRD_DE"] = df["PRD_DE"].astype(str)

# 2. 제외 지역
exclude_sido = {"11", "23", "31", "21", "22", "24", "25", "26"}  # 수도권+광역시

# 3. 타입 변환
df = df.copy()
df["C1"] = df["C1"].astype(str)

# 4. 시도코드(앞 2자리) 생성
df["SIDO"] = df["C1"].str[:2]

# 5. 청년순이동률만
df = df[df["C2"] == "11"].copy()

# 6. 수도권 + 광역시 제외 (앞2자리 기준)
df = df[~df["SIDO"].isin(exclude_sido)].copy()

# 7. 최신연도 TOP5
latest_year = df["PRD_DE"].astype(str).max()

top_5 = (
    df[df["PRD_DE"].astype(str) == latest_year][["C1", "C1_NM", "SIDO", "DT"]]
    .assign(DT=lambda x: pd.to_numeric(x["DT"], errors="coerce"))
    .dropna(subset=["DT"])
    .rename(columns={"C1_NM": "지역", "DT": "청년순이동률", "SIDO": "시도"})
    .sort_values("청년순이동률", ascending=False)
    .head(5)
)

top_5 = top_5.reset_index()
print(top_5[["C1", "시도", "지역", "청년순이동률"]])

In [None]:
sido_map = {
    "11": "서울",
    "21": "부산",
    "22": "대구",
    "23": "인천",
    "24": "광주",
    "25": "대전",
    "26": "울산",
    "29": "세종",
    "31": "경기",
    "32": "강원",
    "33": "충북",
    "34": "충남",
    "35": "전북",
    "36": "전남",
    "37": "경북",
    "38": "경남",
    "39": "제주",
}

top_5["시도"] = top_5["C1"].astype(str).str[:2].map(sido_map)

top_5 = top_5.drop(columns=["index"])

top_5

In [None]:
import koreanize_matplotlib  # noqa: F401
import matplotlib.pyplot as plt

top_5["시도명"] = top_5["시도"].map(sido_map).fillna(top_5["시도"])
top_5["라벨"] = top_5["시도명"] + " " + top_5["지역"]

plt.figure()
plt.bar(top_5["라벨"], top_5["청년순이동률"])
plt.title(f"청년순이동률 TOP5 (수도권 + 광역시 제외, {latest_year})")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
