In [None]:
# 미세먼지 농도에 따른 WHO 예보 등급 구하기

# ## 문제 설명
# 주어진 데이터는 인도의 특정 지역별 미세먼지와 대기오염물질 농도를 나타냅니다. `pm2_5` (미세먼지) 농도에 따라 WHO 대기질 가이드라인에서 제시하는 예보 등급을 구하고, 각 등급이 나타난 횟수를 세는 것이 목표입니다.

# ### 데이터 설명
# `india-airquality.csv` 파일에는 다음과 같은 열이 포함됩니다:
# - **stn_code**: 데이터 측정 장소 ID
# - **state**: 주 (州)
# - **location**: 도시
# - **type**: 측정 장소 타입 (예: 주거지대, 공업지대 등)
# - **so2**: 아황산가스 농도 (μg/m³)
# - **no2**: 이산화질소 농도 (μg/m³)
# - **location_monitoring_station**: 관측소 상세 주소
# - **pm2_5**: 미세먼지 농도 (μg/m³)
# - **date**: 관측일 (`YYYY-MM-DD` 형식)

# ### 과제
# WHO의 대기질 가이드라인에 따르면 미세먼지 농도 `pm2_5`에 따른 예보 등급 기준은 다음과 같습니다:
#
# | pm 2.5 농도 (μg/m³) | 예보 등급 |
# |----------------------|-----------|
# | 76 이상             | 매우 나쁨  |
# | 36 이상 76 미만      | 나쁨      |
# | 16 이상 36 미만      | 보통      |
# | 16 미만              | 좋음      |
#
# 주어진 데이터를 활용해, 각 예보 등급이 나타난 횟수를 계산한 후 `finedust_count.csv` 파일로 저장하세요.

# ## 코드 작성

# ### 1. 모듈 import
import pandas as pd

# ### 2. 데이터 로드
# 데이터 파일을 `ISO-8859-1` 인코딩으로 로드합니다.
df = pd.read_csv("./data/india-airquality.csv", encoding="ISO-8859-1", low_memory=False)
df.head()

# ### 3. 데이터 전처리
# - `pm2_5`에 결측치가 있는 행을 제거합니다.
df = df.dropna(subset=["pm2_5"])

# ### 4. 예보 등급 추가
# - `pm2_5` 농도에 따라 예보 등급을 할당하는 새로운 열 `예보 등급`을 추가합니다.
# - `cut()` 함수를 사용해 조건을 적용합니다.
df["예보 등급"] = pd.cut(
    df["pm2_5"],
    bins=[0, 16, 36, 76, float("inf")],
    labels=["좋음", "보통", "나쁨", "매우 나쁨"],
    right=False,
)

# ### 5. 예보 등급별 count 계산
# - 각 예보 등급별로 나타난 횟수를 세어 데이터프레임으로 만듭니다.
count_df = (
    df["예보 등급"]
    .value_counts()
    .reindex(["매우 나쁨", "나쁨", "보통", "좋음"], fill_value=0)
    .reset_index()
)
count_df.columns = ["예보 등급", "count"]

# ### 6. 결과 파일 저장
# - 결과를 `finedust_count.csv`로 저장합니다.
count_df.to_csv("finedust_count.csv", index=False)

# ### 7. 결과 확인
count_df