In [1]:
import pandas as pd
import matplotlib.pyplot as plt

# 데이터 읽기 (CSV 형식 가정)
file_path = 'your_data.csv'  # 파일 경로 수정
data = pd.read_csv(file_path, encoding='utf-8')

# 1. 데이터 전처리
# '년월' 열을 날짜 형식으로 변환
data['년월'] = pd.to_datetime(data['년월'], format='%Y-%m')
data = data.sort_values(by='년월')

# 결측치 확인 및 처리
print(data.isnull().sum())  # 결측치 확인
data = data.dropna()  # 결측치 제거

# 2. 기초 통계 분석
print(data.describe())  # 기본 통계량

# 3. 시각화: 월별 평균기온 추세
plt.figure(figsize=(12, 6))
plt.plot(data['년월'], data['평균기온(℃)'], marker='o', label='평균기온')
plt.title('월별 평균기온 변화', fontsize=16)
plt.xlabel('년월', fontsize=12)
plt.ylabel('평균기온(℃)', fontsize=12)
plt.grid(True)
plt.legend()
plt.show()

# 4. 계절별 평균 기온 분석
data['계절'] = data['년월'].dt.month % 12 // 3 + 1  # 계절: 1(봄), 2(여름), 3(가을), 4(겨울)
seasonal_avg = data.groupby('계절')['평균기온(℃)'].mean()

plt.figure(figsize=(8, 4))
seasonal_avg.plot(kind='bar', color='skyblue')
plt.title('계절별 평균기온', fontsize=16)
plt.xlabel('계절', fontsize=12)
plt.ylabel('평균기온(℃)', fontsize=12)
plt.xticks(ticks=[0, 1, 2, 3], labels=['봄', '여름', '가을', '겨울'])
plt.show()
