# 연도별 7월, 8월에 채집된 모기 개체수 분석 및 통계적 해석
- 작성자: 서울특별시 통계연구소
- 목적: 데이터 시각화, 추세선, 상관관계 등 통계적 사고 기르기

In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

# 1. 데이터 입력
data = {
    '년도': [2024, 2023, 2022, 2021, 2020, 2019, 2018, 2017, 2016, 2015, 2014, 2013, 2012, 2011, 2010, 2009, 2008],
    '모기 개체 수': [4657, 4171, 2991, 2548, 2501, 2678, 2701, 3526, 7957, 6182, 2793, 4983, 6006, 2328, 4862, 4686, 8447]
}

df = pd.DataFrame(data)

# 2. 데이터 확인
print("✅ 데이터 확인:")
print(df)


In [None]:

# 3. 기본 그래프
plt.figure(figsize=(12,6))
plt.plot(df['년도'], df['모기 개체 수'], marker='o', label='모기 개체 수')
plt.title('연도별 모기 개체 수 변화 (2008~2024)')
plt.xlabel('년도')
plt.ylabel('모기 개체 수')
plt.gca().xaxis()
plt.grid(True)
plt.legend()
plt.show()


In [None]:

# 4. 추세선 (회귀선) 추가 그래프
plt.figure(figsize=(12,6))
sns.regplot(x='년도', y='모기 개체 수', data=df, scatter=True, ci=None, line_kws={"color": "red"})
plt.title('연도별 모기 개체 수 변화 및 추세선')
plt.gca().xaxis()
plt.grid(True)
plt.show()


In [None]:

# 5. 상관계수 계산 (Pearson)
corr = df['년도'].corr(df['모기 개체 수'])
print(f"✅ Pearson 상관계수 (년도 vs 모기 개체 수): {corr:.4f}")

# 6. 회귀식 계산
fit = np.polyfit(df['년도'], df['모기 개체 수'], 1)
print(f"✅ 회귀식: 모기 개체 수 = {fit[0]:.2f} * 연도 + {fit[1]:.2f}")



## 💡 학생 미션
- 2025년 예상 모기 개체 수를 위 회귀식을 이용해 직접 계산해보세요.
- 그래프에 2025년 데이터를 추가해 보고, 추세선과 비교해보세요.
- 모기 개체 수 증감의 원인을 탐구하고 보고서를 작성해보세요.
