<a href="https://colab.research.google.com/github/jjangmo91/ParkLab/blob/main/Python/05_Module_%26_Package_%26_Library.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Colab에서 바로 설치
!pip install pandas numpy matplotlib seaborn
# 한글 폰트 설치
!apt-get update -qq
!apt-get install -y fonts-nanum

In [None]:
# pandas: 데이터 불러오기 및 데이터 프레임 관리
import pandas as pd

# numpy: 수치 연산 및 배열 처리
import numpy as np

# matplotlib, seaborn: 데이터 시각화
import matplotlib.pyplot as plt
import seaborn as sns
import matplotlib.font_manager as fm

# 한글 폰트 등록 및 설정
font_dirs = ['/usr/share/fonts/truetype/nanum/']
for font_path in fm.findSystemFonts(font_dirs):
    fm.fontManager.addfont(font_path)
plt.rc('font', family='NanumGothic')
plt.rc('axes', unicode_minus=False)

In [None]:
# 국립공원 데이터 불러오기
file_path = (
    "https://raw.githubusercontent.com/jjangmo91/ParkLab/refs/heads/main/data/"
    "%EA%B5%AD%EB%A6%BD%EA%B3%B5%EC%9B%90_%EC%83%9D%EB%AC%BC%EC%9E%90%EC%9B%90%ED%98%84%ED%99%A9_2023.csv"
)
df = pd.read_csv(file_path, encoding='utf-8')

In [None]:
# 데이터 확인 (상위 5개 행)
print(df.head())

In [None]:
# 데이터 기본 정보 확인
print(df.info())

In [None]:
# 전체 관측 레코드 수 및 기간 확인
total_records = len(df)
df['조사일자'] = pd.to_datetime(df['조사일자'], errors='coerce')
start_date = df['조사일자'].min().date()
end_date = df['조사일자'].max().date()
print(f"전체 관측 레코드 수: {total_records}")
print(f"조사기간: {start_date} ~ {end_date}")

In [None]:
# 국립공원별 관측 레코드 수 및 종 수 계산
record_counts = df['국립공원'].value_counts()
species_counts = df.groupby('국립공원')['종명'].nunique()
summary = pd.DataFrame({'관측레코드수': record_counts, '종수': species_counts}).sort_values('관측레코드수')

In [None]:
# 시각화 1: 국립공원별 관측 레코드 수 및 종 수 비교
fig, ax = plt.subplots(figsize=(10, 8))
summary.plot(kind='barh', ax=ax, color=['steelblue', 'darkorange'], width=0.7)
max_val = summary['관측레코드수'].max()
for i, (rec, spe) in enumerate(zip(summary['관측레코드수'], summary['종수'])):
    ax.text(rec + max_val*0.01, i-0.15, f'{rec:,}', va='center')
    ax.text(spe + max_val*0.01, i+0.15, f'{spe:,}', va='center')
ax.set_title('국립공원별 관측 레코드 수 및 종 수')
ax.set_xlabel('Count')
ax.set_ylabel('국립공원')
ax.legend(['관측 레코드 수', '종 수'])
plt.tight_layout()
plt.show()

In [None]:
# 시각화 2: 상위 20개 종별 관측 빈도
species_freq = df['종명'].value_counts().head(20)
print(f"총 고유 종 수: {df['종명'].nunique()}")
plt.figure(figsize=(8, 6))
species_freq.sort_values().plot(kind='barh', color='forestgreen')
plt.title('상위 20개 종별 관측 빈도')
plt.xlabel('관측 빈도')
plt.ylabel('종명')
plt.tight_layout()
plt.show()