---
title: "팔머펭귄 종별 특징 분석 _ 5조(김예원, 박한슬, 송성필)"
author: "song seong pil"
date: "2025-03-07"
categories: [news, code, analysis]
image: "penguin.jpg"
---

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from palmerpenguins import load_penguins

# 1. 데이터 불러오기 및 기본 정보 출력

In [None]:
penguins = load_penguins()
penguins.info()

# 2. 결측치 제거 및 종별 통계량 계산

In [None]:
penguins = penguins.dropna()
summary = penguins.groupby('species')[['bill_length_mm', 'bill_depth_mm', 'flipper_length_mm', 'body_mass_g']]
stats = summary.agg(['min', 'max', 'median', 'mean'])

print("Species별 통계량:")
print(stats)

# 시각화 - 종별 신체 측정값 분포

In [None]:
plt.figure(figsize=(12, 6))
sns.pairplot(penguins, hue="species")
plt.show()

# 3. 각 측정값별 최대/최소 값을 가진 종 확인

In [None]:
mean_stats = stats.xs('mean', axis=1, level=1)
max_species = mean_stats.idxmax()
max_values = mean_stats.max()
min_species = mean_stats.idxmin()
min_values = mean_stats.min()

extreme_species = pd.DataFrame({
    "Max Species": max_species,
    "Max Value": max_values,
    "Min Species": min_species,
    "Min Value": min_values
})

print("\n각 측정값별 최대/최소 값을 가진 종:")
print(extreme_species)

# 4. 서식지별, 성별, 종별 개체 수 집계

In [None]:
result = penguins.groupby(['island', 'species', 'sex']).size().reset_index(name='count')
print("\n서식지, 종, 성별 별 개체 수:")
print(result)

result2 = penguins.groupby(['island', 'species']).size().reset_index(name='count')
print("\n서식지와 종별 개체 수:")
print(result2)

# 시각화 - 서식지 및 종별 개체 수
plt.figure(figsize=(10, 6))
sns.barplot(data=result2, x='island', y='count', hue='species')
plt.title('서식지별 종 개체 수')
plt.show()

# 성별 개체 수 분포
plt.figure(figsize=(10, 6))
sns.countplot(data=penguins, x='species', hue='sex')
plt.title('종별 성별 개체 수')
plt.show()