In [6]:
import streamlit as st
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import io
import matplotlib.font_manager as fm


In [5]:
pd.read_csv("data/processed_data.csv")


FileNotFoundError: [Errno 2] No such file or directory: 'data/processed_data.csv'

In [None]:

# 2️⃣ 기본 데이터 정보 확인
st.subheader("✅ 데이터 정보 확인")
buffer = io.StringIO()
df.info(buf=buffer)
info_str = buffer.getvalue()
st.text(info_str)

st.subheader("✅ 데이터 통계 요약")
st.write(df.describe())

# 3️⃣ 수치형 변수 분포 확인 (히스토그램, Seaborn 사용)
st.subheader("📊 수치형 변수 분포")
num_features = ['평균심박수', '이상심박수', '피로도값', '혈관연령', '정신스트레스값', '신체스트레스값']

fig, axes = plt.subplots(2, 3, figsize=(15, 10))
axes = axes.flatten()  # 2D 배열을 1D로 변환

for i, col in enumerate(num_features):
    sns.histplot(df[col], bins=30, kde=True, ax=axes[i])
    axes[i].set_title(col, fontproperties=fontprop)  # ✅ 한글 적용
    axes[i].set_xlabel("값", fontproperties=fontprop)
    axes[i].set_ylabel("빈도", fontproperties=fontprop)

plt.tight_layout()
st.pyplot(fig)  # ✅ 한글 적용된 히스토그램 출력

# 4️⃣ 변수 간 관계 분석 (상관관계 히트맵)
st.subheader("📈 변수 간 상관관계")
fig, ax = plt.subplots(figsize=(10, 8))
sns.heatmap(df[num_features].corr(), annot=True, cmap='coolwarm', fmt=".2f", linewidths=0.5, ax=ax)
ax.set_title("변수 간 상관관계", fontproperties=fontprop)
ax.set_xticklabels(ax.get_xticklabels(), fontproperties=fontprop)
ax.set_yticklabels(ax.get_yticklabels(), fontproperties=fontprop)
st.pyplot(fig)



# 6️⃣ 범주형 변수 분포 확인 (행정동명)

st.subheader("🏡 행정동별 데이터 분포 (상위 10개)")
fig, ax = plt.subplots(figsize=(12, 5))
top10_districts = df['행정동명'].value_counts().head(10).index  # ✅ 더 직관적인 코드로 변경
sns.countplot(data=df, y=df['행정동명'], order=top10_districts, palette="coolwarm", ax=ax)  # ✅ 순서 정렬
ax.set_title("상위 10개 행정동 데이터 분포", fontproperties=fontprop)
ax.set_xlabel("수량", fontproperties=fontprop)
ax.set_ylabel("행정동명", fontproperties=fontprop)
st.pyplot(fig)

# 7️⃣ 이상치 탐지 (Boxplot)
st.subheader("⚠️ 이상치 탐지 (Boxplot)")
fig, ax = plt.subplots(figsize=(10, 6))
sns.boxplot(data=df[num_features], ax=ax)
ax.set_xticklabels(ax.get_xticklabels(), rotation=30, fontproperties=fontprop)  # ✅ 가독성 개선
ax.set_title("이상치 탐지 (Boxplot)", fontproperties=fontprop)
ax.set_xlabel("변수명", fontproperties=fontprop)
ax.set_ylabel("값", fontproperties=fontprop)
st.pyplot(fig)


st.success("✅ 탐색적 데이터 분석 완료!")

print("📌 데이터 컬럼 확인:", df.columns.unique())
print(df.loc[[:,"평균심박수":"행정동명_해밀동"]])