In [5]:
import os
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import streamlit as st
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score
import japanize_matplotlib

# ファイル名
DATA_FILE = "saitama_data.csv"
RANKING_FILE = "team_ranking.csv"

# データ読み込み
@st.cache_data
def load_data():
    return pd.read_csv(DATA_FILE)

df = load_data()
numeric_columns = df.select_dtypes(include=['float64', 'int64', 'int32']).columns.tolist()

# UI: タイトルと選択
st.title("📊 埼玉県オープンデータ分析アプリ")
st.markdown("2つの指標を選び、可視化と単回帰分析を体験できます。")

# データ選択
x_col = st.selectbox("X軸にする項目", numeric_columns)
y_col = st.selectbox("Y軸にする項目", [col for col in numeric_columns if col != x_col])

# グラフの種類
graph_type = st.selectbox("表示するグラフの種類", [
    "散布図", "折れ線グラフ", "棒グラフ", "円グラフ", "ヒストグラム", "箱ひげ図"
])

st.subheader("📈 グラフの表示")

# グラフ表示
fig = plt.figure()
if graph_type == "散布図":
    sns.scatterplot(data=df, x=x_col, y=y_col)
elif graph_type == "折れ線グラフ":
    plt.plot(df[x_col], df[y_col], marker="o")
    plt.xlabel(x_col)
    plt.ylabel(y_col)
elif graph_type == "棒グラフ":
    plt.bar(df[x_col], df[y_col])
elif graph_type == "円グラフ":
    if "市町村" in df.columns:
        df_sorted = df.sort_values(y_col, ascending=False).head(10)
        plt.pie(df_sorted[y_col], labels=df_sorted["市町村"], autopct='%1.1f%%')
    else:
        st.warning("市町村列がないため、円グラフが描画できません。")
elif graph_type == "ヒストグラム":
    sns.histplot(df[x_col], kde=True)
elif graph_type == "箱ひげ図":
    sns.boxplot(data=df[[x_col, y_col]])

st.pyplot(fig)

# 単回帰分析
st.subheader("📊 単回帰分析")

X = df[[x_col]].dropna()
y = df[y_col].dropna()
model = LinearRegression()
model.fit(X, y)
y_pred = model.predict(X)
r2 = r2_score(y, y_pred)

st.write(f"回帰式： y = {model.coef_[0]:.3f} * x + {model.intercept_:.3f}")
st.write(f"決定係数 R²： {r2:.3f}")

# 回帰線付き散布図（Plotly）
fig2 = px.scatter(df, x=x_col, y=y_col, trendline="ols", title="回帰直線付き散布図")
st.plotly_chart(fig2)

# ランキング登録
st.subheader("🏆 チームランキング機能")

team_name = st.text_input("チーム名を入力してください")

if st.button("ランキングに登録"):
    if team_name:
        new_record = pd.DataFrame([{
            "チーム名": team_name,
            "X": x_col,
            "Y": y_col,
            "R2": r2
        }])

        if os.path.exists(RANKING_FILE):
            existing = pd.read_csv(RANKING_FILE)
            updated = pd.concat([existing, new_record], ignore_index=True)
        else:
            updated = new_record

        updated.to_csv(RANKING_FILE, index=False)
        st.success("ランキングに登録しました！")

# ランキング表示
if os.path.exists(RANKING_FILE):
    st.subheader("📋 チームランキング一覧（R²順）")
    df_rank = pd.read_csv(RANKING_FILE).sort_values("R2", ascending=False)
    st.dataframe(df_rank)


2025-05-28 17:11:26.992 No runtime found, using MemoryCacheStorageManager
