In [None]:
import streamlit as st
import pandas as pd
import joblib
import numpy as np
import matplotlib.pyplot as plt

# 加载模型和数据
model = joblib.load('xgb_model.pkl')
feature_names = joblib.load('feature_names.pkl')
category_options = joblib.load('category_options.pkl')

# 页面设置
st.title("电信用户流失预测系统")
st.markdown("""
**关键发现**：  
- 在网时长（`tenure`）是最重要特征  
- 使用**电子支票**的用户流失率更高  
- 月费用≥第3分位的用户风险高  
""")

# --- 用户输入区域 ---
st.sidebar.header("输入特征")
inputs = {}

# 1. 关键特征（根据你的分析重点）
inputs['tenure'] = st.sidebar.slider("在网时长（月）", 0, 72, 12)
inputs['Contract'] = st.sidebar.selectbox("合同类型", category_options['Contract'])
inputs['PaymentMethod'] = st.sidebar.selectbox("付款方式", category_options['PaymentMethod'])
inputs['MonthlyCharges'] = st.sidebar.selectbox("月费用分位", category_options['MonthlyCharges'])

# 2. 其他特征设默认值（非重点字段）
for col in feature_names:
    if col not in inputs:
        inputs[col] = 0  # 数值型默认0，如果是分类字段需调整

# --- 预测与结果展示 ---
if st.sidebar.button("预测"):
    # 转换输入格式
    input_df = pd.DataFrame([inputs])[feature_names]
    
    # 预测
    proba = model.predict_proba(input_df)[0][1]
    st.success(f"流失概率: {proba:.1%}")

    # 高风险告警（基于你的分析）
    if inputs['PaymentMethod'] == 'Electronic check' or inputs['MonthlyCharges'] in ['3', '4']:
        st.error("⚠️ 高风险用户组合：电子支票 + 高月费")

    # 特征重要性可视化
    st.subheader("模型认为最重要的特征")
    fig, ax = plt.subplots()
    ax.barh(feature_names, model.feature_importances_)
    st.pyplot(fig)