In [1]:
# app.py

import os
import pickle
from flask import Flask, render_template, request, jsonify

app = Flask(__name__)

# -------------------------------------------------------------------------
# 一、加载预先挖掘好的关联规则
# -------------------------------------------------------------------------
# 假设序列化文件存放在 rules/rules_ap.pkl
RULES_PATH = os.path.join(os.path.dirname(__file__), "rules", "rules_ap.pkl")

with open(RULES_PATH, "rb") as f:
    rules_df = pickle.load(f)

# 将 antecedents/consequents 列从 frozenset 转成 Python 的 set，方便后续判断
# （有时 pickle 会保持 frozenset 格式，这里转成 set 以便操作）
rules_df['antecedents'] = rules_df['antecedents'].apply(lambda x: set(x))
rules_df['consequents'] = rules_df['consequents'].apply(lambda x: set(x))


# -------------------------------------------------------------------------
# 二、推荐函数：根据已选课程列表，返回 N 个推荐课程
# -------------------------------------------------------------------------
def recommend_next(selected_courses, rules_df, num_rec=3):
    """
    参数：
      selected_courses: list of str，表示学生当前已选课程
      rules_df: association_rules 生成的 DataFrame，已加载
      num_rec: 本次希望推荐的课程数量
    返回：
      rec_courses: list of str，长度最多为 num_rec，推荐的课程列表
    逻辑与前面 Notebook 的 recommend_next 保持一致。
    """
    rec_courses = []
    selected_set = set(selected_courses)

    # 1. 精确匹配：antecedents 等于 selected_set
    exact_match = rules_df[
        rules_df['antecedents'].apply(lambda s: s == selected_set)
    ].copy()

    # 2. 若 exact_match 条目不足，则找子集匹配
    if len(exact_match) < num_rec:
        subset_match = rules_df[
            rules_df['antecedents'].apply(lambda s: s.issubset(selected_set) and s != selected_set)
        ].copy()
        combined = pd.concat([exact_match, subset_match], ignore_index=True)
    else:
        combined = exact_match

    # 如果合并后仍为空，直接返回空列表
    if combined.empty:
        return rec_courses

    # 3. 按置信度降序排序
    combined = combined.sort_values(by='confidence', ascending=False)

    # 4. 遍历取推荐
    for _, row in combined.iterrows():
        for c in row['consequents']:
            # c 不能在 selected_set 且不能重复
            if c not in selected_set and c not in rec_courses:
                rec_courses.append(c)
            if len(rec_courses) >= num_rec:
                break
        if len(rec_courses) >= num_rec:
            break

    return rec_courses


# -------------------------------------------------------------------------
# 三、路由与接口
# -------------------------------------------------------------------------
@app.route("/")
def index():
    """
    渲染首页模板。页面会让用户先选一门课程（下拉框），然后发送 AJAX 请求获取推荐列表，
    接着用户再选第二门，再发送请求，如此类推。
    """
    # 需要把所有课程列表传给前端，以便生成“可选项”
    # 从 rules_df 中提取所有出现在 antecedents 和 consequents 的课程名称，去重后排序
    all_courses = set()
    for s in rules_df['antecedents']:
        all_courses.update(s)
    for s in rules_df['consequents']:
        all_courses.update(s)
    all_courses = sorted(list(all_courses))

    return render_template("index.html", all_courses=all_courses)


@app.route("/recommend", methods=["POST"])
def ajax_recommend():
    """
    AJAX 接口：接受前端传来的 JSON，包含已经选的课程列表 和 希望推荐的数量 num_rec，
    返回新的推荐课程列表 JSON。
    请求 JSON 示例：
      {
        "selected": ["IIDS60542", "ANOTHER_COURSE"],
        "num_rec": 2
      }
    响应 JSON 示例：
      {
        "recommendations": ["COURSE_X", "COURSE_Y"]
      }
    """
    data = request.get_json()
    selected = data.get("selected", [])
    num_rec = data.get("num_rec", 3)

    recs = recommend_next(selected, rules_df, num_rec=num_rec)
    return jsonify({"recommendations": recs})


if __name__ == "__main__":
    # 如果部署在本地开发环境，debug 模式下监听 5000 端口
    app.run(debug=True, host="0.0.0.0", port=5000)


NameError: name '__file__' is not defined