#### Core 8 – MySQL 운영 로그 영속화 (선택)

이 노트북은 Core 7–8 거버넌스 실행 과정에서 발생한 이벤트를
**운영 로그 형태로 영속화(persistence)** 하기 위한
최소 수준의 데이터베이스 레이어를 정의한다.

- MySQL은 **분석용으로 사용하지 않는다**
- MySQL은 오직 다음을 저장하기 위해 사용한다
  - 거버넌스 실행 이벤트 (Core 7)
  - 거절(refusal) 상태 전이 추적 (Core 8)

이는 정책 제약이
**실제로 실행되었고, 트리거되었으며, 시스템 로그로 남을 수 있음**을
증명하기 위한 운영 시스템 수준의 근거이다.

In [6]:
import pandas as pd
from sqlalchemy import create_engine, text
from datetime import datetime

ENGINE_URI = "mysql+pymysql://cube_user:cube_user_hi@localhost:3306/Developability"

engine = create_engine(
    ENGINE_URI,
    pool_pre_ping=True,
    future=True
)


with engine.connect() as conn:
    conn.execute(text("SELECT 1"))

✔️ 이 셀에서 에러가 발생하지 않으면  
MySQL 운영 DB와의 연결은 정상적으로 완료된 상태이다.

In [None]:
drop_refusal_state_trace = """
DROP TABLE IF EXISTS refusal_state_trace;
"""

create_refusal_state_trace = """
CREATE TABLE refusal_state_trace (
    id BIGINT AUTO_INCREMENT PRIMARY KEY,

    run_id VARCHAR(64) NOT NULL,
    case_id VARCHAR(64) NOT NULL,
    antibody_id VARCHAR(64) NOT NULL,

    step INT NOT NULL,

    refusal_stage VARCHAR(64),
    refusal_mode VARCHAR(64),

    blocked_rate_window FLOAT,
    veto_streak INT,
    action_toggle_rate FLOAT,

    SoMS_cumsum_window FLOAT,

    refusal_triggered BOOLEAN,
    refusal_reason_code VARCHAR(128),

    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);
""" # refusal_state_trace 테이블 초기화

with engine.begin() as conn:
    conn.execute(text(drop_refusal_state_trace))
    conn.execute(text(create_refusal_state_trace))

    CSV_PATH = "../../core/artifact/core8/core8_03_refusal_state_trace_counterfactual.csv"

df = pd.read_csv(CSV_PATH)

expected_cols = [
    "run_id",
    "case_id",
    "antibody_id",
    "step",
    "refusal_stage",
    "refusal_mode",
    "blocked_rate_window",
    "veto_streak",
    "action_toggle_rate",
    "SoMS_cumsum_window",
    "refusal_triggered",
    "refusal_reason_code",
]

missing = [c for c in expected_cols if c not in df.columns]
extra   = [c for c in df.columns if c not in expected_cols]

print("missing:", missing)
print("extra:", extra)

assert not missing, f"CSV에 필요한 컬럼 누락: {missing}"

df[expected_cols].head(), df.shape # CSV 로드 및 컬럼 검증

missing: []
extra: []


(                run_id         case_id antibody_id  step  refusal_stage  \
 0  core7_04_1767776352  A_ALWAYS_ALLOW  antibody_A     0              0   
 1  core7_04_1767776352  A_ALWAYS_ALLOW  antibody_A     1              0   
 2  core7_04_1767776352  A_ALWAYS_ALLOW  antibody_A     2              0   
 3  core7_04_1767776352  A_ALWAYS_ALLOW  antibody_A     3              0   
 4  core7_04_1767776352  A_ALWAYS_ALLOW  antibody_A     4              0   
 
   refusal_mode  blocked_rate_window  veto_streak  action_toggle_rate  \
 0       NORMAL                  0.0          0.0                 0.0   
 1       NORMAL                  0.0          0.0                 0.0   
 2       NORMAL                  0.0          0.0                 0.0   
 3       NORMAL                  0.0          0.0                 0.0   
 4       NORMAL                  0.0          0.0                 0.0   
 
    SoMS_cumsum_window  refusal_triggered           refusal_reason_code  
 0                 0.0      

In [None]:
load_df = df[expected_cols].copy()

load_df["step"] = pd.to_numeric(load_df["step"], errors="coerce").astype("Int64")
load_df["blocked_rate_window"] = pd.to_numeric(load_df["blocked_rate_window"], errors="coerce")
load_df["veto_streak"] = pd.to_numeric(load_df["veto_streak"], errors="coerce").astype("Int64")
load_df["action_toggle_rate"] = pd.to_numeric(load_df["action_toggle_rate"], errors="coerce")
load_df["SoMS_cumsum_window"] = pd.to_numeric(load_df["SoMS_cumsum_window"], errors="coerce")

load_df["refusal_triggered"] = (
    load_df["refusal_triggered"]
    .astype(str)
    .str.lower()
    .map({"true": True, "false": False, "1": True, "0": False})
)

load_df.dtypes # 타입 정규화

load_df.to_sql(
    "refusal_state_trace",
    con=engine,
    if_exists="append",
    index=False,
    method="multi",
    chunksize=2000
)

print("Inserted rows:", len(load_df)) # MySQL 적재 (CSV → DB)

Inserted rows: 180


In [None]:
with engine.connect() as conn:
    n = conn.execute(
        text("SELECT COUNT(*) FROM refusal_state_trace")
    ).scalar()
    print("row_count:", n)

    sample = conn.execute(text("""
        SELECT
            run_id,
            case_id,
            antibody_id,
            step,
            refusal_stage,
            refusal_mode,
            blocked_rate_window,
            veto_streak,
            action_toggle_rate,
            SoMS_cumsum_window,
            refusal_triggered,
            refusal_reason_code,
            created_at
        FROM refusal_state_trace
        ORDER BY id DESC
        LIMIT 5
    """)).fetchall()

sample # 적재 결과 검증

row_count: 180


[('core7_04_1767776352', 'B_GOVERNED', 'antibody_C', 29, '0', 'NORMAL', 0.1, 0, 0.222222, 17.5, 0, None, datetime.datetime(2026, 1, 7, 19, 34, 40)),
 ('core7_04_1767776352', 'B_GOVERNED', 'antibody_C', 28, '0', 'NORMAL', 0.1, 0, 0.222222, 16.05, 0, None, datetime.datetime(2026, 1, 7, 19, 34, 40)),
 ('core7_04_1767776352', 'B_GOVERNED', 'antibody_C', 27, '0', 'NORMAL', 0.2, 0, 0.333333, 14.6, 0, None, datetime.datetime(2026, 1, 7, 19, 34, 40)),
 ('core7_04_1767776352', 'B_GOVERNED', 'antibody_C', 26, '0', 'NORMAL', 0.2, 0, 0.444444, 13.15, 0, None, datetime.datetime(2026, 1, 7, 19, 34, 40)),
 ('core7_04_1767776352', 'B_GOVERNED', 'antibody_C', 25, '0', 'NORMAL', 0.2, 0, 0.444444, 11.7, 0, None, datetime.datetime(2026, 1, 7, 19, 34, 40))]