### Core 4-01: State Observability Definition

#### 목적
이 노트북은 “상태(state)가 직접 계측 가능한 시스템”과  
“상태가 예측값으로만 대체되는 시스템”의 구조적 차이를 명시적으로 정의한다.

- Battery system: 상태가 직접 계측됨
- Antibody design: 상태 변수 자체가 존재하지 않음

이 차이가 이후 의사결정 안정성의 핵심 원인임을 고정한다.

In [2]:
import pandas as pd
from pathlib import Path

# Battery datasets (Core 0에서 이미 확보된 경로 사용)
nasa_battery_path = Path("../../data_csv/NASA_Battery_Degradation.csv")
li_ion_aging_path = Path("../../data_csv/Lithium-ion_Battery_Aging.csv")

nasa_df = pd.read_csv(nasa_battery_path)
liion_df = pd.read_csv(li_ion_aging_path)

print("NASA Battery Dataset shape:", nasa_df.shape)
print("Li-ion Aging Dataset shape:", liion_df.shape)

NASA Battery Dataset shape: (1415, 7)
Li-ion Aging Dataset shape: (7368, 9)


Battery 시스템의 “상태 변수” 명시

In [3]:
print("=== NASA Battery Dataset Columns ===")
print(nasa_df.columns.tolist())

print("\n=== Li-ion Aging Dataset Columns ===")
print(liion_df.columns.tolist())

# Battery 상태 변수 후보 명시
battery_state_variables = {
    "SOH": "State of Health (directly tracked over cycles)",
    "capacity": "Remaining capacity / capacity fade",
    "R_internal": "Internal resistance (if available)",
}

battery_state_variables # → Battery 데이터에는 ‘상태’를 대표하는 물리적 변수들이 실제로 존재함

=== NASA Battery Dataset Columns ===
['battery_id', 'cycle', 'voltage', 'temperature', 'capacity', 'soh', 'rul']

=== Li-ion Aging Dataset Columns ===
['type', 'ambient_temperature', 'battery_id', 'test_id', 'uid', 'filename', 'Capacity', 'Re', 'Rct']


{'SOH': 'State of Health (directly tracked over cycles)',
 'capacity': 'Remaining capacity / capacity fade',
 'R_internal': 'Internal resistance (if available)'}

In [4]:
antibody_path = Path("../../data_csv/Antibody_Developability.csv")
antibody_df = pd.read_csv(antibody_path)

print("=== Antibody Developability Dataset Columns ===")
print(antibody_df.columns.tolist())

# 항체 데이터에서 상태 변수에 해당할 수 있는 컬럼 점검
potential_state_like_columns = [
    col for col in antibody_df.columns
    if "state" in col.lower() or "health" in col.lower()
]

potential_state_like_columns # Antibody Developability 데이터와 구조 비교

=== Antibody Developability Dataset Columns ===
['antibody_id', 'antibody_name', 'vh_protein_sequence', 'vl_protein_sequence', 'light_aligned_aho', 'heavy_aligned_aho', 'hc_subtype', 'lc_subtype', 'hierarchical_cluster_IgG_isotype_stratified_fold']


[]

In [5]:
state_observability_table = pd.DataFrame([
    {
        "system": "Battery Degradation",
        "direct_state_variable": "Yes",
        "example_variables": "SOH, capacity, internal resistance",
        "state_role": "Decision anchor"
    },
    {
        "system": "Antibody Design",
        "direct_state_variable": "No",
        "example_variables": "None (only predicted scores)",
        "state_role": "Replaced by prediction"
    }
])

state_observability_table # 상태 계측 가능성 비교 테이블 생성

Unnamed: 0,system,direct_state_variable,example_variables,state_role
0,Battery Degradation,Yes,"SOH, capacity, internal resistance",Decision anchor
1,Antibody Design,No,None (only predicted scores),Replaced by prediction


Core 4 — State Observability Definition

- Battery system은 상태(state)가 직접 계측된다.
- 예측값은 상태를 보조하기 위한 수단이다.
- Antibody design에서는 상태 변수 자체가 존재하지 않는다.
- 예측값이 곧 상태처럼 사용되며, 이로 인해 판단 안정성이 붕괴된다.

In [6]:
core4_01_summary = {
    "core": "Core 4-01",
    "key_finding": "State observability differs fundamentally between battery systems and antibody design.",
    "battery_system": "State is directly measured and anchors decisions.",
    "antibody_system": "No direct state variable; prediction substitutes for state.",
    "implication": "Decision instability originates from missing state observability, not prediction accuracy."
}

core4_01_summary

output_path = Path("../artifact/core4")
output_path.mkdir(parents=True, exist_ok=True)

summary_path = output_path / "core4_01_state_observability_summary.json"
pd.Series(core4_01_summary).to_json(summary_path, indent=2)

summary_path

PosixPath('../artifact/core4/core4_01_state_observability_summary.json')