In [2]:
pip install pandas numpy

Collecting pandas
  Downloading pandas-2.2.3-cp310-cp310-win_amd64.whl.metadata (19 kB)
Collecting pytz>=2020.1 (from pandas)
  Downloading pytz-2025.1-py2.py3-none-any.whl.metadata (22 kB)
Collecting tzdata>=2022.7 (from pandas)
  Downloading tzdata-2025.1-py2.py3-none-any.whl.metadata (1.4 kB)
Downloading pandas-2.2.3-cp310-cp310-win_amd64.whl (11.6 MB)
   ---------------------------------------- 0.0/11.6 MB ? eta -:--:--
   ----- ---------------------------------- 1.6/11.6 MB 8.4 MB/s eta 0:00:02
   ---------- ----------------------------- 3.1/11.6 MB 8.4 MB/s eta 0:00:02
   ---------------- ----------------------- 4.7/11.6 MB 7.7 MB/s eta 0:00:01
   ---------------------- ----------------- 6.6/11.6 MB 8.1 MB/s eta 0:00:01
   ---------------------------- ----------- 8.4/11.6 MB 8.3 MB/s eta 0:00:01
   ----------------------------------- ---- 10.2/11.6 MB 8.3 MB/s eta 0:00:01
   ---------------------------------------- 11.6/11.6 MB 8.2 MB/s eta 0:00:00
Downloading pytz-2025.1-py2.py3

In [3]:
import pandas as pd
import numpy as np

# CSV 파일 경로 설정 (예: pose_data1.csv 파일)
csv_file = r"C:\barunrun\pose_data\pose_data1.csv"

# 1. CSV 파일 로딩
df = pd.read_csv(csv_file)
print("원본 데이터 형태:", df.shape)
print(df.head())

# 2. 결측치 처리: 결측치가 있는 행은 제거 (필요시 보간 처리도 가능)
df = df.dropna()
print("결측치 제거 후 데이터 형태:", df.shape)

# 3. "frame" 열을 제외한 나머지 열을 피처로 사용
features = df.columns[1:]  # 첫 번째 열은 프레임 번호이므로 제외
data = df[features].values  # numpy 배열, shape: (전체 프레임 수, 33*4)
print("데이터 예시 (numpy 배열, 앞 5행):")
print(data[:5])

# 4. 시퀀스 구성: 예를 들어, 30 프레임을 하나의 시퀀스로 구성
T = 30  # 시퀀스 길이 (30 프레임)
n_frames = data.shape[0]
sequences = []

# 슬라이딩 윈도우 방식으로 시퀀스 구성 (step=1)
for i in range(0, n_frames - T + 1):
    seq = data[i:i+T]
    sequences.append(seq)

sequences = np.array(sequences)
print("구성된 시퀀스 데이터 형태:", sequences.shape)


원본 데이터 형태: (262, 133)
   frame    lm_0_x    lm_0_y    lm_0_z  lm_0_visibility    lm_1_x    lm_1_y  \
0      1  0.599568  0.305586  0.138745         0.998812  0.609226  0.293026   
1      2  0.600175  0.306865  0.203918         0.998912  0.609215  0.294596   
2      3  0.601142  0.309629  0.211641         0.999013  0.609340  0.297091   
3      4  0.601961  0.312763  0.275048         0.999105  0.609351  0.300425   
4      5  0.601966  0.318624  0.297867         0.999190  0.609257  0.306216   

     lm_1_z  lm_1_visibility    lm_2_x  ...   lm_30_z  lm_30_visibility  \
0  0.073039         0.998177  0.610027  ...  0.567259          0.817431   
1  0.133672         0.998329  0.609774  ...  0.481268          0.824506   
2  0.142799         0.998482  0.609773  ...  0.365785          0.834836   
3  0.207170         0.998622  0.609717  ...  0.301716          0.844693   
4  0.232225         0.998750  0.609493  ...  0.263758          0.853135   

    lm_31_x   lm_31_y   lm_31_z  lm_31_visibility   

In [4]:
# (앞에서 시퀀스를 만든 뒤에 이어서 진행한다고 가정)
# sequences.shape: (n_sequences, 30, 132)

# 예시: 전부 "좋은 자세(1)" 라벨로 가정
labels = np.ones((sequences.shape[0], 1))  # shape: (n_sequences, 1)


In [7]:
pip install tensorflow

Collecting tensorflow
  Downloading tensorflow-2.18.0-cp310-cp310-win_amd64.whl.metadata (3.3 kB)
Collecting tensorflow-intel==2.18.0 (from tensorflow)
  Downloading tensorflow_intel-2.18.0-cp310-cp310-win_amd64.whl.metadata (4.9 kB)
Collecting astunparse>=1.6.0 (from tensorflow-intel==2.18.0->tensorflow)
  Using cached astunparse-1.6.3-py2.py3-none-any.whl.metadata (4.4 kB)
Collecting gast!=0.5.0,!=0.5.1,!=0.5.2,>=0.2.1 (from tensorflow-intel==2.18.0->tensorflow)
  Downloading gast-0.6.0-py3-none-any.whl.metadata (1.3 kB)
Collecting google-pasta>=0.1.1 (from tensorflow-intel==2.18.0->tensorflow)
  Using cached google_pasta-0.2.0-py3-none-any.whl.metadata (814 bytes)
Collecting libclang>=13.0.0 (from tensorflow-intel==2.18.0->tensorflow)
  Using cached libclang-18.1.1-py2.py3-none-win_amd64.whl.metadata (5.3 kB)
Collecting requests<3,>=2.21.0 (from tensorflow-intel==2.18.0->tensorflow)
  Downloading requests-2.32.3-py3-none-any.whl.metadata (4.6 kB)
Collecting termcolor>=1.1.0 (from te

In [9]:
pip install scikit-learn

Collecting scikit-learnNote: you may need to restart the kernel to use updated packages.

  Downloading scikit_learn-1.6.1-cp310-cp310-win_amd64.whl.metadata (15 kB)
Collecting joblib>=1.2.0 (from scikit-learn)
  Downloading joblib-1.4.2-py3-none-any.whl.metadata (5.4 kB)
Collecting threadpoolctl>=3.1.0 (from scikit-learn)
  Downloading threadpoolctl-3.5.0-py3-none-any.whl.metadata (13 kB)
Downloading scikit_learn-1.6.1-cp310-cp310-win_amd64.whl (11.1 MB)
   ---------------------------------------- 0.0/11.1 MB ? eta -:--:--
   --- ------------------------------------ 1.0/11.1 MB 5.6 MB/s eta 0:00:02
   --------- ------------------------------ 2.6/11.1 MB 6.6 MB/s eta 0:00:02
   ---------------- ----------------------- 4.7/11.1 MB 7.7 MB/s eta 0:00:01
   ---------------------- ----------------- 6.3/11.1 MB 7.7 MB/s eta 0:00:01
   ----------------------- ---------------- 6.6/11.1 MB 7.5 MB/s eta 0:00:01
   ------------------------ --------------- 6.8/11.1 MB 5.4 MB/s eta 0:00:01
   -----

In [10]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
from sklearn.model_selection import train_test_split

# 1) 시퀀스와 더미 라벨 준비
# sequences.shape = (n_sequences, 30, 132)
# labels.shape = (n_sequences, 1)
X = sequences
y = labels

# 2) 데이터 분할
X_train, X_val, y_train, y_val = train_test_split(X, y, 
                                                  test_size=0.2, 
                                                  random_state=42)

print("훈련용 시퀀스:", X_train.shape)
print("검증용 시퀀스:", X_val.shape)

# 3) 모델 구성
model = Sequential([
    LSTM(64, input_shape=(X.shape[1], X.shape[2])),  # (시퀀스 길이=30, 피처 수=132)
    Dense(1, activation='sigmoid')  # 이진 분류 -> 시그모이드 출력
])

model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

model.summary()

# 4) 모델 학습
model.fit(X_train, y_train, 
          epochs=5, 
          validation_data=(X_val, y_val))


훈련용 시퀀스: (186, 30, 132)
검증용 시퀀스: (47, 30, 132)


  super().__init__(**kwargs)


Epoch 1/5
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 57ms/step - accuracy: 0.6247 - loss: 0.5580 - val_accuracy: 1.0000 - val_loss: 0.0852
Epoch 2/5
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 17ms/step - accuracy: 1.0000 - loss: 0.0635 - val_accuracy: 1.0000 - val_loss: 0.0234
Epoch 3/5
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 17ms/step - accuracy: 1.0000 - loss: 0.0199 - val_accuracy: 1.0000 - val_loss: 0.0118
Epoch 4/5
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 17ms/step - accuracy: 1.0000 - loss: 0.0107 - val_accuracy: 1.0000 - val_loss: 0.0077
Epoch 5/5
[1m6/6[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 18ms/step - accuracy: 1.0000 - loss: 0.0072 - val_accuracy: 1.0000 - val_loss: 0.0057


<keras.src.callbacks.history.History at 0x22099151270>

In [13]:
import os
import pandas as pd
import numpy as np

def load_csv_and_make_sequences(csv_path, seq_length=30):
    """
    단일 CSV 파일에서 프레임별 포즈 데이터를 읽어,
    결측치 제거 후, seq_length만큼 슬라이딩 윈도우로 시퀀스를 구성하여 반환.
    """
    df = pd.read_csv(csv_path)
    df = df.dropna()
    
    # 첫 번째 열('frame') 제외, 나머지(랜드마크 33*4=132개) 사용
    data = df.iloc[:, 1:].values  # shape: (프레임 수, 132)
    n_frames = data.shape[0]
    
    sequences = []
    for i in range(n_frames - seq_length + 1):
        seq = data[i:i+seq_length]
        sequences.append(seq)
    sequences = np.array(sequences)  # shape: (n_seq, seq_length, 132)
    
    return sequences


In [17]:
# CSV 파일들이 있는 폴더
csv_directory = r"C:\barunrun\pose_data"

# 불러올 파일 번호 범위
start_num = 1
end_num = 10

all_expert_sequences = []

for i in range(start_num, end_num + 1):
    csv_file = f"pose_data{i}.csv"  # 예: pose_data1.csv, pose_data2.csv, ...
    csv_path = os.path.join(csv_directory, csv_file)
    
    # 파일이 존재하는지 확인
    if not os.path.exists(csv_path):
        print(f"{csv_path} 파일이 없습니다. 스킵합니다.")
        continue
    
    print(f"로드 중: {csv_path}")
    seqs = load_csv_and_make_sequences(csv_path, seq_length=30)
    all_expert_sequences.append(seqs)

# 전문가용 CSV 10개에서 추출한 시퀀스를 하나로 합침
if len(all_expert_sequences) == 0:
    print("로드된 CSV가 없습니다. 경로와 파일명을 확인해 주세요.")
else:
    X_expert = np.concatenate(all_expert_sequences, axis=0)
    print("전문가 전체 시퀀스 shape:", X_expert.shape)


로드 중: C:\barunrun\pose_data\pose_data1.csv
로드 중: C:\barunrun\pose_data\pose_data2.csv
로드 중: C:\barunrun\pose_data\pose_data3.csv
로드 중: C:\barunrun\pose_data\pose_data4.csv
로드 중: C:\barunrun\pose_data\pose_data5.csv
로드 중: C:\barunrun\pose_data\pose_data6.csv
로드 중: C:\barunrun\pose_data\pose_data7.csv
로드 중: C:\barunrun\pose_data\pose_data8.csv
로드 중: C:\barunrun\pose_data\pose_data9.csv
로드 중: C:\barunrun\pose_data\pose_data10.csv
전문가 전체 시퀀스 shape: (3172, 30, 132)


In [18]:
from sklearn.svm import OneClassSVM

# 만약 위에서 X_expert를 성공적으로 생성했다면,
# (n_expert_seq, 30, 132) 형태일 것입니다.

if 'X_expert' in locals():
    # 시퀀스 평탄화
    X_expert_flat = X_expert.reshape(X_expert.shape[0], -1)  # (n_expert_seq, 30*132)
    
    ocsvm = OneClassSVM(kernel='rbf', nu=0.1, gamma='auto')
    ocsvm.fit(X_expert_flat)
    
    pred_expert = ocsvm.predict(X_expert_flat)
    print("전문가 데이터 예측 결과:", np.unique(pred_expert, return_counts=True))
    # +1: 정상, -1: 이상치
else:
    print("X_expert가 정의되지 않았습니다. CSV 로드 과정에서 문제가 없는지 확인해 주세요.")


전문가 데이터 예측 결과: (array([-1,  1], dtype=int64), array([ 316, 2856], dtype=int64))


In [20]:
# 예: pose_data_abnormal1.csv
csv_path_abnormal = r"C:\barunrun\pose_data\pose_data_abnormal1.csv"
X_abnormal = load_csv_and_make_sequences(csv_path_abnormal, seq_length=30)
X_abnormal_flat = X_abnormal.reshape(X_abnormal.shape[0], -1)

pred_abnormal = ocsvm.predict(X_abnormal_flat)
print("비정상 데이터 예측 결과:", np.unique(pred_abnormal, return_counts=True))


비정상 데이터 예측 결과: (array([-1,  1], dtype=int64), array([ 21, 360], dtype=int64))


In [21]:
ocsvm = OneClassSVM(kernel='rbf', nu=0.01, gamma=0.001)
ocsvm.fit(X_expert_flat)


In [22]:
from sklearn.model_selection import ParameterGrid

param_grid = {
    'nu': [0.001, 0.01, 0.1, 0.2],
    'gamma': [0.0001, 0.001, 0.01, 'auto']
}

best_score = -9999
best_params = None

for params in ParameterGrid(param_grid):
    ocsvm = OneClassSVM(kernel='rbf', **params)
    ocsvm.fit(X_expert_flat)
    
    # 전문가 데이터 예측
    pred_expert = ocsvm.predict(X_expert_flat)
    # 비정상 데이터 예측
    pred_abnormal = ocsvm.predict(X_abnormal_flat)
    
    # 전문가(+1)와 비정상(-1)이 얼마나 잘 분리되는지 간단한 점수 계산
    expert_score = (pred_expert == 1).mean()      # 전문가 중 정상으로 나온 비율
    abnormal_score = (pred_abnormal == -1).mean() # 비정상 중 이상치로 나온 비율
    score = expert_score + abnormal_score         # 두 점수를 단순 합
    
    if score > best_score:
        best_score = score
        best_params = params

print("Best params:", best_params, "Score:", best_score)


Best params: {'gamma': 0.01, 'nu': 0.01} Score: 1.9366330390920554


In [23]:
best_params = {'gamma': 0.01, 'nu': 0.01}
ocsvm = OneClassSVM(kernel='rbf', **best_params)
ocsvm.fit(X_expert_flat)

# 전문가 데이터 예측
pred_expert = ocsvm.predict(X_expert_flat)
print("전문가 예측 결과:", np.unique(pred_expert, return_counts=True))

# 비정상 데이터 예측
pred_abnormal = ocsvm.predict(X_abnormal_flat)
print("비정상 예측 결과:", np.unique(pred_abnormal, return_counts=True))


전문가 예측 결과: (array([-1,  1], dtype=int64), array([ 201, 2971], dtype=int64))
비정상 예측 결과: (array([-1], dtype=int64), array([381], dtype=int64))


In [24]:
import numpy as np
import pandas as pd
from sklearn.decomposition import PCA
from sklearn.svm import OneClassSVM

# 1. CSV -> 시퀀스 -> 평탄화 과정을 이미 거쳤다고 가정
#    예: X_expert_flat, X_abnormal_flat (shape: (n_seq, 30*132))

# 예시로 전문가(정상)와 비정상 데이터가 준비되어 있다고 가정
# X_expert_flat = ...
# X_abnormal_flat = ...

# 2. PCA로 차원 축소
#    n_components를 적절히 조정(예: 20~100 사이)하면서 테스트
pca = PCA(n_components=50)
X_expert_pca = pca.fit_transform(X_expert_flat)  # 전문가 데이터로 PCA 학습
X_abnormal_pca = pca.transform(X_abnormal_flat)  # 비정상 데이터 변환

print("원본 차원:", X_expert_flat.shape[1], "-> PCA 차원:", X_expert_pca.shape[1])

# 3. One-Class SVM 모델 (파라미터 조정)
ocsvm = OneClassSVM(kernel='rbf', nu=0.001, gamma=0.001)
ocsvm.fit(X_expert_pca)

# 4. 예측
pred_expert = ocsvm.predict(X_expert_pca)
pred_abnormal = ocsvm.predict(X_abnormal_pca)

# 5. 결과 확인
unique_expert, counts_expert = np.unique(pred_expert, return_counts=True)
unique_abn, counts_abn = np.unique(pred_abnormal, return_counts=True)

print("전문가 예측 결과:", (unique_expert, counts_expert))
print("비정상 예측 결과:", (unique_abn, counts_abn))


원본 차원: 3960 -> PCA 차원: 50
전문가 예측 결과: (array([-1,  1], dtype=int64), array([   9, 3163], dtype=int64))
비정상 예측 결과: (array([1], dtype=int64), array([381], dtype=int64))


In [26]:
import os
import pandas as pd
import numpy as np

###############################
# (1) 중요 관절만 골라내는 함수
###############################
def select_important_joints(frame_1d):
    """
    단일 프레임(1차원 배열)에서 특정 관절만 추출하는 예시 함수.
    frame_1d.shape = (132,) = (33개 랜드마크 × 4개 값)

    예: 무릎(25, 26), 엉덩이(23, 24), 발목(27, 28) 등
    각 랜드마크의 x, y, z, visibility 순으로 4개 값이 붙어 있으므로,
    인덱스 계산: landmark_idx * 4 + (0~3)
    """
    # 예: 왼쪽 무릎(25), 오른쪽 무릎(26), 왼쪽 엉덩이(23), 오른쪽 엉덩이(24)
    #     왼쪽 발목(27), 오른쪽 발목(28) 등만 골라본다고 가정
    important_landmarks = [23, 24, 25, 26, 27, 28]
    
    selected_values = []
    for lm_idx in important_landmarks:
        base = lm_idx * 4
        # frame_1d[base] = x, frame_1d[base+1] = y, frame_1d[base+2] = z, frame_1d[base+3] = visibility
        selected_values.extend(frame_1d[base:base+4])
    
    return np.array(selected_values)  # shape: (6*4=24,)


###############################
# (2) CSV를 로드하여 시퀀스를 구성하는 함수
###############################
def load_csv_and_make_sequences(csv_path, seq_length=30):
    """
    CSV 파일에서 프레임별 포즈 데이터를 읽고, 결측치 제거 후,
    seq_length만큼 슬라이딩 윈도우로 시퀀스를 구성하여 반환.
    각 프레임(1행)은 33개 랜드마크 * 4개 값 = 132개 열을 가진다고 가정.
    """
    df = pd.read_csv(csv_path)
    df = df.dropna()
    
    # 첫 번째 열('frame') 제외, 나머지 132개 열(랜드마크)을 numpy로 추출
    data = df.iloc[:, 1:].values  # shape: (프레임 수, 132)
    n_frames = data.shape[0]
    
    sequences = []
    for i in range(n_frames - seq_length + 1):
        # seq.shape = (seq_length, 132)
        seq = data[i:i+seq_length]
        
        # 특정 관절만 골라서 차원을 줄임
        # seq_selected.shape = (seq_length, 24)  # (6개 관절 × 4개 값)
        seq_selected = np.array([select_important_joints(frame) for frame in seq])
        
        # seq_selected.shape = (seq_length, 24)
        sequences.append(seq_selected)
    
    # 최종 shape: (n_seq, seq_length, 24) -> 관절을 선택했기 때문에 24가 됨
    return np.array(sequences)


###############################
# (3) 예시 사용
###############################
if __name__ == "__main__":
    # 시퀀스 길이 정의
    SEQ_LENGTH = 30
    
    # 예: pose_data1.csv 로부터 시퀀스 로드
    csv_path = r"C:\barunrun\pose_data\pose_data1.csv"
    
    X_expert = load_csv_and_make_sequences(csv_path, seq_length=SEQ_LENGTH)
    print("X_expert shape:", X_expert.shape)  # (n_seq, 30, 24) 정도로 예상

    # 이 다음 단계에서 X_expert를 평탄화하거나 (n_seq, 30*24),
    # PCA, One-Class SVM, Autoencoder 등 원하는 모델에 입력해 사용하시면 됩니다.


X_expert shape: (545, 30, 24)


In [27]:
from sklearn.svm import OneClassSVM
import numpy as np

# X_expert.shape = (545, 30, 24)
X_expert_flat = X_expert.reshape(X_expert.shape[0], -1)  # (545, 720)

ocsvm = OneClassSVM(kernel='rbf', nu=0.01, gamma=0.001)
ocsvm.fit(X_expert_flat)

pred_expert = ocsvm.predict(X_expert_flat)
print("전문가 예측 결과:", np.unique(pred_expert, return_counts=True))
# +1: 정상, -1: 이상치


전문가 예측 결과: (array([-1,  1], dtype=int64), array([ 12, 533], dtype=int64))


In [28]:
from sklearn.decomposition import PCA

pca = PCA(n_components=50)
X_expert_pca = pca.fit_transform(X_expert_flat)  # (545, 50)

ocsvm = OneClassSVM(kernel='rbf', nu=0.01, gamma=0.001)
ocsvm.fit(X_expert_pca)

pred_expert = ocsvm.predict(X_expert_pca)
print("전문가 예측 결과:", np.unique(pred_expert, return_counts=True))


전문가 예측 결과: (array([-1,  1], dtype=int64), array([  7, 538], dtype=int64))


In [30]:
import numpy as np

def check_oneclass_results(pred_expert, pred_abnormal):
    """
    One-Class SVM 예측 결과를 간단히 확인하는 함수.
    pred_expert: 전문가 데이터 예측 결과 (배열, +1 or -1)
    pred_abnormal: 비정상 데이터 예측 결과 (배열, +1 or -1)
    """
    # 전문가 예측
    unique_expert, counts_expert = np.unique(pred_expert, return_counts=True)
    expert_dict = dict(zip(unique_expert, counts_expert))
    # +1: 정상, -1: 이상치
    total_expert = len(pred_expert)
    expert_normal_count = expert_dict.get(1, 0)   # 전문가 중 +1로 나온 개수
    expert_abnormal_count = expert_dict.get(-1, 0)  # 전문가 중 -1로 나온 개수
    expert_normal_ratio = expert_normal_count / total_expert  # 전문가 중 정상 비율
    
    # 비정상 예측
    unique_abn, counts_abn = np.unique(pred_abnormal, return_counts=True)
    abn_dict = dict(zip(unique_abn, counts_abn))
    total_abn = len(pred_abnormal)
    abn_normal_count = abn_dict.get(1, 0)   # 비정상 중 +1로 나온 개수
    abn_abnormal_count = abn_dict.get(-1, 0)  # 비정상 중 -1로 나온 개수
    abn_abnormal_ratio = abn_abnormal_count / total_abn  # 비정상 중 이상치 비율

    # 출력
    print("===== 전문가(정상) 데이터 예측 결과 =====")
    print(f"총 {total_expert}개 중 정상(+1): {expert_normal_count}, 이상치(-1): {expert_abnormal_count}")
    print(f"정상 비율: {expert_normal_ratio:.3f}")

    print("\n===== 비정상 데이터 예측 결과 =====")
    print(f"총 {total_abn}개 중 정상(+1): {abn_normal_count}, 이상치(-1): {abn_abnormal_count}")
    print(f"이상치 비율: {abn_abnormal_ratio:.3f}")

    # 간단 점수: (전문가 중 정상 비율 + 비정상 중 이상치 비율)
    score = expert_normal_ratio + abn_abnormal_ratio
    print(f"\n간단 평가 점수: {score:.3f}")


In [31]:
# 이미 One-Class SVM으로 학습 완료 후, 예측 결과가 있다고 가정
# pred_expert = ocsvm.predict(X_expert_flat)
# pred_abnormal = ocsvm.predict(X_abnormal_flat)

check_oneclass_results(pred_expert, pred_abnormal)


===== 전문가(정상) 데이터 예측 결과 =====
총 545개 중 정상(+1): 538, 이상치(-1): 7
정상 비율: 0.987

===== 비정상 데이터 예측 결과 =====
총 381개 중 정상(+1): 381, 이상치(-1): 0
이상치 비율: 0.000

간단 평가 점수: 0.987


## 요약
- One-Class SVM에는 ‘추가 학습’이라는 개념이 없다.   
- .fit()을 다시 호출할 때마다 새롭게 모델을 훈련한다.   
- 여러 번 호출한다고 성능이 누적되지 않는다.   

### 성능을 높이는 방법:
(A) 하이퍼파라미터 재조정 (nu, gamma 등)   
(B) 데이터 전처리(특징 선택, PCA)   
(C) 모델 변경(LSTM Autoencoder 등)   
(D) 데이터 확충(더 많은 비정상 영상 확보)   

현재 상태: 비정상 데이터를 전부 +1로 놓치는 것은, 모델이 비정상과 정상의 차이를 잘 못 찾고 있음을 의미.   
파라미터 튜닝, 특징 추출 개선, 또는 데이터 확충을 시도해야 한다.

즉, “학습을 더 시킨다” = 하이퍼파라미터와 데이터 전처리/특징 선택을 바꿔가며 .fit()을 재실행하는 과정을 의미.   
그 과정을 반복하면서, 정상/비정상 분류가 원하는 수준에 가까워지는지 확인해야 한다.