In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, f1_score
from sklearn.preprocessing import StandardScaler
from imblearn.over_sampling import RandomOverSampler


# 1. CSV 파일을 데이터프레임으로 임포트
df = pd.read_csv('/Users/whovi/OneDrive/Documents/monunmon.csv')


In [4]:
# 2. 'Label' 칼럼을 이진 라벨로 매핑
def map_to_binary(label):
    try:
        label_int = int(label)
        if 0 <= label_int <= 94:
            return 1  # monitored
        else:
            return -1  # unmonitored
    except ValueError:
        # 'Label' 값이 숫자가 아닌 경우
        return -1

df['BinaryLabel'] = df['Label'].apply(map_to_binary)

In [5]:
# 3. 특징과 라벨 분리
X = df.drop(['Label', 'BinaryLabel'], axis=1)  
y = df['BinaryLabel']

In [6]:
# 4. 데이터 스케일링 
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

In [7]:
# 5. 오버샘플링 적용 (소수 클래스 '1'을 다수 클래스와 동일하게 증강)
ros = RandomOverSampler(random_state=42)
X_resampled, y_resampled = ros.fit_resample(X_scaled, y)

In [None]:
# 6. 훈련 데이터와 테스트 데이터로 분리 
X_train, X_test, y_train, y_test = train_test_split(
    X_resampled, y_resampled, test_size=0.2, random_state=42, stratify=y_resampled
)

# 7. SVM 모델 초기화 및 학습
svm = SVC(kernel='linear', class_weight=None, random_state=42)
svm.fit(X_train, y_train)

# 8. 테스트 데이터에 대해 예측 수행
y_pred = svm.predict(X_test)

# 9. 정확도와 F1 스코어 계산
accuracy = accuracy_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred, pos_label=1)

print(f"Accuracy: {accuracy:.4f}")
print(f"F1 Score: {f1:.4f}")

Accuracy: 0.6871
F1 Score: 0.7099


In [9]:
# 7. SVM 모델 초기화 및 학습
svm2 = SVC(kernel='poly', degree=3, gamma='scale', coef0=1, class_weight=None, random_state=42)
svm2.fit(X_train, y_train)

# 8. 테스트 데이터에 대해 예측 수행
y_pred = svm2.predict(X_test)

# 9. 정확도와 F1 스코어 계산
accuracy = accuracy_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred, pos_label=1)

print(f"Accuracy: {accuracy:.4f}")
print(f"F1 Score: {f1:.4f}")

Accuracy: 0.7689
F1 Score: 0.7789


In [10]:
# 7. SVM 모델 초기화 및 학습
svm3 = SVC(kernel='rbf', gamma='scale', C=1.0, class_weight=None, random_state=42)
svm3.fit(X_train, y_train)

# 8. 테스트 데이터에 대해 예측 수행
y_pred = svm3.predict(X_test)

# 9. 정확도와 F1 스코어 계산
accuracy = accuracy_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred, pos_label=1)

print(f"Accuracy: {accuracy:.4f}")
print(f"F1 Score: {f1:.4f}")

Accuracy: 0.7737
F1 Score: 0.7785


In [12]:
# 7. SVM 모델 초기화 및 학습
svm4 = SVC(kernel='rbf', gamma='scale', C=0.1, class_weight=None, random_state=42)
svm4.fit(X_train, y_train)

# 8. 테스트 데이터에 대해 예측 수행
y_pred = svm4.predict(X_test)

# 9. 정확도와 F1 스코어 계산
accuracy = accuracy_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred, pos_label=1)

print(f"Accuracy: {accuracy:.4f}")
print(f"F1 Score: {f1:.4f}")

Accuracy: 0.7486
F1 Score: 0.7598


In [13]:
# 7. SVM 모델 초기화 및 학습
svm5 = SVC(kernel='rbf', gamma='scale', C=10, class_weight=None, random_state=42)
svm5.fit(X_train, y_train)

# 8. 테스트 데이터에 대해 예측 수행
y_pred = svm5.predict(X_test)

# 9. 정확도와 F1 스코어 계산
accuracy = accuracy_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred, pos_label=1)

print(f"Accuracy: {accuracy:.4f}")
print(f"F1 Score: {f1:.4f}")

Accuracy: 0.7975
F1 Score: 0.7999


In [14]:
# 7. SVM 모델 초기화 및 학습
svm6 = SVC(kernel='rbf', gamma='scale', C=100, class_weight=None, random_state=42)
svm6.fit(X_train, y_train)

# 8. 테스트 데이터에 대해 예측 수행
y_pred = svm6.predict(X_test)

# 9. 정확도와 F1 스코어 계산
accuracy = accuracy_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred, pos_label=1)

print(f"Accuracy: {accuracy:.4f}")
print(f"F1 Score: {f1:.4f}")

Accuracy: 0.8176
F1 Score: 0.8188


In [None]:
# 7. SVM 모델 초기화 및 학습
svm8 = SVC(kernel='sigmoid', gamma='scale', coef0=0, C=1.0, class_weight=None, random_state=42)
svm8.fit(X_train, y_train)

# 8. 테스트 데이터에 대해 예측 수행
y_pred = svm8.predict(X_test)

# 9. 정확도와 F1 스코어 계산
accuracy = accuracy_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred, pos_label=1)

print(f"Accuracy: {accuracy:.4f}")
print(f"F1 Score: {f1:.4f}")

Accuracy: 0.5486
F1 Score: 0.5512
