In [1]:
import numpy as np
import pandas as pd

# ==== 파일 경로 (네 환경에 맞게 수정해줘) ====
input_path = "/content/drive/MyDrive/urp/기존/merged_filtered.csv"
output_path_snv = "/content/drive/MyDrive/urp/snv/merged_filtered_snv.csv"


# ==== SNV 함수 ====
def snv(y):
    """
    Standard Normal Variate
    각 스펙트럼(한 row)에 대해:
    - 평균 0
    - 표준편차 1
    로 스케일링
    """
    y = np.asarray(y)
    return (y - np.mean(y)) / (np.std(y) + 1e-8)


# ==== SNV만 적용하는 전처리 ====
def preprocess_spectra_snv_only(df, label_col='label'):
    """
    Version SNV-only:
    - SNV만 적용
    - 스펙트럼 모양은 유지, 스케일만 바뀜
    """
    y = df[label_col].values
    X = df.drop(columns=[label_col]).values.astype(float)

    n_samples, n_features = X.shape
    print(f"[SNV] 원본 스펙트럼 크기: {X.shape}")

    X_proc = np.zeros_like(X)
    for i in range(n_samples):
        spec = X[i, :]
        spec_snv = snv(spec)
        X_proc[i, :] = spec_snv

    return X_proc, y


# ==== 실행: SNV 전처리 + CSV 저장 ====
df = pd.read_csv(input_path)
X_snv, y_snv = preprocess_spectra_snv_only(df, label_col='label')

spec_cols = df.drop(columns=['label']).columns
df_snv = pd.DataFrame(X_snv, columns=spec_cols)
df_snv.insert(0, 'label', y_snv)

df_snv.to_csv(output_path_snv, index=False)
print(f"[SNV] 전처리된 CSV 저장 완료: {output_path_snv}")


[SNV] 원본 스펙트럼 크기: (1709, 3551)
[SNV] 전처리된 CSV 저장 완료: /content/drive/MyDrive/urp/snv/merged_filtered_snv.csv
