In [1]:
import pandas as pd
from sklearn.preprocessing import LabelEncoder

In [2]:
df = pd.read_csv('adult.csv')  # 파일 경로와 이름을 수정하세요


In [4]:
# 2. 범주형 열 자동 탐지 (object 또는 category 타입)
categorical_cols = df.select_dtypes(include=['object', 'category']).columns.tolist()
print(f"자동 탐지된 범주형 열: {categorical_cols}")


자동 탐지된 범주형 열: ['workclass', 'education', 'marital-status', 'occupation', 'relationship', 'race', 'gender', 'native-country', 'income']


In [5]:
# 3. Label Encoding 적용 (각 열마다 새로운 열 생성)
df_label_encoded = df.copy()
le = LabelEncoder()

for col in categorical_cols:
    try:
        df_label_encoded[col + '_LabelEnc'] = le.fit_transform(df[col])
    except:
        print(f"[경고] Label Encoding 실패 - {col} (결측치나 숫자 혼합일 수 있음)")

In [6]:
# 4. One-Hot Encoding 적용
df_onehot_encoded = pd.get_dummies(df, columns=categorical_cols, prefix=categorical_cols)

# 5. 결과 출력 확인
print("\n[Label Encoding 결과 예시]")
print(df_label_encoded.filter(like='_LabelEnc').head())

print("\n[One-Hot Encoding 결과 예시]")
print(df_onehot_encoded.head())


[Label Encoding 결과 예시]
   workclass_LabelEnc  education_LabelEnc  marital-status_LabelEnc  \
0                   4                   1                        4   
1                   4                  11                        2   
2                   2                   7                        2   
3                   4                  15                        2   
4                   0                  15                        4   

   occupation_LabelEnc  relationship_LabelEnc  race_LabelEnc  gender_LabelEnc  \
0                    7                      3              2                1   
1                    5                      0              4                1   
2                   11                      0              4                1   
3                    7                      0              2                1   
4                    0                      3              4                0   

   native-country_LabelEnc  income_LabelEnc  
0                     