In [2]:
# 사람들의 사회경제적 배경을 토대로 고소득자인지를 예측하는 모델
from fastai.tabular.all import *

# 데이터 다운로드 및 경로 설정
path = untar_data(URLs.ADULT_SAMPLE)

# 데이터 로더 생성 - CSV 파일로부터 데이터를 불러와 모델 학습에 필요한 형태로 준비
# - y_names='salary', 예측 대상 변수로, salary 열이 설정
# - cat_name = ['workclass', ..., 'race'], 범주형 변수들
# - cont_names = ['age', ... ], 연속형 변수들
# - procs : 데이터 전처리 과정
#  - (1) Categorify: 범주형 변수를 코드화하여 모델이 처리할 수 있는 숫자형으로 변환합니다.
#  - (2) FillMissing: 결측값을 자동으로 채워 넣어 데이터의 누락을 방지합니다.
#  - (3) Normalize: 연속형 변수 값을 표준화하여 모델이 효율적으로 학습할 수 있도록 합니다.
dls = TabularDataLoaders.from_csv(path/'adult.csv', path=path, y_names='salary',
                                  cat_name = ['workclass', 'education', 'marital-status', 'occupation',
                                              'relationship', 'race'],
                                  cont_names = ['age', 'fnlwgt', 'education-num'],
                                  procs = (Categorify, FillMissing, Normalize))


# 학습 모델 생성
learn = tabular_learner(dls, metrics=accuracy)

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  to[n].fillna(self.na_dict[n], inplace=True)


In [3]:
# 학습(예측/분류)
learn.fit_one_cycle(3)

epoch,train_loss,valid_loss,accuracy,time
0,0.47962,0.438961,0.791923,00:06
1,0.466419,0.434606,0.797604,00:03
2,0.44425,0.431195,0.797451,00:04


In [6]:
# 무비렌즈 데이터셋을 사용해 이전 시청 습관을 기반으로 사람들이 좋아할 만한 영화를 예측하는 모델을 학습시키는 방법
from fastai.collab import *

# 데이터 다운로드 및 경로 설정
path = untar_data(URLs.ML_SAMPLE)

# 데이터 로더 생성 - 특정 파일로부터 데이터를 불러와 모델 학습에 필요한 형태로 준비
dls = CollabDataLoaders.from_csv(path/'ratings.csv')

# 학습 모델 생성
learn = collab_learner(dls, y_range=(0.5, 5.5))

# 학습(예측/분류)
learn.fine_tune(10)

epoch,train_loss,valid_loss,time
0,1.518255,1.395847,00:01


epoch,train_loss,valid_loss,time
0,1.371499,1.338118,00:00
1,1.270057,1.167293,00:00
2,1.02634,0.873785,00:00
3,0.784467,0.736468,00:00
4,0.694281,0.702323,00:00
5,0.643425,0.689828,00:00
6,0.626462,0.68239,00:00
7,0.62099,0.679449,00:00
8,0.62027,0.678166,00:00
9,0.602897,0.677922,00:00


In [7]:
learn.show_results()

Unnamed: 0,userId,movieId,rating,rating_pred
0,52.0,29.0,3.0,4.43852
1,37.0,61.0,5.0,4.177101
2,71.0,48.0,5.0,3.962152
3,18.0,93.0,5.0,3.835762
4,45.0,27.0,1.0,3.014127
5,89.0,45.0,4.5,4.284253
6,46.0,4.0,0.5,2.901452
7,17.0,68.0,4.0,3.718676
8,13.0,29.0,4.0,4.22389
