# SECTION 02. 딥러닝으로 AI모델링하기

## 3. 딥러닝 프레임워크

### 3) 텐서플로 설치 및 활용하기

In [1]:
# tensorflow 라이브러리 설치하기
!pip install tensorflow

Collecting tensorflow
  Downloading tensorflow-2.17.0-cp311-cp311-macosx_12_0_arm64.whl.metadata (4.1 kB)
Collecting absl-py>=1.0.0 (from tensorflow)
  Using cached absl_py-2.1.0-py3-none-any.whl.metadata (2.3 kB)
Collecting astunparse>=1.6.0 (from tensorflow)
  Using cached astunparse-1.6.3-py2.py3-none-any.whl.metadata (4.4 kB)
Collecting flatbuffers>=24.3.25 (from tensorflow)
  Using cached flatbuffers-24.3.25-py2.py3-none-any.whl.metadata (850 bytes)
Collecting gast!=0.5.0,!=0.5.1,!=0.5.2,>=0.2.1 (from tensorflow)
  Downloading gast-0.6.0-py3-none-any.whl.metadata (1.3 kB)
Collecting google-pasta>=0.1.1 (from tensorflow)
  Using cached google_pasta-0.2.0-py3-none-any.whl.metadata (814 bytes)
Collecting h5py>=3.10.0 (from tensorflow)
  Using cached h5py-3.11.0-cp311-cp311-macosx_11_0_arm64.whl.metadata (2.5 kB)
Collecting libclang>=13.0.0 (from tensorflow)
  Using cached libclang-18.1.1-1-py2.py3-none-macosx_11_0_arm64.whl.metadata (5.2 kB)
Collecting ml-dtypes<0.5.0

In [2]:
# 설치된 텐서플로 버전 확인하기
import tensorflow as tf
print(tf.__version__)

2.17.0


In [3]:
# 필요한 라이브러리 불러오기
import numpy as np
import tensorflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense

# 모델 학습 데이터 생성하기
x = [1, 2, 3, 4,  5, 6,  7,  8,  9, 10]
y = [3, 5, 7, 9, 11, 13, 15, 17, 19, 21]
x_train = np.array(x)
x_train = x_train.reshape(-1, 1)
y_train = np.array(y)

print(f'입력 데이터 : {x_train}')
print(f'입력 데이터 형태: {x_train.shape}')
print(f'출력 데이터: {y_train}')
print(f'출력 데이터 형태 : {y_train.shape}')

입력 데이터 : [[ 1]
 [ 2]
 [ 3]
 [ 4]
 [ 5]
 [ 6]
 [ 7]
 [ 8]
 [ 9]
 [10]]
입력 데이터 형태: (10, 1)
출력 데이터: [ 3  5  7  9 11 13 15 17 19 21]
출력 데이터 형태 : (10,)


In [4]:
# Keras의 Sequential 모델 구성하기
initializer = tf.keras.initializers.GlorotUniform(seed=42) #모델 시드 고정하기
model = Sequential()
model.add(Dense(units=1, input_shape=(1,), kernel_initializer=initializer))
model.summary()

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [None]:
# 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법 설정하기
model.compile(optimizer='sgd', loss='mse', metrics=['mae'])

In [None]:
# 모델 학습하기
model.fit(x_train, y_train, epochs=1000)

In [None]:
# 모델 가중치 확인하기
print(model.weights)

In [None]:
# 모델 레이어의 가중치 출력하기
print(f'weight : {model.layers[0].weights[0].numpy()}')
print(f'bias : {model.layers[0].bias.numpy()}')

In [None]:
# 학습 완료된 모델 사용하여 예측하기
print(model.predict([[11],[12],[13]]))

In [None]:
# 클래스와 메소드 사용법 확인하기
help(model.fit)

## 4. 심층신경망으로 항공사 고객 만족 분류 모델 구현 실습하기

### 1) 데이터 로드 및 확인하기

In [None]:
# 필요한 라이브러리 불러오기
import numpy as np
import pandas as pd
import warnings

# 경고 메시지를 무시하도록 설정하기
warnings.filterwarnings('ignore')

In [None]:
# csv 파일에서 데이터를 로드해서 데이터프레임으로 저장하기
df = pd.read_csv('Invistico_Airline.csv')

# 데이터프레임 정보 확인하기
df.info()

In [None]:
# 데이터프레임의 처음 5개 행의 데이터 출력하기
df.head()

In [None]:
# 데이터프레임의 요약 통계량 확인하기
df.describe()

In [None]:
# 결측치 확인하기
df.isnull().sum()

### 2) 데이터 전처리하기

#### (1) 결측치 처리하기 

In [None]:
# SimpleImputer 객체로 결측치 대체하기
from sklearn.impute import SimpleImputer

mean_imputer = SimpleImputer(strategy='mean')
df["Arrival Delay in Minutes"] = mean_imputer.fit_transform(df[["Arrival Delay in Minutes"]])

#### (2) 데이터 인코딩

In [None]:
# object 칼럼 유형을 string 유형으로 변경하기
cols = ['satisfaction', 'Gender', 'Customer Type', 'Type of Travel', 'Class']
df[cols] = df[cols].astype(str)

In [None]:
# 범주형 데이터를 수치값으로 변경하기
df['satisfaction'].replace(['dissatisfied','satisfied'], [0,1], inplace=True)

In [None]:
# 순서형 인코딩(Ordinal Encoding)하기
categories = pd.Categorical(
    df['Class'], 
    categories= ['Eco', 'Eco Plus', 'Business'], 
    ordered=True)
labels, unique = pd.factorize(categories, sort=True)
df['Class'] = labels

In [None]:
# 원핫 인코딩(One Hot Encoding)하기
cat_cols = ['Gender','Customer Type','Type of Travel']
df = pd.get_dummies(df, columns=cat_cols)

In [None]:
# 데이터 전처리 결과 확인하기
df.head()

In [None]:
# 데이터 유형 확인하기
df.dtypes

#### (3) 데이터셋 분리하기

In [None]:
from sklearn.model_selection import train_test_split

# 데이터셋을 입력(X)과 레이블(y)로 분리하기
X = df.drop(['satisfaction'], axis=1)
y = df['satisfaction'].reset_index(drop=True)

# 데이터셋을 훈련 데이터와 검증 데이터로 분리하기
X_train, X_val, y_train, y_val = train_test_split(X, y, 
    test_size=0.2, 
    random_state=42, 
    stratify=y)

print(f'훈련 데이터셋 크기 : X_train {X_train.shape}, y_train {y_train.shape}')
print(f'검증 데이터셋 크기 : X_val {X_val.shape}, y_val {y_val.shape}')

#### (4) 데이터 스케일링하기

In [None]:
from sklearn.preprocessing import MinMaxScaler

# 데이터 정규화하기
scaler = MinMaxScaler()
scaler.fit(X_train)
X_train = scaler.transform(X_train)
X_val = scaler.transform(X_val)

print(X_train)

### 3) 심층신경망 모델 생성하기

In [None]:
# 필요한 라이브러리 불러오기
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.layers import Input, Dense, Dropout
from tensorflow.keras.layers import BatchNormalization 
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint
import random

# 모델 시드 고정하기
tf.random.set_seed(42)
np.random.seed(42)
random.seed(42)

# Keras의 Sequential 객체로 딥러닝 모델 구성하기
initializer = tf.keras.initializers.GlorotUniform(seed=42) #모델 시드 고정하기
model = Sequential()
model.add(Dense(32, activation='relu', input_shape=(25,),kernel_initializer=initializer))
model.add(Dense(64, activation='relu'))
model.add(Dense(128, activation='relu'))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.3))
model.add(Dense(32, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(1, activation='sigmoid'))

In [None]:
# 모델 구조 및 파라미터 정보 확인하기
model.summary()

### 4) 모델 컴파일하기

In [None]:
# 모델을 학습시킬 최적화 방법, loss 계산 방법, 평가 방법 설정하기
model.compile(optimizer='adam', 
              loss='binary_crossentropy', 
              metrics=['accuracy']) 

### 5) 모델 학습하기

In [None]:
# 모델 학습하기
es = EarlyStopping(monitor='val_loss', min_delta=0, patience=10, verbose=1, restore_best_weights=True)
history = model.fit(X_train, y_train, epochs=100, batch_size=128,
          verbose=1, validation_data=(X_val, y_val), callbacks=[es])

### 6) 모델 훈련 과정 시각화하기

In [None]:
import matplotlib.pyplot as plt

# 훈련 과정 정확도(accuracy) 시각화하기
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('Model Accuracy')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend(['Train', 'Validation'], loc='lower right')
plt.show()

# 훈련 과정 손실(loss) 시각화하기
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('Model Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend(['Train', 'Validation'], loc='upper right')
plt.show()