In [None]:
# 드라이브 마운트
from google.colab import drive
drive.mount('/content/drive')

In [None]:
cd /content/drive/MyDrive/deeplearning_study

In [None]:
!git clone https://Choihankyul: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@github.com/Choihankyul/deeplearing.git

In [None]:
cd /content/drive/MyDrive/deeplearning_study/deeplearing

In [None]:
!git config --global user.email 'chk765@naver.com'
!git config --global user.name 'Choihankyul'

In [None]:
from  tensorflow.keras import models
from  tensorflow.keras import layers

model = models.Sequential()
model.add(layers.Dense(32, activation = 'relu', input_shape =(784,)))
model.add(layers.Dense(10, activation = 'softmax'))

# 함수형 API 모델
input_tensor = layers.Input(shape = (784,))
x = layers.Dense(32, activation = 'relu')(input_tensor)
output_tensor = layers.Dense(10,activation = 'softmax')(x)

model = models.Model(inputs = input_tensor, outputs=output_tensor)

In [None]:
# 컴파일 단계에서 학습과정이 설정
## 모델이 사용할 옵티마이저와 손실 함수, 훈련하는 동안 모니터링하기 위해 필요한 측정 지표를 지정
from  tensorflow.keras import optimizers

model.compile(optimizer = optimizers.RMSprop(lr = 0.001),
              loss = 'nmse',
              metrics = ['accuracy'])


# model.fit(input_tensor, target_tensor, batch_size = 128, epochs = 10)

# 영화 리뷰 분류 : 이진 분류 예제


In [None]:
from tensorflow.keras.datasets import imdb
(train_data, train_labels), (test_data, test_labels) = imdb.load_data(num_words = 10000)
train_data[0]

In [None]:
len(train_labels)

In [None]:
# 단어 인덱스확인
max([max(sequence) for sequence in train_data])

In [None]:
imdb.get_word_index().items()

In [None]:
# 단어 시퀀스 decoding 하기
word_index = imdb.get_word_index() # word_index는 단어와 정수 인덱스를 매핑한 딕셔너리
reverse_word_index = dict(
    [(value,key) for (key,value) in word_index.items()] # 정수 인덱스와 단어를 매핑하도록 뒤집는다
)

decoded_review = ''.join(
    [reverse_word_index.get(i -3, '?') for i in train_data[0]]
)

In [None]:
decoded_review

## 데이터 준비
- 신경망에는 숫자 리스트를 주입할 수는 없습니다. 리스트를 텐서로 바꾸는 두 가지 방법이 있습니다
  - 같은 길이가 되도록 리스트에 패딩(padding)을 추가하고 (samples, sequence_length)크기의 정수 텐서로 변환 -> 이 정수 텐서를 다룰 수 있는 층을 신경망의 첫 번째 층으로 사용합니다(Embedding 층)
  - 리스트를 원-핫 인코딩(one-hot encoding)하여 0과 1의 벡터로 변환

In [None]:
# 정수 시퀀스를 이진행렬로 인코딩(one-hot encoding)
import numpy as np

def vectorize_sequences(sequences, dimension = 10000):
  results = np.zeros((len(sequences),dimension)) # 크기가 (len(sequences),dimension)이고 모든 원소가 0인 행렬로 만듭니다.
  for i,sequence in enumerate(sequences):
    results[i, sequence] = 1.  # results[i]에서 특정 인덱스의 위치를 1로 만듭니다.
  return results

x_train = vectorize_sequences(train_data)
x_test = vectorize_sequences(test_data)

In [None]:
x_train[0]

In [None]:
y_train = np.asarray(train_labels).astype('float32')
y_test = np.asarray(test_labels).astype('float32')

## Dense 층을 쌓을 때 두 가지 중요한 구조상의 결정이 필요
- 얼마나 많은 층을 사용할 것인가?
- 각 층에 얼마나 많은 은닉 유닛을 둘 것인가?

In [None]:
# 모델 정의하기
from tensorflow.keras import models
from tensorflow.keras import layers

model = models.Sequential()
model.add(layers.Dense(16, activation = 'relu', input_shape=(10000,)))
model.add(layers.Dense(16,activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

# 손실 함수와 옵티마이저를 선택
## rmsprop 옵티마이저와 binary_crossentropy 손실 함수를 설정
model.compile(optimizer = 'rmsprop',
              loss = 'binary_crossentropy',
              metrics = ['accuracy'])

# 옵티마이저를 설정하는 방법 keras에 있는 optimizers에서 설정
from tensorflow.keras import optimizers

model.compile(optimizer = optimizers.RMSprop(lr=0.001),
              loss = 'binary_crossentropy',
              metrics = ['accuracy'])

In [None]:
# 손실과 측정을 함수 객체로 지정

from tensorflow.keras import losses
from tensorflow.keras import metrics

model.compile(optimizer = optimizers.RMSprop(lr = 0.001),
              loss = losses.binary_crossentropy,
              metrics = [metrics.binary_accuracy])

### 훈련검증

In [None]:
# 검증세트 준비

x_val = x_train[:10000]
partial_x_train = x_train[10000:]
y_val = y_train[:10000]
partial_y_train = y_train[10000:]

In [None]:
# 모델 훈련하기
model.compile(optimizer = 'rmsprop',
              loss = 'binary_crossentropy',
              metrics = ['acc'])

history = model.fit(partial_x_train,
                    partial_y_train,
                    epochs=20,
                    batch_size=512,
                    validation_data = (x_val,y_val))

In [None]:
# model.fit() 매서드는 History 객체를 반환, 이 객체는 훈련하는 동안 발생한 모든 정보를 담고 있는 딕셔너리인 history 속성을 가지고있음
history_dic = history.history
history_dic.keys()

In [None]:
# 훈련과 검증 손실 그리기
import matplotlib.pyplot as plt

loss = history_dic['loss']
val_loss = history_dic['val_loss']

epochs = range(1,len(loss)+1)

plt.plot(epochs,loss,'bo',label = 'Training loss')
plt.plot(epochs, val_loss, 'b', label = "Validation_loss")
plt.title("Training and Validation loss")
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

plt.show()

In [None]:
# 훈련과 검증 정확도 그리기
plt.clf() # 그래프 초기화
acc = history_dic['acc']
val_acc = history_dic['val_acc']

plt.plot(epochs, acc, 'bo', label = 'Training_acc')
plt.plot(epochs, val_acc, 'b', label = 'Validation_acc')
plt.title('Training and Validation accuract')
plt.xlabel('Epochs')
plt.ylabel('ACC')
plt.legend()

plt.show()

In [None]:
# 모델을 처음부터 다시 훈련하기
model = models.Sequential()
model.add(layers.Dense(16,activation ='relu', input_shape =(10000,)))
model.add(layers.Dense(16, activation = 'relu'))
model.add(layers.Dense(1, activation = 'sigmoid'))

model.compile(optimizer = 'rmsprop',
              loss = 'binary_crossentropy',
              metrics = ['accuracy'])

model.fit(x_train, y_train, epochs=4, batch_size = 512)
results = model.evaluate(x_test,y_test)

In [None]:
results

### 훈련된 모델로 새로운 데이터에 대해 예측하기
- predcit 메서드를 사용해서 긍정일 확률 예측

In [None]:
# 이 모델은 어떤 샘플에 대해 확신을 가지고 있지만 어떤 샘플에 대해서는 확신이 부족합니다.(0.6 or 0.4)
model.predict(x_test)

In [None]:
### 추가 실험
### 1. 은닉층 조절
### 2. 층의 유닛을 조절
### 3. 손실함수 다른거 사용
### 4. 활성화 함수 다른거 사용

#### 1.은닉층 조절
model = models.Sequential()
model.add(layers.Dense(16, activation = 'tanh',input_shape = (10000,)))
model.add(layers.Dense(16, activation = 'tanh'))
model.add(layers.Dense(1, activation = 'sigmoid'))

model.compile(optimizer = 'rmsprop',
              loss = 'mse',
              metrics = ['accuracy'])

model.fit(x_train, y_train, epochs =4, batch_size = 512)
results = model.evaluate(x_test,y_test)


In [None]:
results

In [None]:
model

# 뉴스 기사 분류 : 다중 분류 문제
- 2개 이상의 클래스가 있을 때는 어떻게 해야하는지(다중분류)
- 각 데이터 포인트가 정확히 하나의 범주로 분류되기 떄문에 좀더 정확히 말하면 단일 레이블 다중분류 문제!!

In [None]:
# 로이터 데이터셋 살펴보기
from tensorflow.keras.datasets import reuters

(train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000)

print('train_data 숫자 : ',len(train_data))
print('='*100)
print('test_data 숫자 : ',len(test_data))
print('='*100)
print(train_data[10])

In [None]:
# 로이터 데이터셋을 텍스트로 디코딩
word_index = reuters.get_word_index()
reverse_word_index = dict([(value, key) for (key, value) in word_index.items()])
decoded_newswire = ''.join([reverse_word_index.get(i-3, '?') for i in train_data[0]])


In [None]:
# 데이터 준비
## 데이터 인코딩하기
import numpy as np

def vetorize_sequences(sequences, dimension = 10000):
  results = np.zeros((len(sequences), dimension))
  for i, sequence in enumerate(sequences):
    results[i, sequence] = 1.
  return results

x_train = vectorize_sequences(train_data)
x_test = vectorize_sequences(test_data)

In [None]:
## 레이블 원-핫 인코딩하기
from keras.utils.np_utils import to_categorical

one_hot_train_labels = to_categorical(train_labels)
one_hot_test_labels = to_categorical(test_labels)

## 모델 구성
- 이전에 사용했던 것처럼 Dense 층을 쌓으면 각 층은 이전 층의 출력에서 제공한 정보만 사용할 수 있습니다.한 층이 분류 문제에 필요한 일부 정보를 누락하면 그다음 층에서 이를 복원할 방법이 없습니다. 각 층은 잠재적으로 정보의 병목(information bottleneck)이 될 수 있습니다.
- 이전 예제에서 16차원을 가진 중간층을 사용했지만 16차원 공간은 46개의 클래스를 구분하기에 너무 제약이 많을 것 같습니다.
- 이렇게 규모가 작은 층은 유용한 정보를 완전히 잃게 되는 정보의 병목 지점처럼 동작할 수 있으므로 64개의 유닛을 사용


In [None]:
# 모델 정의
from tensorflow.keras import models
from tensorflow.keras import layers

model = models.Sequential()
model.add(layers.Dense(64, activation = 'relu', input_shape = (10000,)))
model.add(layers.Dense(64, activation = 'relu'))
model.add(layers.Dense(46, activation = 'softmax'))
## 마지막 Dense 층의 크기가 46, 각 입력 샘플에 대해서 46차원의 벡터를 출력한다.이 벡터의 각 원소(각 차원)는 각기 다른 출력 클래스가 인코딩 된것
## 마지막 층에 softmax 활성화 함수 사용, 각 입력 샘플마다 46개의 출력 클래스에 대한 확률 분포를 출력

In [None]:
# 모델 컴팔일
## 최선의 손실 함수는 categorical_crossentropy(두 확률 분포 사이의 거리를 측정)
model.compile(optimizer = 'rmsprop',
              loss = 'categorical_crossentropy',
              metrics = ['accuracy'])


## 훈련 검증

In [None]:
# 검증 세트 준비
x_val = x_train[:1000]
partial_x_train = x_train[1000:]

y_val = one_hot_train_labels[:1000]
partial_y_train = one_hot_train_labels[1000:]

# 모델 훈련하기
history = model.fit(partial_x_train,
                    partial_y_train,
                    epochs = 20,
                    batch_size = 512,
                    validation_data = (x_val,y_val))

In [None]:
# 훈련과 검증 손실 그리기
import matplotlib.pyplot as plt

loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(1,len(loss) + 1)

plt.plot(epochs, loss, 'bo', label = 'Training loss')
plt.plot(epochs, val_loss, 'b', label = 'Validation loss')
plt.title('Training and Validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

plt.show()

In [None]:
history.history['accuracy']

In [None]:
# 훈련과 검증 정확도 그리기
import matplotlib.pyplot as plt

acc = history.history['accuracy']
val_acc = history.history['val_accuracy']

epochs = range(1,len(acc) + 1)

plt.plot(epochs, acc, 'bo', label = 'Training acc')
plt.plot(epochs, val_acc, 'b', label = 'Validation acc')
plt.title('Training and Validation acc')
plt.xlabel('Epochs')
plt.ylabel('acc')
plt.legend()

plt.show()

In [None]:
# 모델 처음부터 다시 훈련
model = models.Sequential()
model.add(layers.Dense(64,activation='relu',input_shape = (10000,)))
model.add(layers.Dense(64, activation = 'relu'))
model.add(layers.Dense(64, activation = 'relu'))
model.add(layers.Dense(46, activation = 'softmax'))

model.compile(optimizer = 'rmsprop',
              loss = 'categorical_crossentropy',
              metrics = ['accuracy'])

model.fit(partial_x_train,
          partial_y_train,
          epochs = 9,
          batch_size = 512,
          validation_data = (x_val,y_val))

results = model.evaluate(x_test, one_hot_test_labels)

In [None]:
results

## 새로운 데이터에 대해 예측하기
- 테스트 데이터 전체에 대한 토픽을 예측

In [None]:
predictions = model.predict(x_test)

In [None]:
predictions[0]

## 레이블과 손실을 다루는 다른 방법
- 레이블을 인코딩하는 다른 방법은 정수 텐서로 변환하는 것
- ex) y_train = np.array(train_labels), y_test = np.array(test_labels)

## 충분히 큰 중간층을 두어야하는 이유
- 마지막 출력이 46차원이기 떄문에 중간층의 히든 유닛이 46개보다 많이 적어서는 안됩니다.
- 훨씬 작은 중간층을 두면 46개의 분할 초평면을 복원하기에 충분한 정보를 너무 압축하려고 하면 정보고 손실 된다.

# 주택 가격 예측 : 회귀 문제
- 개별적인 레이블 대신에 연속적인 값을 예측하는 회귀(regression) 문제
- ex) 기상 데이터가 주어졌을 때 내일 기온을 예측 하거나, 소프트웨어 명세가 주어졌을 때 소프트웨어 프로젝트가 완료될 시간을 예측하는 것 

## 보스턴 주택 가격 데이터셋
- ldata 분석에 적용해보기



In [None]:
# 보스턴 주택 데이터 셋 살펴보기
from tensorflow.keras.datasets import boston_housing

(train_data, train_targets), (test_data, test_targets) = boston_housing.load_data()

print("=" *100)
print(train_data.shape)
print("=" *100)
print(test_data.shape)
print("=" *100)
print(len(train_targets))
print("=" *100)
print(len(test_targets))
print("=" *100)
print(train_data[0])
print("=" *100)
print(train_targets[0])
print("=" *100)
print(train_data)
print("=" *100)
print(test_data)

## 데이터 준비
- 상이한 스케일을 가진 값을 신경망에 주입하면 문제가 생김.
- 이런 데이터를 다룰 때 대표적인 방법은 특성별로 정규화 하는것
- 입력 데이터에 있는 각 특성(입력 데이터 행렬의 열)에 대해서 특성의 평균을 빼고 표준편차로 나눕니다.

In [None]:
# 데이터 정규화하기
mean = train_data.mean(axis = 0)
train_data -= mean
std = train_data.std(axis=0)
train_data /= mean

test_data -= mean
test_data /= std

In [None]:
print(train_data[0].mean(axis=0))

In [None]:
print(train_data[0].mean(axis=0))
print(train_data.mean(axis=0))

## 모델 구성
- 훈련 데이터 개수가 적으므로 작은 모델을 사용

In [None]:
# 모델 정의
from tensorflow.keras import models
from tensorflow.keras import layers

## 모델을 만드는 함수 제작
def build_model():
  model = models.Sequential()
  model.add(layers.Dense(64, activation = 'relu',input_shape = (train_data.shape[1],)))
  model.add(layers.Dense(64, activation = 'relu'))
  model.add(layers.Dense(1)) # 선형 층이라고 부름, 전형적인 스칼라 회귀(하나의 연속적인 값을 예측하는 회귀)를 위한 구성
  model.compile(optimizer = 'rmsprop', loss='mse',metrics = ['mae']) # lose = mse 평균 제곱 오차(mean squared error) 회귀에 자주 쓰임
  # mae 편균 절대 오차 MAE가 0.5면 예측이 평균적으로 500달러
  return model

## K-겹 검증을 사용한 훈련 검증
- 데이터 포인트가 많지 않기 때문에 검증 세트도 작아님
- 데이터를 K개의 분할로 나누고, K개의 모델을 각각 맏르어 K-1 개의 분할에서 훈련하고 나머지 분할에서 평가하는 방법

In [None]:
import numpy as np

k = 4
num_val_samples = len(train_data) // k
num_epochs = 100
all_scores = []
for i in range(k):
  print('처리중인 폴트 : ', i)
  val_data = train_data[i * num_val_samples : (i+1) * num_val_samples]
  val_targets = train_targets[i * num_val_samples: (i+1)* num_val_samples]
  
  ## 훈련 데이터 준비 : 다른 분할 젠체
  partial_train_data = np.concatenate(
      [train_data[:i * num_val_samples],
       train_data[(i+1)* num_val_samples:]],
       axis= 0)
  
  partial_train_targets = np.concatenate(
      [train_targets[:i * num_val_samples],
       train_targets[(i + 1)* num_val_samples:]],
       axis=0)
  
  model = build_model()
  model.fit(partial_train_data, partial_train_targets,
            epochs = num_epochs, batch_size =1 , verbose =1)
  val_mse, val_mae = model.evaluate(val_data, val_targets, verbose =1)
  all_scores.append(val_mae)

In [None]:
print(all_scores)
print('=' * 100)
print(np.mean(all_scores))

In [None]:
history.history.keys()

In [None]:
# 각 폴드에서 검증 점수를 로그에 저장하기
num_epochs = 100
all_mae_history = []
for i in range(k):
  print('처리중인 폴트 : ', i)
  val_data = train_data[i * num_val_samples : (i+1) * num_val_samples]
  val_targets = train_targets[i * num_val_samples: (i+1)* num_val_samples]
  
  ## 훈련 데이터 준비 : 다른 분할 젠체
  partial_train_data = np.concatenate(
      [train_data[:i * num_val_samples],
       train_data[(i+1)* num_val_samples:]],
       axis= 0)
  
  partial_train_targets = np.concatenate(
      [train_targets[:i * num_val_samples],
       train_targets[(i + 1)* num_val_samples:]],
       axis=0)
  
  model = build_model()
  history = model.fit(partial_train_data, partial_train_targets,
            validation_data = (val_data,val_targets),
            epochs = num_epochs, batch_size =1 , verbose =1)
  mae_history = history.history['val_mae']
  all_mae_history.append('mae_history')

In [None]:
all_mae_history

In [None]:
# K-겹 검증 점수 평균을 기록하기
average_mae_history =  [
                        np.mean([x[i] for x in all_mae_history]) for i in range(num_epochs)]

In [None]:
# 검증 점수 그래프
import mat

In [None]:
%pwd

In [None]:
!git config --global user.email 'chk765@naver.com'
!git config --global user.name 'Choihankyul'

In [None]:
!git add .ipynb