In [1]:
import tensorflow as tf
import numpy as np

from tensorflow.keras.models import Sequential  # 층 구성하겠다.
from tensorflow.keras.layers import Dense       # 층에대한 노드갯수를 지정
from tensorflow.keras.optimizers import SGD     # 최적화함수에 대하여 설정
from tensorflow.keras.losses import mse         # 로스 지정

tf.random.set_seed(777)

# 데이터 준비하기 
data = np.array([[0, 0], [1, 0], [0, 1], [1, 1]])  # 입력데이터셋의 형태는 신경망의 input값에 사용됨. 입력의 갯수와 신경망의 input의갯수가 다르면 error
label = np.array([[0], [1], [1], [1]])   # y값의 결과에 따라 다양한 활성화 함수가 사용됨. 활성화 함수는 11시40분에 얘기함.

np.shape(data)

(4, 2)

## 인공신경망 모델
- 배치사이즈: 오차계산하고 w,b값 갱신할 데이터 단위임
- 현재 4개의 x값이 있으며 배치를 1로 하면  1번째데이터/4개의모든데이터중, 2/4, 3/4, 4/4임
- 배치를 3으로 하면   1(1,2,3데이터)/4,   2(4번째데이터)/4 임
- 배치사이즈는 사용자가 정의하지 않아도 됨.(optimizer에서 배치를 자동으로 결정함)
- epochs: 전체데이터를 몇번더 돌릴건지, (epochs할때마다 가중치가 갱신됨)

## Dense 1개

In [2]:
# 모델 구성하기: Dense1개
model = Sequential()  # tensorflow.keras.models.Sequential()
model.add(Dense(1, input_shape = (2,), activation = 'linear')) # 활성화함수 wx+b 
model.compile(optimizer = SGD(), loss = mse, metrics = ['acc']) # list 형태로 평가지표를 전달합니다
model.fit(data, label, epochs = 2,batch_size=1)   

Epoch 1/2
Epoch 2/2


<keras.callbacks.History at 0x7f2702a50cd0>

In [3]:
model.summary()   # Param의 갯수는 노드에서 나가는 선의 갯수
#input의 x값이 2개임으로 w1,w2,b 3개의 노드가 있어서 Param갯수가 3임.

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 1)                 3         
Total params: 3
Trainable params: 3
Non-trainable params: 0
_________________________________________________________________


In [7]:
paramValue=model.get_weights()  # Param갯수만큼 출력됨.   [w1,w2], [b]
print(paramValue)

[array([[ 0.60903174],
       [-0.7888963 ]], dtype=float32), array([0.13410476], dtype=float32)]


In [8]:
# 직접 예측값 계산해보기
x1=data[:,0] ; x2=data[:,1]
w1=paramValue[0][0] ; w2=paramValue[0][1]; b=paramValue[1]
y_pred=x1*w1+x2*w2+b
y_pred

array([ 0.13410476,  0.7431365 , -0.65479156, -0.04575983])

In [10]:
## 텐서제공 예측값 계산하기

# predict(): 예측을 진행합니다.
preds = model.predict(data)
for a, b in zip(preds, label):
    print(f"예측값 {a} - 정답 {b}")

예측값 [0.13410476] - 정답 [0]
예측값 [0.7431365] - 정답 [1]
예측값 [-0.6547916] - 정답 [1]
예측값 [-0.04575983] - 정답 [1]


# Dense2개

In [11]:
# 모델 구성하기: Dense1개
model = Sequential()  # tensorflow.keras.models.Sequential()
model.add(Dense(2, input_shape = (2,), activation = 'linear')) # 활성화함수 wx+b 
model.compile(optimizer = SGD(), loss = mse, metrics = ['acc']) # list 형태로 평가지표를 전달합니다
model.fit(data, label, epochs = 2,batch_size=1)   

model.summary()   # Param의 갯수는 노드에서 나가는 선의 갯수
#input의 x값이 2개임으로 w1,w2,b 3개의 노드가 있어서 Param갯수가 3임.
# 이러한 3개의 파람을 갖는 세트가 2개있음.(Dense=2) 총 6개임

Epoch 1/2
Epoch 2/2
Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 2)                 6         
Total params: 6
Trainable params: 6
Non-trainable params: 0
_________________________________________________________________


In [12]:
paramValue=model.get_weights()  # Param갯수만큼 출력됨.   [[w1,w2],[w1,w2]],[b,b]  ==> [[Dense1의 w1,w2],[Dense2의 w1,w2]],[Dense1의b,Dense2의b]
print(paramValue)

[array([[-0.15591462,  0.60665405],
       [ 0.4868804 , -0.8903257 ]], dtype=float32), array([0.04647271, 0.07136649], dtype=float32)]


In [30]:
Dense_1_w=paramValue[0][0] 
Dense_2_w=paramValue[0][1]
Dense_1_b=paramValue[1][0]
Dense_2_b=paramValue[1][1]

y_pred_1=x1*Dense_1_w[0] * x2 *Dense_1_w[1] + Dense_1_b
y_pred_2=x1*Dense_2_w[0] * x2 *Dense_2_w[1] + Dense_2_b

print(y_pred_1,y_pred_2)  # 강의할때는 y_pred_1이 아니라 y_pred로 해서 결과가 다르게 나온것임

[ 0.04647271  0.04647271  0.04647271 -0.04811353] [ 0.07136649  0.07136649  0.07136649 -0.36211565]


In [19]:
## 텐서제공 예측값 계산하기

# predict(): 예측을 진행합니다.
preds = model.predict(data)
for a, b in zip(preds, label):
    print(f"예측값 {a} - 정답 {b}")

예측값 [0.04647271 0.07136649] - 정답 [0]
예측값 [-0.10944191  0.67802054] - 정답 [1]
예측값 [ 0.5333531  -0.81895924] - 정답 [1]
예측값 [ 0.37743846 -0.21230519] - 정답 [1]


# 활성화함수
- 현재 linear 함수를 사용했기 때문에 wx+b값이 되면서 결과값이 무한대의 숫자값중 한개가 나옴
- linear를 sigmoid함수를 사용하면 0또는1의 사이값만 출력됨


## 
활성화함수 (dense층의 결과를 계산하는 공식)


중간Dense는 다음Dense에 넘어가기에 적합한 값을 의미 (Relu 라는 함수를 사용)

최종Dense는 원하는 y값을 의미
  y값은 무한대의 숫자인 선형회귀 이거나, 결과는 무한대의 숫자중 1개  (활성화함수 기재안함)
        0또는1값중 한개인 이항분류이거나
                                        결과1은 0또는1의 한개의 비트  (활성화함수 시그모이드)
                                        결과2는 0값을[1,0] 1값을[0,1]의 두개의 비트로 표현하는 원핫인코딩(활성화함수 소프트맥스)
        
        여러개의 다항분류이거나  무조건 분류갯수만큼 원핫인코딩 (활성화함수 softmax)
            예) 개,고양이,사자,사슴  4개의분류가 있으면 개는1, 고양이는2, 사자는3,사슴은4
                개는[1,0,0,0]   고양이는[0,1,0,0,]  사자는 [0,0,1,0]  사슴은 [0,0,0,1]

## 활성화함수 linear함수

In [46]:
data = np.array([[5, 20], [3, 0], [8, 1], [1, 1]])  # 입력데이터셋의 형태는 신경망의 input값에 사용됨. 입력의 갯수와 신경망의 input의갯수가 다르면 error
label = np.array([[0], [1], [1], [1]]) 

model = Sequential() 
model.add(Dense(1, input_shape = (2,), activation = 'linear')) 
#model.add(Dense(1, input_shape = (2,))) # activation을 사용하지 않아도 선형식이 됨. 단 w,b의 랜덤값이 다르게 나옴

model.compile(optimizer = SGD(), loss = mse, metrics = ['acc']) 
model.fit(data, label, epochs = 2,batch_size=1,verbose=0) # verbose=0 실행화면 안나옴

<keras.callbacks.History at 0x7f26f46545d0>

In [47]:
# linear 함수이기때문에 무한대의 숫자값이 나옴
preds = model.predict(data)
for a, b in zip(preds, label):
    print(f"예측값 {a} - 정답 {b}")

예측값 [41.362] - 정답 [0]
예측값 [-1.5218228] - 정답 [1]
예측값 [-1.8910033] - 정답 [1]
예측값 [1.6995274] - 정답 [1]


In [49]:
paramValue=model.get_weights()  # Param갯수만큼 출력됨.   [[w1,w2],[w1,w2]],[b,b]  ==> [[Dense1의 w1,w2],[Dense2의 w1,w2]],[Dense1의b,Dense2의b]

# 직접 예측값 계산해보기
x1=data[:,0] ; x2=data[:,1]
w1=paramValue[0][0] ; w2=paramValue[0][1]; b=paramValue[1]
y_pred=x1*w1+x2*w2+b
y_pred

array([41.36199927, -1.52182282, -1.8910032 ,  1.69952749])

## 활성화함수 0과1값 사이만  나오게 하는 sigmoid

In [50]:
data = np.array([[5, 20], [3, 0], [8, 1], [1, 1]])  # 입력데이터셋의 형태는 신경망의 input값에 사용됨. 입력의 갯수와 신경망의 input의갯수가 다르면 error
label = np.array([[0], [1], [1], [1]]) 

model = Sequential() 
model.add(Dense(1, input_shape = (2,), activation = 'sigmoid')) 
#model.add(Dense(1, input_shape = (2,))) # activation을 사용하지 않아도 선형식이 됨. 단 w,b의 랜덤값이 다르게 나옴

model.compile(optimizer = SGD(), loss = mse, metrics = ['acc']) 
model.fit(data, label, epochs = 2,batch_size=1,verbose=0) # verbose=0 실행화면 안나옴

<keras.callbacks.History at 0x7f26f45948d0>

In [52]:
# sigmoid 함수이기때문에 0또는1 사이의 숫자값이 나옴
preds = model.predict(data)
for a, b in zip(preds, label):
    print(f"예측값 {a} - 정답 {b}")

예측값 [0.99987] - 정답 [0]
예측값 [0.2829689] - 정답 [1]
예측값 [0.12171587] - 정답 [1]
예측값 [0.5558347] - 정답 [1]


## 활성화함수 softmax함수

In [57]:
data = np.array([[5, 20], [3, 0], [8, 1], [1, 1]])  # 입력데이터셋의 형태는 신경망의 input값에 사용됨. 입력의 갯수와 신경망의 input의갯수가 다르면 error
label = np.array([[0], [1], [1], [1]]) 

label_onehot = tf.keras.utils.to_categorical(label,num_classes=2) 
print(label_onehot)


[[1. 0.]
 [0. 1.]
 [0. 1.]
 [0. 1.]]


In [62]:
model = Sequential() 
model.add(Dense(2, input_shape = (2,), activation = 'softmax')) 

model.compile(optimizer = SGD(), loss = mse, metrics = ['acc']) 
model.fit(data, label_onehot, epochs = 2,batch_size=1,verbose=0) # verbose=0 실행화면 안나옴

<keras.callbacks.History at 0x7f26f41a6290>

In [64]:
# sigmoid 함수이기때문에 0또는1 사이의 숫자값이 나옴
preds = model.predict(data)
for a, b in zip(preds, label_onehot):
    print(f"예측값 {a} - 정답 {b}")

예측값 [1.0000000e+00 1.2913601e-10] - 정답 [1. 0.]
예측값 [0.45071217 0.54928786] - 정답 [0. 1.]
예측값 [0.6634835 0.3365165] - 정답 [0. 1.]
예측값 [0.74403864 0.25596133] - 정답 [0. 1.]


# 정리
- 인공신경망은 사용자가 x값의 input갯수와, 출력y값의 갯수
y값의 활성화함수를 신경써야함. 
- model.add 에 dense를 구성하는 노드갯수를 설정하여 Param갯수를 정할수 있음
- 최종 y값에 따라 활성화함수를 다르게 지정하여야함.
- 활성화함수는 오차계산법도 다르게 지정하여야함.
- 일반적으로
    - 선형회귀는 mse, mae 
    - 시그모이드는 binary_crossentropy 
    - 소프트맥스는 categorical_crossentropy 
       - 단 onehot인코딩 안한상태에서 원핫인코딩하면서 오차 계산해주는 식 사용가능 SparseCategoricalCrossentropy



- model.add가 많을수록 수많은 weight가 생성됨.
- weight가 많으면 많을수록 훈련데이터에 잘 맞추어서 overffing(훈련만 잘맞고,검증은 잘 안맞음) 될수 있음.
- 이 오버피팅을 없애는방법중 하나로 dense중간층에 dropout(비율)을 사용하기도함.