In [1]:
# 이미지 데이터 로딩
from tensorflow.keras.datasets import mnist # module.load_data()
(train_image, train_labels), (test_image, test_labels) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


In [7]:
# 학습 데이터 구조 확인
train_image.shape, train_labels.shape
# ===> 60000장의 28 * 28 픽셀의 이미지파일

((60000, 28, 28), (60000,))

In [9]:
# 첫번째 이미지
print(train_labels[0]) # 첫번째 이미지의 답: 5
train_image[0]

5


array([[  0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0],
       [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0],
       [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0],
       [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0],
       [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,
          0,   0],
       [  0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   0,   3,
         18,  18,  18, 126, 136, 175,  26, 166, 255, 247, 127,   0,   0,
          0,   0],
       [  

In [12]:
# 신경망 생성 : 모델 생성
from tensorflow import keras #keras 도 모듈임!(변수, 함수, 클래스 존재)
from tensorflow.keras import layers

model = keras.Sequential([ # Sequential => 순차적 처리하라는 말 (= 포워드 하라는 말)
    layers.Dense(512, activation='relu') # 밀집층 생성 # relu 라는 비선형 함수로 학습을 "활성화" 시킴
    ,layers.Dense(512, activation='relu') # => 다음과 같이 linear 층 두개 만든 것(512, 512)
    , layers.Dense(10, activation='softmax') # 출력 층
])

# 784개의 이미지가 들어와서 512차원으로 차원축소! => 특성을 추출하는 과정!(이미지를 설명할 수 있는 주성분 만들기!)

# => 이 과정은 층만 만든 것!

In [None]:
# activation function 이 없는 경우 신경망학습이 이루어지지 않음!
# hidden layer 가 아무리 많아도 학습이 되지 않으므로 activation function 으로 활성화시켜주어야 한다.!

# [RELU 함수]
# => X 값은 내적(유사도) / 내적한 값이 양수인 경우 값 출력 / 음수는 0 출력
# => 직선 두개로 이루어져 있어 비선형이라고 봄
# => 선형함수는 직선 하나를 의미함
# => 직교((X, Y) = (0, 0))한 경우 내적 이 0임!

# [SOFTMAX 함수]
# => 출력값을 확률로 바꾸어줌?
# => 다중분류 시 사용
# => 확률로 변환하므로 모드 값 다 더하면 "1"이 됨!


In [None]:
# loss function + 평가방법 + optimizer 지정 추가로 필요!

In [13]:
# loss function(오차 구하는 함수) 지정 + optimizer(미분, 최적화, 학습 => 역전파 의미) + metric(평가지표) 지정

model.compile(
    optimizer='adam',
    loss = 'sparse_categorical_crossentropy',
    metrics=['accuracy'] # 평가지표는 여러 개 지정할 수 있음 # 정확도 확인
)
# 신경망 완성    

In [17]:
test_image.shape

(10000, 28, 28)

In [18]:
# 데이터 준비 (60000, 28, 28): 28*28 은 2차원 => 1차원으로 변경해주어야 함
# 이미지는 1차원으로 변경 시 상하관계가 무너지게 됨 => 이 문제를 해결하기 위해 만든 것이 CNN!
# Dense 층에는 1차원만 들어갈 수 있음

# 1차원 변경
train_image = train_image.reshape(60000, 28*28)

# 0 ~ 1 사이의 값으로 변환 => Min Max Scaler (X - MIN / MAX - MIN) => X 가 FLOAT 가 아닌 경우 정수로 나뉘어져 0아니면 1만 나와 X 를 실수로 변경 후 나누어주어야 한다.
train_image = train_image.astype('float32') / 255 # => float 로 출력 됨
# ===> GPU 연산 시 float16 이 가장 빠름 / 운영체제에서는 16이어도 32로 처리함


# =====================test data 동일 처리==========================
# (10000, 28, 28)
test_image = test_image.reshape(10000, 28*28)
test_image = test_image.astype('float32') / 255

In [16]:
20 / 255 # => 실수로 출력 => 파이썬의 데이터 타입
# 넘파이 데이터 타입과 상이하다.

0.0784313725490196

In [15]:
type(train_image)

numpy.ndarray

---
학습

---

In [19]:
model.fit(
    train_image, # 학습데이터
    train_labels, # 학습데이터의 답
    epochs = 5, # 전체데이터에 대한 반복 학습 횟수 # 전체 데이터가 60000 개 이므로 60000 * 5 번의 반복(랜덤하게 추출해서 진행)
    batch_size = 128# 한번 학습(미분)시 사용할 데이터 포인트 개수(배치 사이즈) => 몇개의 데이터가 들어왔을 때 미분을 할 것인지를 지정하는 파라미터값 /lerning rate 과 비슷하게 생각하면 될듯!
)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x214db5cb9a0>

In [None]:
# ====> 469 미분 횟수
# ====> 60000 / 128 의 값으로 데이터를 나누어서 학습 진행

In [20]:
60000 / 128

468.75

In [32]:
from tensorflow.keras.datasets import mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()


from tensorflow import keras
from tensorflow.keras import layers
model = keras.Sequential([
    layers.Dense(512, activation="relu"),
    layers.Dense(10, activation="softmax")
])


model.compile(optimizer="rmsprop",
              loss="sparse_categorical_crossentropy",
              metrics=["accuracy"])


train_images = train_images.reshape((60000, 28 * 28))
train_images = train_images.astype("float32") / 255
test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype("float32") / 255


model.fit(train_images, train_labels, epochs=5, batch_size=128)



Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x214ab3d9310>

In [33]:
# 테스트 이미지 10개 가지고 와서 
test_digits=test_image[:10]

# 모델에 집어넣어서 예측값(10개) / 1개의 예측값에는 10개 출력 
predictions=model.predict(test_digits)
print(predictions[0]) # 10개 결과 출력

# => argmax
print(predictions[0].argmax()) # 최대값을 가지고 있는 인덱스 반환
print(predictions[0][7]) # 확률

# 테스트 데이터 첫번째 이미지의 원래 답
print(f'테스트 데이터 첫번째 이미지 답 : {test_labels[0]}')

[5.3502863e-10 1.0132267e-12 2.2758276e-07 3.2090426e-05 3.8402935e-12
 4.0335295e-09 1.3096961e-15 9.9996626e-01 2.0273591e-08 1.4360811e-06]
7
0.99996626
테스트 데이터 첫번째 이미지 답 : 7


In [35]:
# 모델 평가 시 => evaluate 는 오차와 정확도가 출력됨!
test_loss, test_acc = model.evaluate(test_image, test_labels) #테스트이미지(10000개), 답

print(f'테스트 이미지에 대한 모델 정확도 : {test_acc}')

테스트 이미지에 대한 모델 정확도 : 0.9776999950408936
