In [66]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models
from tensorflow.keras.utils import to_categorical
import numpy as np

(original_x_train, original_y_train), (original_x_test, original_y_test) = keras.datasets.cifar10.load_data()

In [67]:
original_x_train = original_x_train / 255.0
original_x_test = original_x_test / 255.0

original_y_train = keras.utils.to_categorical(original_y_train)
original_y_test = keras.utils.to_categorical(original_y_test)

In [68]:

original_model = models.Sequential()
original_model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
original_model.add(layers.MaxPooling2D((2, 2)))
original_model.add(layers.Dropout(0.25))

original_model.add(layers.Conv2D(64, (3, 3), activation='relu'))
original_model.add(layers.MaxPooling2D((2, 2)))
original_model.add(layers.Dropout(0.25))

original_model.add(layers.Conv2D(64, (3, 3), activation='relu'))
original_model.add(layers.Flatten())
original_model.add(layers.Dropout(0.25))

original_model.add(layers.Dense(64, activation='relu'))
original_model.add(layers.Dropout(0.5))
original_model.add(layers.Dense(10, activation='softmax'))

original_model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
history_0 = original_model.fit(original_x_train, original_y_train, epochs= 10, batch_size= 64, validation_data=(original_x_test, original_y_test))
# loss: 0.9075 - accuracy: 0.6951 - val_loss: 0.8743 - val_accuracy: 0.7026

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [69]:
# 잘못예측한 데이터 찾는 코드
# original_label, predict_label
wrong_predict = []
wrong_predict_cnt = 0
class_length = 10

model_predict = original_model.predict(original_x_test)

for i in range(len(original_y_test)):
  predict_idx, original_idx = 0, 0
  for j in range(1,10):
    if model_predict[i][j] > model_predict[i][predict_idx]:
      predict_idx = j
    if original_y_test[i][j] > original_y_test[i][original_idx]:
      original_idx = j

  if predict_idx != original_idx:
    wrong_predict.append([original_idx, predict_idx])

similar_wrong_predict_count = [[0 for j in range(class_length)] for i in range(class_length)]
for i in range(len(wrong_predict)):
  similar_wrong_predict_count[wrong_predict[i][0]][wrong_predict[i][1]] = similar_wrong_predict_count[wrong_predict[i][0]][wrong_predict[i][1]] + 1 

for i in range(class_length):
  print(similar_wrong_predict_count[i])

# result
# [0, 27, 28, 8, 5, 1, 7, 8, 59, 34]
# [16, 0, 0, 6, 1, 3, 3, 1, 18, 51]
# [101, 9, 0, 36, 93, 69, 60, 29, 18, 14]
# [45, 22, 73, 0, 58, 196, 88, 38, 28, 30]
# [40, 4, 71, 39, 0, 26, 66, 94, 11, 3]
# [20, 7, 47, 146, 48, 0, 24, 65, 10, 11]
# [12, 7, 48, 41, 33, 17, 0, 7, 13, 10]
# [23, 2, 32, 23, 36, 50, 5, 0, 4, 15]
# [78, 39, 4, 5, 3, 4, 4, 5, 0, 19]
# [31, 128, 5, 6, 4, 3, 3, 10, 21, 0]

[0, 21, 117, 20, 38, 8, 13, 16, 98, 61]
[5, 0, 3, 12, 4, 3, 24, 3, 18, 120]
[40, 8, 0, 85, 130, 56, 117, 29, 15, 12]
[5, 4, 57, 0, 68, 177, 115, 33, 18, 19]
[16, 2, 40, 78, 0, 21, 96, 89, 8, 5]
[1, 1, 55, 250, 57, 0, 36, 46, 4, 8]
[3, 1, 35, 65, 30, 8, 0, 4, 4, 4]
[5, 0, 40, 61, 63, 70, 11, 0, 6, 14]
[36, 29, 15, 34, 11, 1, 15, 1, 0, 39]
[7, 48, 12, 24, 7, 8, 13, 4, 27, 0]


In [70]:
# 가장 큰 값 top 3의 index를 가져와야 함 (cur_idx 제외)
def getTopN(target_list, n, cur_idx):
  tmp = target_list.copy()
  visited = []
  top_idx = []
  for i in range(0,10):
    if len(top_idx) == n:
      break;
    max_num = -1
    max_idx = -1
    for j in range(0,10):
        if max_num < tmp[j]:
            if j == cur_idx:
                continue
            if j in visited:
                continue
            else:  
                max_num = tmp[j]
                max_idx = j
    
    if max_idx != -1:
      top_idx.append(max_idx)
      visited.append(max_idx)
  return top_idx

# 가장 작은 값 bottom 3의 index를 가져와야 함  (cur_idx 제외)
def getBottomN(target_list, n, cur_idx):
  tmp = target_list.copy()
  visited = []
  bottom_idx = []
  for i in range(0,10):
    if len(bottom_idx) == n:
      break;
    min_num = 1e9
    min_idx = -1
    for j in range(0,10):
        if tmp[j] < min_num:
            if j == cur_idx:
                continue
            if j in visited:
                continue
            else:  
                min_num = tmp[j]
                min_idx = j
    
    if min_idx != -1:
      bottom_idx.append(min_idx)
      visited.append(min_idx)
  return bottom_idx

In [71]:
# cifar10 데이터 가져오는 함수
def getCifar10Data():
  (x_train, y_train), (x_test, y_test) = keras.datasets.cifar10.load_data()
  x_train = x_train / 255.0
  x_test = x_test / 255.0
  return (x_train, y_train), (x_test, y_test)

# a, b, c로 다시 라벨링
def reLabel(y_train, y_test, a, b, c):
  for i in range(len(y_train)):
    if y_train[i] == a or y_train[i] == b or y_train[i] == c:
      y_train[i] = 1
    else:
      y_train[i] = 0    
  
  for i in range(len(y_test)):
    if y_test[i] == a or y_test[i] == b or y_test[i] == c:
      y_test[i] = 1
    else:
      y_test[i] = 0
  
  return y_train, y_test

(model1_x_train, model1_y_train), (model1_x_test, model1_y_test) = getCifar10Data()

In [72]:
# model 만드는 함수 
def makeModel():
  model = models.Sequential()
  model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
  model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
  model.add(layers.MaxPooling2D((2, 2)))
  model.add(layers.Dropout(0.25))

  model.add(layers.Conv2D(64, (3, 3), activation='relu'))
  model.add(layers.Conv2D(64, (3, 3), activation='relu'))
  model.add(layers.MaxPooling2D((2, 2)))
  model.add(layers.Dropout(0.25))

  model.add(layers.Conv2D(64, (3, 3), activation='relu'))
  model.add(layers.Conv2D(64, (3, 3), activation='relu'))
  model.add(layers.Flatten())
  model.add(layers.Dropout(0.25))

  model.add(layers.Dense(64, activation='relu'))
  model.add(layers.Dense(64, activation='relu'))
  model.add(layers.Dropout(0.5))
  model.add(layers.Dense(2, activation='softmax'))
  return model

In [75]:
# # 모델의 결과가 true인 predict index 반환함수
# def get_TP_FP(y_test, predict, target_idx):
#     TP = []
#     FP = []
#     for i in range(len(y_test)):
#         if predict[i].argmax(axis = -1) == 1:
#             idx = -1
#             for j in range(10):
#                 if y_test[i][j] == 1:
#                     idx = j
#                     break
#             if idx == target_idx:
#                 TP.append(i)
#             else:
#                 FP.append(i)
#     return TP, FP

# # 모델의 결과가 false인 predict index 반환함수
# def get_TN_FN(y_test, predict, target_idx):
#     TN = []
#     FN = []
#     for i in range(len(y_test)):
#         if predict[i].argmax(axis = -1) == 0:
#             idx = -1
#             for j in range(10):
#                 if y_test[i][j] == 1:
#                     idx = j
#                     break
#             if idx == target_idx:
#                 TN.append(i)
#             else:
#                 FN.append(i)
#     return TN, FN

def get_TP_FP_TN_FN(y_test, predict, target_idx):
    TP = []
    FP = []
    TN = []
    FN = []
    for i in range(len(y_test)):
        idx = -1
        for j in range(10):
            if y_test[i][j] == 1:
                idx = j
                break
                
        if predict[i].argmax(axis = -1) == 1:
            if idx == target_idx:
                TP.append(i)
            else:
                FP.append(i)
        elif predict[i].argmax(axis = -1) == 0:
            if idx == target_idx:
                FN.append(i)
            else:
                TN.append(i)
            
    return TN, FP, TN, FN

In [79]:
def get_result_model_TP_FP_TN_FN(first_predict, second_predict, y_test, target_idx):
    TP, FP, TN, FN = [],[],[],[]
    for i in range(len(y_test)):
        idx = -1
        for j in range(10):
            if y_test[i][j] == 1:
                idx = j
        if first_predict[i].argmax(axis = -1) == 1 and second_predict[i].argmax(axis = -1) == 0:
            if idx == target_idx:
                TP.append(i)
            else:
                FP.append(i)
        elif first_predict[i].argmax(axis = -1) == 0 and second_predict[i].argmax(axis = -1) == 1:
            if idx == target_idx:
                FN.append(i)
            else:
                TN.append(i)
        elif first_predict[i].argmax(axis = -1) == 0 and second_predict[i].argmax(axis = -1) == 0:
            if idx == target_idx:
                TP.append(i)
            else:
                FP.append(i)
        elif first_predict[i].argmax(axis = -1) == 1 and second_predict[i].argmax(axis = -1) == 1:
            if idx == target_idx:
                FN.append(i)
            else:
                TN.append(i)
    return TP, FP, TN, FN
        

In [80]:
# 0~9 클래스 
# 0클래스 결과값을 봤을 때, true-false모델을 통과한 0번 클래스가 772개인데 나머지 클래스들이 어디서 데이터가 누수됐는지 분석해보기

class_accuracy = []
first_TP_FP_TN_FN = []
second_TP_FP_TN_FN = []
model_result_predict = []

for i in range(0, class_length):
    print(i, "번째 클래스")
    # 첫번째 모델 -> 가장 유사한 클래스끼리 묶은 라벨
    print("[model1] : 가장 유사한 클래스끼리 묶은 라벨")
    (x_train, y_train), (x_test, y_test) = getCifar10Data()
    temp = getTopN(similar_wrong_predict_count[i], 2, i)
    # 현재 클래스 index 추가 
    temp.append(i)
    print(temp)
    (y_train, y_test) = reLabel(y_train, y_test, temp[0], temp[1], temp[2])

    model1 = makeModel()
    model1.compile(optimizer='adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics=['accuracy'])
    model1.fit(x_train, y_train, epochs= 10, batch_size = 64, validation_data=(x_test, y_test))
    first_predict = model1.predict(x_test)
#     first_TP_FP.append(get_TP_FP(original_y_test, first_predict, i))
#     first_TN_FN.append(get_TN_FN(original_y_test, first_predict, i))
    first_TP_FP_TN_FN.append(get_TP_FP_TN_FN(original_y_test, first_predict, i))
    
    
    # 두번째 모델 -> 가장 유사하지않은 클래스끼리 묶은 라벨
    print("[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨")
    (x_train2, y_train2), (x_test2, y_test2) = getCifar10Data()
    temp = getBottomN(similar_wrong_predict_count[i], 3, i)
    print(temp)

    (y_train2, y_test2) = reLabel(y_train2, y_test2, temp[0], temp[1], temp[2])

    model2 = makeModel()
    model2.compile(optimizer='adam', loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True), metrics=['accuracy'])
    model2.fit(x_train2, y_train2, epochs= 10, batch_size = 64, validation_data=(x_test2, y_test2))
    second_predict = model2.predict(x_test2)
#     second_TP_FP.append(get_TP_FP(original_y_test, second_predict, i))
#     second_TN_FN.append(get_TN_FN(original_y_test, second_predict, i))
    second_TP_FP_TN_FN.append(get_TP_FP_TN_FN(original_y_test, second_predict, i))
    
    # 모델의 TP FP TN FN
    model_result_predict.append(get_result_model_TP_FP_TN_FN(first_predict, second_predict, original_y_test, i))
    
    
    # 첫번째 모델에서 True 두번째 모델에서 False가 나온 모델
#     class_accuracy.append(getRealTrueRatio(first_predict, second_predict, original_y_test,i))  
    print("===============================================================================================")

0 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[2, 8, 0]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[5, 6, 7]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
1 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[9, 6, 1]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[2, 5, 7]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
2 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[4, 6, 2]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[1, 9, 8]
Epoch 1/10
Epoch 2/10
Epoch 3/10


Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
3 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[5, 6, 3]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[1, 0, 8]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
4 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[6, 7, 4]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[1, 9, 8]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
5 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[3, 4, 5]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10


Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[0, 1, 8]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
6 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[3, 2, 6]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[1, 0, 7]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
7 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[5, 4, 7]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[1, 0, 8]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10


Epoch 8/10
Epoch 9/10
Epoch 10/10
8 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[9, 0, 8]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[5, 7, 4]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
9 번째 클래스
[model1] : 가장 유사한 클래스끼리 묶은 라벨
[1, 8, 9]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
[model2] : 가장 유사하지않은 클래스끼리 묶은 라벨
[7, 0, 4]
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [81]:
for i in range(10):
    print("클래스 : ",i)
    print("첫번째 모델에서 TP: ", len(first_TP_FP_TN_FN[i][0]))
    print("첫번째 모델에서 FP: ", len(first_TP_FP_TN_FN[i][1]))
    print("첫번째 모델에서 TN: ", len(first_TP_FP_TN_FN[i][2]))
    print("첫번째 모델에서 FN: ", len(first_TP_FP_TN_FN[i][3]))

    print("두번째 모델에서 TP: ", len(second_TP_FP_TN_FN[i][0]))
    print("두번째 모델에서 FP: ", len(second_TP_FP_TN_FN[i][1]))
    print("두번째 모델에서 TN: ", len(second_TP_FP_TN_FN[i][2]))
    print("두번째 모델에서 FN: ", len(second_TP_FP_TN_FN[i][3]))
    
    print("모델 결과 TP: ", len(model_result_predict[i][0]))
    print("모델 결과 FP: ", len(model_result_predict[i][1]))
    print("모델 결과 TN: ", len(model_result_predict[i][2]))
    print("모델 결과 FN: ", len(model_result_predict[i][3]))
    
    # precision = TP / (TP + FP)
    print("precision: ", (len(model_result_predict[i][0]) / (len(model_result_predict[i][0]) + len(model_result_predict[i][1]))))
    # accuracy = (TP + TN) / (TP + TN + FP + FN)
    print("accuracy: ", ((len(model_result_predict[i][0]) + len(model_result_predict[i][2]))
                               / (len(model_result_predict[i][0]) + len(model_result_predict[i][1]) + len(model_result_predict[i][2]) + len(model_result_predict[i][3]))))
    print("")

    #     print("true-false를 통과한 개수 : ", 1000 - (len(first_false[i]) + len(second_true[i])) )
#     print("precision: ", len(first_TP_TN[i][0])/(len(first_TP_TN[i][0]) + len(second_FP_FN[i][0])))
#     print("accuracy: ", (len(first_TP_TN[0][i]) + len(first_TP_TN[1][i]))
#           /len(first_TP_TN[0][i]) + len(first_TP_TN[1][i]) + len(second_FP_FN[0][i]) + len(second_FP_FN[1][i]))

클래스 :  0
첫번째 모델에서 TP:  6847
첫번째 모델에서 FP:  2153
첫번째 모델에서 TN:  6847
첫번째 모델에서 FN:  113
두번째 모델에서 TP:  6077
두번째 모델에서 FP:  2923
두번째 모델에서 TN:  6077
두번째 모델에서 FN:  975
모델 결과 TP:  975
모델 결과 FP:  6077
모델 결과 TN:  2923
모델 결과 FN:  25
precision:  0.13825865002836074
accuracy:  0.3898

클래스 :  1
첫번째 모델에서 TP:  6698
첫번째 모델에서 FP:  2302
첫번째 모델에서 TN:  6698
첫번째 모델에서 FN:  58
두번째 모델에서 TP:  6748
두번째 모델에서 FP:  2252
두번째 모델에서 TN:  6748
두번째 모델에서 FN:  994
모델 결과 TP:  994
모델 결과 FP:  6748
모델 결과 TN:  2252
모델 결과 FN:  6
precision:  0.12839059674502712
accuracy:  0.3246

클래스 :  2
첫번째 모델에서 TP:  6628
첫번째 모델에서 FP:  2372
첫번째 모델에서 TN:  6628
첫번째 모델에서 FN:  266
두번째 모델에서 TP:  6453
두번째 모델에서 FP:  2547
두번째 모델에서 TN:  6453
두번째 모델에서 FN:  994
모델 결과 TP:  994
모델 결과 FP:  6453
모델 결과 TN:  2547
모델 결과 FN:  6
precision:  0.13347656774540084
accuracy:  0.3541

클래스 :  3
첫번째 모델에서 TP:  6714
첫번째 모델에서 FP:  2286
첫번째 모델에서 TN:  6714
첫번째 모델에서 FN:  202
두번째 모델에서 TP:  6253
두번째 모델에서 FP:  2747
두번째 모델에서 TN:  6253
두번째 모델에서 FN:  968
모델 결과 TP:  968
모델 결과 FP:  6253


In [84]:
print("accuracy: ",  (len(model_result_predict[i][0]) + len(model_result_predict[i][1]) + len(model_result_predict[i][2]) + len(model_result_predict[i][3])))

accuracy:  10000
