In [1]:
import xgboost as xgb
import numpy as np

from art.attacks.evasion import ZooAttack
from art.estimators.classification import XGBoostClassifier
from art.utils import load_mnist

In [2]:
# MNIST 데이터 셋을 불러온다

(x_train, y_train), (x_test, y_test), min_pixel_value, max_pixel_value = load_mnist()

In [3]:
# 데이터를 전처리 한다

x_test = x_test[0:100]
y_test = y_test[0:100]

nb_samples_train = x_train.shape[0]
nb_samples_test = x_test.shape[0]
x_train = x_train.reshape((nb_samples_train, 28 * 28))
x_test = x_test.reshape((nb_samples_test, 28 * 28))

In [4]:
# XGboost를 이용하여 모델을 생성하고 학습시킨다

params = {"objective": "multi:softprob", "metric": "accuracy", "num_class": 10}
dtrain = xgb.DMatrix(x_train, label=np.argmax(y_train, axis=1))
dtest = xgb.DMatrix(x_test, label=np.argmax(y_test, axis=1))
evals = [(dtest, "test"), (dtrain, "train")]
model = xgb.train(params=params, dtrain=dtrain, num_boost_round=2, evals=evals)

Parameters: { metric } might not be used.

  This may not be accurate due to some parameters are only used in language bindings but
  passed down to XGBoost core.  Or some parameters are not used but slip through this
  verification. Please open an issue if you find above cases.


[0]	test-merror:0.10000	train-merror:0.13210
[1]	test-merror:0.07000	train-merror:0.09192


In [5]:
# 공격을 받아들이기 위한 ART Classifier를 생성한다

classifier = XGBoostClassifier(
    model=model, clip_values=(min_pixel_value, max_pixel_value), nb_features=28 * 28, nb_classes=10
)

In [6]:
# 공격을 진행하지 않은 데이터를 가지고 
# 위에서 학습시킨 classifer를 이용하여 정확도를 분석한다 

predictions = classifier.predict(x_test)
accuracy = np.sum(np.argmax(predictions, axis=1) == np.argmax(y_test, axis=1)) / len(y_test)
print("기존의 데이터를 이용한 Xgboost 정확도 : {}%".format(accuracy * 100))

기존의 데이터를 이용한 Xgboost 정확도 : 93.0%


In [7]:
# ZOO 공격을 선언하고 해당 공격으로 데이터를 공격한다

attack = ZooAttack(
    classifier=classifier,
    confidence=0.0,
    targeted=False,
    learning_rate=1e-1,
    max_iter=200,
    binary_search_steps=10,
    initial_const=1e-3,
    abort_early=True,
    use_resize=False,
    use_importance=False,
    nb_parallel=5,
    batch_size=1,
    variable_h=0.01,
)
x_test_adv = attack.generate(x=x_test, y=y_test)

ZOO:   0%|          | 0/100 [00:00<?, ?it/s]

In [8]:
# 위에서 만들어진 ZOO 공격 의해 공격된 데이터를 가지고
# classifer를 이용하여 정확도를 분석한다

predictions = classifier.predict(x_test_adv)
accuracy = np.sum(np.argmax(predictions, axis=1) == np.argmax(y_test, axis=1)) / len(y_test)
print("ZOO 에 의해 공격당한 데이터를 이용한 Xgboost 정확도 : {}%".format(accuracy * 100))

ZOO 에 의해 공격당한 데이터를 이용한 Xgboost 정확도 : 6.0%
