# 소프트맥스 회귀(Softmax Regression) - 다중 클래스 분류

### 소프트맥스 회귀(Softmax Regression)

#### 1) 아이리스 품종 데이터에 대한 이해

In [None]:
import pandas as pd
import seaborn as sns

In [None]:
data = pd.read_csv('C:/Users/it/Downloads/dataset/iris.csv',encoding='latin1')

In [None]:
sns.set(style="ticks", color_codes=True)
data = sns.load_dataset("iris")
g = sns.pairplot(iris, hue="species", palette="husl")

In [None]:
print(len(data))
data.head(5)

In [None]:
print("품종 종류:", data["species"].unique(), sep="\n")

In [None]:
sns.barplot(data['species'], data['sepal_width'], ci=None)
# 각 종과 특성에 대한 연관 관계

In [None]:
import matplotlib.pyplot as plt
data["species"].value_counts().plot(kind='bar')

In [None]:
from sklearn.model_selection import train_test_split
data_X = data[['sepal_length', 'sepal_width', 'petal_length', 'petal_width']].values # X 데이터에 해당됩니다. X는 총 4개입니다.
data_y = data['species'].values # Y 데이터에 해당됩니다. 예측해야하는 값입니다.

print(data_X[:5]) #X에 해당되는 데이터를 10개만 출력합니다.
print(data_y[:5]) #y에 해당되는 데이터를 10개만 출력합니다.

In [None]:
(X_train, X_test, y_train, y_test) = train_test_split(data_X, data_y, train_size=0.8, random_state=1)
X_train.shape, X_test.shape, y_train.shape, y_test.shape

In [None]:
# 훈련 데이터와 테스트 데이터를 8:2로 나눕니다. 또한 데이터의 순서를 섞습니다.
from tensorflow.keras.utils import to_categorical
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)
# 훈련 데이터와 테스트 데이터에 대해서 원-핫 인코딩
print(y_train[:5])
print(y_test[:5])

#### 2) 소프트맥스 회귀

In [None]:
from tensorflow.keras.models import Sequential # 케라스의 Sequential()을 임포트
from tensorflow.keras.layers import Dense # 케라스의 Dense()를 임포트
from tensorflow.keras import optimizers # 케라스의 옵티마이저를 임포트

model=Sequential()
model.add(Dense(3, input_dim=4, activation='softmax'))
sgd=optimizers.SGD(lr=0.01)
# 학습률(learning rate, lr)은 0.01로 합니다.
model.compile(loss='categorical_crossentropy', optimizer='adam',metrics=['accuracy'])
# 옵티마이저는 경사하강법의 일종인 adam을 사용합니다.
# 손실 함수(Loss function)은 평균제곱오차 크로스 엔트로피 함수를 사용합니다.
history=model.fit(X_train,y_train, batch_size=1, epochs=200, validation_data=(X_test, y_test))
# 주어진 X와 y데이터에 대해서 오차를 최소화하는 작업을 200번 시도합니다.

In [None]:
epochs = range(1, len(history.history['accuracy']) + 1)
plt.plot(epochs, history.history['loss'])
plt.plot(epochs, history.history['val_loss'])
plt.title('model loss')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'val'], loc='upper left')
plt.show()

In [None]:
print("\n 테스트 정확도: %.4f" % (model.evaluate(X_test, y_test)[1]))