In [7]:
data(iris)

# 인공신경망

In [2]:
library(nnet) # 인공신경망 라이브러리

### 표준화 전 

In [55]:
print("================================================= 데이터셋")
# 학습용과 검증용 데이터셋 나누기
#  150 : 105 (70%) + 45 (30%)
set.seed(1234) # 샘플값 고정
samp <- c(sample(1:50, 35), sample(51:100, 35),sample(101:150, 35))

# 학습용 데이터
data.tr <- iris[samp,]
# 검증용 데이터
data.test <- iris[-samp,]


print("================================================= nnet")
#  nnet (종속변수 ~ 독립변수), size : 은닉층갯수
model.nnet <- nnet(Species ~ . , data = data.tr, size = 3)


print("================================================= predict")
 # 신경망 모델의 검증 predict(), class
predicted <- predict(model.nnet, data.test, type = "class")


print("================================================= 예측결과")
# 검증용 데이터셋의 예측결과를 벡터의 형태로 변형
actual <- data.test$Species # 정답 변수
result <- table(actual,predicted)


print("================================================= 정확도")
# 모델의 정확도
paste("예측확률",round(mean(predicted == actual),4) * 100 ,"%")

# weights:  27
initial  value 121.918593 
iter  10 value 50.885970
iter  20 value 2.950819
iter  30 value 0.002953
final  value 0.000071 
converged


### 표준화 후

In [56]:
print("================================================= 표준화")
# 표준화 작업 - 다중 공선성을 지키려 표준화를 시킨다
iris.scaled <- cbind(scale(iris[-5]),iris[5])   # 표준화 시킨 데이터를 다시 데이터 프레임 만들기

# 표준편차
apply(iris.scaled[-5], 2, sd)

print("================================================= 데이터셋")
# 학습용과 검증용 데이터셋 나누기
#  150 : 105 (70%) + 45 (30%)
set.seed(1234) # 샘플값 고정
samp <- c(sample(1:50, 35), sample(51:100, 35),sample(101:150, 35))

# 학습용 데이터
data.tr <- iris.scaled[samp,]
# 검증용 데이터
data.test <- iris.scaled[-samp,]


print("================================================= nnet")
#  nnet (종속변수 ~ 독립변수), size : 은닉층갯수
model.nnet <- nnet(Species ~ . , data = data.tr, size = 3)

print("================================================= predict")
 # 신경망 모델의 검증 predict(), class
predicted <- predict(model.nnet, data.test, type = "class")


print("================================================= 예측결과")
# 검증용 데이터셋의 예측결과를 벡터의 형태로 변형
actual <- data.test$Species # 정답 변수
result <- table(actual,predicted)


print("================================================= 정확도")
# 모델의 정확도
paste("예측확률",round(mean(predicted == actual),4) * 100 ,"%")



# weights:  27
initial  value 133.397993 
iter  10 value 3.873727
iter  20 value 0.013426
final  value 0.000094 
converged


# 의사결정나무

In [57]:
library(party)
library(e1071)
library(caret)

### 표준화 전 

In [58]:
# 샘플 데이터 형성
#  150 : 105 (70%) + 45 (30%)
set.seed(1234) # 샘플값 고정
samp <- c(sample(1:50, 35), sample(51:100, 35),sample(101:150, 35))

# 학습용 검증용 데이터 분류
# 학습용 데이터
data.tr <- iris[samp,]
# 검증용 데이터
data.test <- iris[-samp,]

# 학습시키기
iris_tree <- ctree(Species ~., data = data.tr)

# 예측하기
pred <- predict(iris_tree, data.test)

# 확인하기 - 정답 오답을
table(data.test$Species, pred)

# 예측률
round(mean(data.test$Species == pred) * 100,2)

            pred
             setosa versicolor virginica
  setosa         15          0         0
  versicolor      0         15         0
  virginica       0          3        12

### 표준화 후

In [59]:

# 표준화 작업 - 다중 공선성을 지키려 표준화를 시킨다
iris.scaled <- cbind(scale(iris[-5]),iris[5])  

# 샘플 데이터 형성
#  150 : 105 (70%) + 45 (30%)
set.seed(1234) # 샘플값 고정
samp <- c(sample(1:50, 35), sample(51:100, 35),sample(101:150, 35))

# 학습용 검증용 데이터 분류
# 학습용 데이터
data.tr <- iris.scaled[samp,]
# 검증용 데이터
data.test <- iris.scaled[-samp,]

# 학습시키기
iris_tree <- ctree(Species ~., data = data.tr)

# 예측하기
pred <- predict(iris_tree, data.test)

# 확인하기 - 정답 오답을
table(data.test$Species, pred)

# 예측률
round(mean(data.test$Species == pred) * 100,2)

            pred
             setosa versicolor virginica
  setosa         15          0         0
  versicolor      0         15         0
  virginica       0          3        12

# RandomForest

In [None]:
### 

In [60]:
library(randomForest)

### 표준화 전 

In [277]:
# 샘플 데이터 형성
#  150 : 105 (70%) + 45 (30%)
set.seed(1234) # 샘플값 고정
samp <- c(sample(1:50, 35), sample(51:100, 35),sample(101:150, 35))

# 학습용 검증용 데이터 분류
# 학습용 데이터
data.tr <- iris[samp,]
# 검증용 데이터
data.test <- iris[-samp,]

# 학습시키기
rf <- randomForest(Species ~., data = data.tr, ntree = 100)

# 예측하기
pred <- predict(rf, data.test)

# 확인하기 - 정답 오답을
table(data.test$Species, pred)

# 예측률
round(mean(data.test$Species == pred) * 100,2)

            pred
             setosa versicolor virginica
  setosa         15          0         0
  versicolor      0         15         0
  virginica       0          2        13

### 표준화 후

In [293]:
# 표준화 작업 - 다중 공선성을 지키려 표준화를 시킨다
iris.scaled <- cbind(scale(iris[-5]),iris[5])  

# 샘플 데이터 형성
#  150 : 105 (70%) + 45 (30%)
set.seed(1234) # 샘플값 고정
samp <- c(sample(1:50, 35), sample(51:100, 35),sample(101:150, 35))

# 학습용 검증용 데이터 분류
# 학습용 데이터
data.tr <- iris.scaled[samp,]
# 검증용 데이터
data.test <- iris.scaled[-samp,]

# 학습시키기
rf <- randomForest(Species ~., data = data.tr, ntree = 100)

# 예측하기
pred <- predict(rf, data.test)

# 확인하기 - 정답 오답을
table(data.test$Species, pred)

# 예측률
round(mean(data.test$Species == pred) * 100,2)

            pred
             setosa versicolor virginica
  setosa         15          0         0
  versicolor      0         15         0
  virginica       0          3        12

# SVM

In [63]:
library(e1071)

### 표준화 전 

In [64]:
# 샘플 데이터 형성
#  150 : 105 (70%) + 45 (30%)
set.seed(1234) # 샘플값 고정
samp <- c(sample(1:50, 35), sample(51:100, 35),sample(101:150, 35))

# 학습용 검증용 데이터 분류
# 학습용 데이터
data.train <- iris[samp,]
# 검증용 데이터
data.test <- iris[-samp,]

# 학습시키기
model <- svm(Species ~., data = data.train)

# 예측하기
pred <- predict(model, data.test)

# 확인하기 - 정답 오답을
table(data.test$Species, pred)

# 예측률
round(mean(data.test$Species == pred) * 100,2)

            pred
             setosa versicolor virginica
  setosa         15          0         0
  versicolor      0         14         1
  virginica       0          2        13

### 표준화 후

In [65]:
# 표준화 작업 - 다중 공선성을 지키려 표준화를 시킨다
iris.scaled <- cbind(scale(iris[-5]),iris[5])  

# 샘플 데이터 형성
#  150 : 105 (70%) + 45 (30%)
set.seed(1234) # 샘플값 고정
samp <- c(sample(1:50, 35), sample(51:100, 35),sample(101:150, 35))

# 학습용 검증용 데이터 분류
# 학습용 데이터
data.train <- iris.scaled[samp,]
# 검증용 데이터
data.test <- iris.scaled[-samp,]

# 학습시키기
model <- svm(Species ~., data = data.train)

# 예측하기
pred <- predict(model, data.test)

# 확인하기 - 정답 오답을
table(data.test$Species, pred)

# 예측률
round(mean(data.test$Species == pred) * 100,2)

            pred
             setosa versicolor virginica
  setosa         15          0         0
  versicolor      0         14         1
  virginica       0          2        13