In [17]:
#KNN

import os
import cv2
import numpy as np
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import classification_report
from sklearn.metrics import accuracy_score

# 폴더 경로 설정
train_path = "banana_images/"


# 데이터 저장을 위한 리스트
trainX = []  # 훈련 데이터
trainY = []  # 훈련 데이터의 레이블
testX = []   # 테스트 데이터
testY = []   # 테스트 데이터의 실제 레이블
predictedY = []  # 예측된 레이블

# 함수: 이미지의 평균 색상을 계산
def averagecolor(image):
    average_color = np.mean(image, axis=(0, 1))
    return average_color

# 데이터 불러오기 및 훈련 데이터 준비
labels = ('ripe', 'unripe', 'overripe')

for label in labels:
    print("Loading training images for the label: " + label)
    
    # 훈련 데이터 로딩
    for filename in os.listdir(train_path + label + "/"):
        img = cv2.imread(train_path + label + "/" + filename)
        img_features = averagecolor(img)
        trainX.append(img_features)
        trainY.append(label)

        
def evaluateaccuracy(filenames,predictedY):
    predictedY = np.array(predictedY)
    if (np.sum(testY!=predictedY)>0):
        print ("Wrong Predictions: (filename, labelled, predicted) ")
        print (np.dstack([filenames,testY,predictedY]).squeeze()[(testY!=predictedY)])
    # 전체 예측의 백분율로 일치하는 (정확한) 예측을 계산합니다.
    return "Correct :"+ str(np.sum(testY==predictedY)) + ". Wrong: "+str(np.sum(testY!=predictedY)) + ". Correctly Classified: " + str(np.sum(testY==predictedY)*100/len(predictedY))+"%"


# KNN 모델 초기화 및 훈련
k = 3  # KNN에서 사용할 이웃의 수
model = KNeighborsClassifier(n_neighbors=k)
model.fit(trainX, trainY)


# 테스트 데이터 로딩 및 예측
test_path = "banana_images/test/"
testY = []
predictedY = []
filenames = []

test_labels = ('ripe', 'unripe', 'overripe')
for label in test_labels:
    print("Loading training images for the label: " + label)
    
    # 훈련 데이터 로딩
    for filename in os.listdir(test_path + label + "/"):
       
        img = cv2.imread(test_path + label + "/" + filename)
        
        img_features = averagecolor(img)
        testX.append(img_features)    
        testY.append(label)
           
    # KNN 모델을 사용하여 예측
        prediction = model.predict([img_features])[0]
        predictedY.append(prediction)
        filenames.append(filename)
        

# 정확도 평가
accuracy = accuracy_score(testY, predictedY)
print("Accuracy:", accuracy)

# 정확도 평가(sklearn 패키지는 유용한 보고서를 제공합니다)
print ()
print(classification_report(testY, predictedY))

# 정확도 평가
print (evaluateaccuracy(filenames,predictedY))

Loading training images for the label: ripe
Loading training images for the label: unripe
Loading training images for the label: overripe
Loading training images for the label: ripe
Loading training images for the label: unripe
Loading training images for the label: overripe
Accuracy: 0.8518518518518519

              precision    recall  f1-score   support

    overripe       0.88      0.70      0.78        10
        ripe       0.88      0.88      0.88         8
      unripe       0.82      1.00      0.90         9

    accuracy                           0.85        27
   macro avg       0.86      0.86      0.85        27
weighted avg       0.86      0.85      0.85        27

Wrong Predictions: (filename, labelled, predicted) 
[['1.jpg' 'ripe' 'overripe']
 ['10.jpg' 'overripe' 'unripe']
 ['2.jpg' 'overripe' 'unripe']
 ['8.jpeg' 'overripe' 'ripe']]
Correct :23. Wrong: 4. Correctly Classified: 85.18518518518519%


In [16]:
# SVM

import os
import cv2
import numpy as np
from sklearn.svm import SVC
from sklearn.metrics import classification_report
from sklearn.metrics import accuracy_score

# 폴더 경로 설정
train_path = "banana_images/"

# 데이터 저장을 위한 리스트
trainX = []  # 훈련 데이터
trainY = []  # 훈련 데이터의 레이블
testX = []   # 테스트 데이터
testY = []   # 테스트 데이터의 실제 레이블
predictedY = []  # 예측된 레이블

# 함수: 이미지의 평균 색상을 계산
def averagecolor(image):
    average_color = np.mean(image, axis=(0, 1))
    return average_color

# 데이터 불러오기 및 훈련 데이터 준비
labels = ('ripe', 'unripe', 'overripe')

for label in labels:
    print("Loading training images for the label: " + label)
    
    # 훈련 데이터 로딩
    for filename in os.listdir(train_path + label + "/"):
        img = cv2.imread(train_path + label + "/" + filename)
        img_features = averagecolor(img)
        trainX.append(img_features)
        trainY.append(label)

# SVM 모델 초기화 및 훈련
model = SVC(kernel='linear')  # 선형 커널 사용, 다른 커널 옵션도 있음
model.fit(trainX, trainY)

# 테스트 데이터 로딩 및 예측
test_path = "banana_images/test/"
testY = []
predictedY = []
filenames = []

test_labels = ('ripe', 'unripe', 'overripe')
for label in test_labels:
    print("Loading test images for the label: " + label)
    
    # 테스트 데이터 로딩
    for filename in os.listdir(test_path + label + "/"):
        img = cv2.imread(test_path + label + "/" + filename)
        
        img_features = averagecolor(img)
        testX.append(img_features)    
        testY.append(label)
           
        # SVM 모델을 사용하여 예측
        prediction = model.predict([img_features])[0]
        predictedY.append(prediction)
        filenames.append(filename)

        
# 정확도 평가
accuracy = accuracy_score(testY, predictedY)
print("Accuracy:", accuracy)

# 정확도 평가(sklearn 패키지는 유용한 보고서를 제공합니다)
print()
print(classification_report(testY, predictedY))

Loading training images for the label: ripe
Loading training images for the label: unripe
Loading training images for the label: overripe
Loading test images for the label: ripe
Loading test images for the label: unripe
Loading test images for the label: overripe
Accuracy: 0.9259259259259259

              precision    recall  f1-score   support

    overripe       0.83      1.00      0.91        10
        ripe       1.00      0.75      0.86         8
      unripe       1.00      1.00      1.00         9

    accuracy                           0.93        27
   macro avg       0.94      0.92      0.92        27
weighted avg       0.94      0.93      0.92        27

