In [1]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
import pickle

# Путь к вашей папке с данными
data_path = r'D:\diplom_baza\baza_copy'

# Инициализация списков для данных и меток
X = []
y = []

# Целевое разрешение изображений
target_resolution = (300, 300)

# Словарь для хранения счетчика неправильных файлов для каждой папки
invalid_file_counts = {}

# Проход по всем классам в папке
for class_folder in os.listdir(data_path):
    class_path = os.path.join(data_path, class_folder)
    
    # Инициализация счетчика неправильных файлов для текущей папки
    invalid_file_count = 0
    
    # Проход по изображениям в каждом классе
    for image_file in os.listdir(class_path):
        image_path = os.path.join(class_path, image_file)
        
        # Загрузка изображения с использованием opencv
        img = cv2.imread(image_path)
        
        # Проверка на успешность загрузки
        if img is not None:
            # Изменение размера изображения
            img = cv2.resize(img, target_resolution)
            
            # Преобразование изображения в массив и добавление в список X
            X.append(img)
            
            # Добавление метки класса в список y
            y.append(class_folder)
        else:
            # Увеличение счетчика неправильных файлов для текущей папки
            invalid_file_count += 1
    
    # Сохранение счетчика неправильных файлов для текущей папки в словаре
    invalid_file_counts[class_folder] = invalid_file_count

# Преобразование списков в массивы numpy
X = np.array(X)
y = np.array(y)

# Разделение данных на обучающий и тестовый наборы
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=42)

# Разделение обучающего набора на обучающий и валидационный
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.1, random_state=42)

# Инициализация и обучение label_encoder
label_encoder = LabelEncoder()
y_train_encoded = label_encoder.fit_transform(y_train)
y_val_encoded = label_encoder.transform(y_val)
# Вывод счетчика неправильных файлов для каждой папки
for class_folder, count in invalid_file_counts.items():
    print(f"Папка {class_folder}: {count} неправильных файлов")

Папка aronnik: 1 неправильных файлов
Папка barbaris: 2 неправильных файлов
Папка belladonna: 2 неправильных файлов
Папка belokrilnik: 4 неправильных файлов
Папка beresklet: 1 неправильных файлов
Папка biryuchina: 4 неправильных файлов
Папка boyaroshnik: 0 неправильных файлов
Папка brusnika: 3 неправильных файлов
Папка buzina: 4 неправильных файлов
Папка buzina_yad: 1 неправильных файлов
Папка cheremuha: 1 неправильных файлов
Папка chernika: 7 неправильных файлов
Папка ezevika: 0 неправильных файлов
Папка fitolakka: 5 неправильных файлов
Папка gimolost: 6 неправильных файлов
Папка gimolost_les: 5 неправильных файлов
Папка godgi: 2 неправильных файлов
Папка golubika: 2 неправильных файлов
Папка irga: 4 неправильных файлов
Папка kalina: 1 неправильных файлов
Папка klukva: 1 неправильных файлов
Папка kostyanika: 3 неправильных файлов
Папка krizovnik: 6 неправильных файлов
Папка krushina: 3 неправильных файлов
Папка kupena: 1 неправильных файлов
Папка landish: 3 неправильных файлов
Папка ma

In [2]:
# Проверка размерностей массивов
print("Размерности массивов:")
print("X_train:", X_train.shape)
print("y_train:", y_train.shape)
print("X_val:", X_test.shape)
print("y_val:", y_test.shape)

Размерности массивов:
X_train: (5360, 300, 300, 3)
y_train: (5360,)
X_val: (662, 300, 300, 3)
y_val: (662,)


In [4]:
import autokeras as ak
import pickle

clf = ak.ImageClassifier(
    max_trials=5,
    objective='val_accuracy',
    directory='berries',
    overwrite=True)

# Обучение с использованием валидационного набора
clf.fit(X_train, y_train_encoded, epochs=10, validation_data=(X_val, y_val_encoded), verbose=1)

# Сохранение label_encoder в файл
with open('label_encoder.pkl', 'wb') as le_file:
    pickle.dump(label_encoder, le_file)

# Сохранение словаря invalid_file_counts в файл
with open('invalid_file_counts.pkl', 'wb') as ifc_file:
    pickle.dump(invalid_file_counts, ifc_file)

# Сохранение лучшей модели
best_model = clf.export_model()
best_model.save('best_autokeras_model')
best_model.save('best_model3.h5')

Trial 5 Complete [01h 58m 12s]
val_accuracy: 0.899328887462616

Best val_accuracy So Far: 0.9244966506958008
Total elapsed time: 04h 55m 44s
Epoch 1/10
Not enough memory, reduce batch size to 16.
Epoch 1/10
Not enough memory, reduce batch size to 8.
Epoch 1/10
Not enough memory, reduce batch size to 4.
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10




INFO:tensorflow:Assets written to: berries\image_classifier\best_model\assets


INFO:tensorflow:Assets written to: berries\image_classifier\best_model\assets














































































































INFO:tensorflow:Assets written to: best_autokeras_model\assets


INFO:tensorflow:Assets written to: best_autokeras_model\assets


In [5]:
import pickle
from tensorflow.keras.models import load_model
import cv2
import numpy as np
import autokeras as ak

with open('label_encoder.pkl', 'rb') as le_file:
    label_encoder = pickle.load(le_file)

with open('invalid_file_counts.pkl', 'rb') as ifc_file:
    invalid_file_counts = pickle.load(ifc_file)

loaded_model = load_model('best_autokeras_model', custom_objects=ak.CUSTOM_OBJECTS)
loaded_model.summary()

Model: "model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_1 (InputLayer)        [(None, 300, 300, 3)]     0         
                                                                 
 cast_to_float32 (CastToFloa  (None, 300, 300, 3)      0         
 t32)                                                            
                                                                 
 normalization (Normalizatio  (None, 300, 300, 3)      7         
 n)                                                              
                                                                 
 random_translation (RandomT  (None, 300, 300, 3)      0         
 ranslation)                                                     
                                                                 
 random_flip (RandomFlip)    (None, 300, 300, 3)       0         
                                                             

In [6]:
# Преобразование строковых меток тестового набора в числовые
y_test_encoded = label_encoder.transform(y_test)

# Оценка производительности на тестовых данных
evaluation = clf.evaluate(X_test, y_test_encoded)
print("Test Accuracy:", evaluation[1])


Test Accuracy: 0.8882175087928772
