<a href="https://colab.research.google.com/github/kokochka/veggies-classifier/blob/main/veg_classifier-notebook-1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [3]:
# @title Installing frameworks
!pip install tensorflow keras kaggle



In [4]:
# @title Находим kaggle.json
import os
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json


In [5]:
# @title Скачиваем папку с датасетом
from kaggle.api.kaggle_api_extended import KaggleApi

# Авторизация в Kaggle
api = KaggleApi()
api.authenticate()

# Скачивание датасета
dataset_path = 'vegetable-image-dataset'
api.dataset_download_files('misrakahmed/vegetable-image-dataset', path=dataset_path, unzip=True)


Dataset URL: https://www.kaggle.com/datasets/misrakahmed/vegetable-image-dataset


In [6]:
# @title Препроцессинг изображений + генератор данных
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Путь к директории с изображениями
base_dir = '/content/vegetable-image-dataset/Vegetable Images'

# Размеры изображений
img_height, img_width = 150, 150

# Подготовка генераторов данных
datagen = ImageDataGenerator(rescale=1./255, validation_split=0.2)

train_generator = datagen.flow_from_directory(
    '/content/vegetable-image-dataset/Vegetable Images/train',
    target_size=(img_height, img_width),
    batch_size=32,
    class_mode='categorical',
    subset='training'
)

validation_generator = datagen.flow_from_directory(
    '/content/vegetable-image-dataset/Vegetable Images/validation',
    target_size=(img_height, img_width),
    batch_size=32,
    class_mode='categorical',
    subset='validation'
)


test_generator = datagen.flow_from_directory(
     '/content/vegetable-image-dataset/Vegetable Images/test',
     target_size=(img_height, img_width),
     batch_size=32,
     class_mode='categorical'
 )


Found 12000 images belonging to 15 classes.
Found 600 images belonging to 15 classes.
Found 3000 images belonging to 15 classes.


Основные изменения:

Добавлены слои BatchNormalization после каждого сверточного слоя для нормализации выходов и ускорения обучения.
Включены дополнительные слои Dropout для предотвращения переобучения.
Добавлен еще один сверточный слой для более глубокого представления признаков.
В конце добавлен дополнительный полносвязный слой с BatchNormalization и Dropout для лучшего обобщения.
Такая архитектура должна помочь улучшить качество классификации, особенно при большом количестве данных.







# Построение нейросети

здесь два варианта: нижний - тот на котором уже есть готовая модель, обученная 30 раз;
верхняя - доработана 28.05

In [None]:
# @title Измененная и усложненная структура нейросети
from tensorflow.keras.models import Sequential
from tensorflow.keras.callbacks import ModelCheckpoint
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout, BatchNormalization

model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(img_height, img_width, 3)),
    BatchNormalization(),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),

    Conv2D(64, (3, 3), activation='relu'),
    BatchNormalization(),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),

    Conv2D(128, (3, 3), activation='relu'),
    BatchNormalization(),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),

    Conv2D(256, (3, 3), activation='relu'),
    BatchNormalization(),
    MaxPooling2D(pool_size=(2, 2)),
    Dropout(0.25),

    Flatten(),

    Dense(512, activation='relu'),
    BatchNormalization(),
    Dropout(0.5),

    Dense(256, activation='relu'),
    BatchNormalization(),
    Dropout(0.5),

    Dense(15, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])


In [None]:
# @title Первый вариант нейросети - на нем натренирована модель
from tensorflow.keras.models import Sequential
from tensorflow.keras.callbacks import ModelCheckpoint
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

model = Sequential([
    Conv2D(32, (3, 3), activation='relu', input_shape=(img_height, img_width, 3)),
    MaxPooling2D(pool_size=(2, 2)),
    Conv2D(64, (3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Conv2D(128, (3, 3), activation='relu'),
    MaxPooling2D(pool_size=(2, 2)),
    Flatten(),
    Dense(512, activation='relu'),
    Dropout(0.5),
    Dense(15, activation='softmax')
])

model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])


# Тренирование модели

Было задано 30 эпох и сохранение модели после каждой эпохи

In [None]:
# @title Вызываем сохранение модели в тренировке после каждой эпохи

checkpoint_cb = ModelCheckpoint(
    'vegetable_classifier_epoch_{epoch:02d}_val_acc_{val_accuracy:.2f}.h5',
    save_best_only=False,
    save_weights_only=False,
    save_freq='epoch'
)


In [None]:
# @title Тренируем модель, задано 35 эпох
history = model.fit(
    train_generator,
    steps_per_epoch=train_generator.samples // train_generator.batch_size,
    validation_data=validation_generator,
    validation_steps=validation_generator.samples // validation_generator.batch_size,
    epochs=35,
    callbacks=[checkpoint_cb]  # викликаємо збереження моделі після кожної епохи
)

# оцінка моделі протягом навчання
test_loss, test_acc = model.evaluate(validation_generator, verbose=2)
print(f'\nTest accuracy: {test_acc}')



Epoch 1/35

  saving_api.save_model(


Epoch 2/35
Epoch 3/35
Epoch 4/35
Epoch 5/35
Epoch 6/35
Epoch 7/35
Epoch 8/35
Epoch 9/35
Epoch 10/35
Epoch 11/35
Epoch 12/35
Epoch 13/35
Epoch 14/35
Epoch 15/35
Epoch 16/35
Epoch 17/35
Epoch 18/35
Epoch 19/35
Epoch 20/35
Epoch 21/35
Epoch 22/35
Epoch 23/35
Epoch 24/35
Epoch 25/35
Epoch 26/35
Epoch 27/35
Epoch 28/35
Epoch 29/35
Epoch 30/35
Epoch 31/35
Epoch 32/35
Epoch 33/35
Epoch 34/35

In [None]:
# @title Сохраняем готовую модель если успешно прошло 35 эпох

model.save('vegetable_classifier_model.h5')


In [None]:
# @title Тестирование полученной модели на предзагруженой картинке

import numpy as np
from tensorflow.keras.preprocessing import image

def predict_image(img_path):
    img = image.load_img(img_path, target_size=(img_height, img_width))
    img_array = image.img_to_array(img) / 255.0
    img_array = np.expand_dims(img_array, axis=0)

    prediction = model.predict(img_array)
    predicted_class = np.argmax(prediction, axis=1)
    class_labels = {v: k for k, v in train_generator.class_indices.items()}

    return class_labels[predicted_class[0]]

# Пример использования
img_path = '/content/cucumber.jpeg'  # Замените на путь к вашему изображению
print(predict_image(img_path))
