Практичне використання OpenCV: Завдання та Постановка

**Обсяг**: 1000 слів

OpenCV є потужною бібліотекою для обробки та аналізу зображень та відео. У цьому практичному завданні ми розглянемо можливості OpenCV та запропонуємо конкретне завдання для практичної роботи.

**Завдання**: Створення програми для визначення та підрахунку кількості об'єктів на зображенні.

**Постановка завдання**:

1. **Завантаження зображення**: Почніть з завантаження зображення. Ви можете використовувати будь-яке зображення за вашим вибором. Зображення може містити об'єкти різних розмірів та форм.

2. **Підготовка зображення**: Вам може знадобитися попередній аналіз та підготовка зображення, наприклад, конвертація до відтінків сірого, фільтрація та розмиття для видалення шуму.

3. **Виявлення контурів**: Використайте функцію `cv2.findContours` для виявлення контурів об'єктів на зображенні. Контур - це набір точок, які утворюють межі об'єктів.

4. **Фільтрація контурів**: Виберіть та фільтруйте контури залежно від їхнього розміру, форми або інших характеристик. Наприклад, ви можете відкинути дуже маленькі або надто великі контури.

5. **Підрахунок кількості об'єктів**: Після фільтрації контурів підрахуйте їхню кількість. Ця кількість буде відображати загальну кількість об'єктів на зображенні.

6. **Візуалізація результатів**: Візуалізуйте результати на зображенні, наприклад, виведіть межі та номери об'єктів.

7. **Збереження результатів**: Збережіть остаточне зображення з виділеними об'єктами та вказівкою на їхню кількість.

**Примітка**: Для виконання цього завдання вам буде потрібно мати встановлену бібліотеку OpenCV та базові знання роботи з Python.

Це практичне завдання дозволяє вам поглибити розуміння можливостей OpenCV та навички роботи з обробкою зображень. Ви можете експериментувати з параметрами та методами OpenCV для досягнення кращих результатів у визначенні та підрахунку об'єктів на зображенні.

Звісно, ось приклад коду на Python для виконання завдання з визначення та підрахунку кількості об'єктів на зображенні за допомогою OpenCV:

```python
import cv2
import numpy as np

# Завантаження зображення
image = cv2.imread('sample_image.jpg')

# Конвертація до відтінків сірого
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Фільтрація та розмиття для видалення шуму
blurred_image = cv2.GaussianBlur(gray_image, (5, 5), 0)

# Виявлення контурів
contours, _ = cv2.findContours(blurred_image, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# Ініціалізація лічильника об'єктів
object_count = 0

# Мінімальна площа об'єкту для фільтрації
min_object_area = 100

# Цикл по контурам
for contour in contours:
    # Підрахунок площі контуру
    area = cv2.contourArea(contour)
    
    # Фільтрація за площею
    if area > min_object_area:
        # Обчислення та відображення меж контуру
        cv2.drawContours(image, [contour], -1, (0, 255, 0), 2)
        
        # Збільшення лічильника об'єктів
        object_count += 1

# Відображення кількості об'єктів на зображенні
cv2.putText(image, f'Об\'єктів: {object_count}', (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 255), 2)

# Відображення оригінального та обробленого зображення
cv2.imshow('Original Image', image)
cv2.waitKey(0)
cv2.destroyAllWindows()
```

У цьому коді ми завантажуємо зображення та виконуємо підготовчі операції, такі як конвертація до відтінків сірого та фільтрація. Потім виявляємо контури та фільтруємо їх за площею, щоб визначити об'єкти. Знайдені об'єкти виділяються на зображенні, і кількість об'єктів відображається на зображенні.

Зверніть увагу, що ви можете налаштовувати параметри фільтрації та розмиття, а також встановлювати мінімальну площу об'єкту для фільтрації відповідно до вашого завдання.

**Практичне використання згорткових нейронних мереж (CNN)**

**Загальний обсяг**: 1000 слів

**Матеріал:**

Згорткові нейронні мережі (Convolutional Neural Networks, CNN) є потужним інструментом для обробки зображень та розпізнавання об'єктів. Вони здатні автоматично виділяти важливі ознаки зображень та виконувати класифікацію об'єктів на зображеннях. Основною ідеєю CNN є використання згорткових шарів для згортки зображень та пулінгу для зменшення розміру, а також повнозв'язаних шарів для класифікації.

**Постановка завдання:**

Ваше завдання - створити програму для класифікації об'єктів на зображеннях за допомогою згорткової нейронної мережі (CNN). Нижче наведено послідовність кроків для виконання завдання:

1. **Збір та підготовка даних**: Завантажте набір даних, який містить зображення об'єктів, що ви хочете класифікувати. Підготуйте дані, розділивши їх на навчальний та тестовий набори. Визначте класи об'єктів, які ви хочете класифікувати.

2. **Створення згорткової нейронної мережі**: Створіть архітектуру CNN, яка включає згорткові шари, шари пулінгу, повнозв'язані шари та шари активації. Налаштуйте параметри мережі, такі як кількість фільтрів, розмір ядра та функції активації.

3. **Компіляція та навчання моделі**: Компілюйте модель, обираючи функцію втрати та оптимізатор. Після цього навчіть модель на навчальному наборі даних. Використовуйте зображення з навчального набору для тренування та перевірки точності моделі.

4. **Оцінка моделі**: Визначте точність моделі на тестовому наборі даних. Це допоможе вам зрозуміти, наскільки добре модель класифікує об'єкти на нових зображеннях.

5. **Використання моделі**: Застосуйте навчену модель для класифікації об'єктів на нових зображеннях. Виведіть результати класифікації та відобразіть їх на зображенні.

6. **Візуалізація результатів**: Візуалізуйте результати, включаючи графіки точності та функції втрат під час навчання.

7. **Оптимізація та експерименти**: Спробуйте оптимізувати модель, змінюючи архітектуру, параметри навчання або використовуючи техніки, такі як перенос навчання (transfer learning) або аугментація даних.

8. **Завершення звіту**: Після завершення завдання створіть звіт, в якому ви опишете вашу модель, її точність та результати. Поясніть ваші кроки і рішення, прийняті під час роботи з завданням.

Це практичне завдання дозволить вам отримати практичний досвід роботи з згортковими нейронними мережами для класифікації об'єктів на зображеннях. Ви можете експериментувати з різними архітектурами мереж та параметрами для досягнення кращих результатів в класифікації.

Звісно, ось приклад коду на Python для виконання завдання з використанням згорткової нейронної мережі (CNN) для класифікації зображень за допомогою бібліотеки TensorFlow та фреймворку Keras. Для прикладу ми будемо використовувати набір даних CIFAR-10, який містить 60 000 зображень у 10 класах.

```python
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, datasets
import matplotlib.pyplot as plt

# Завантаження та підготовка даних
(train_images, train_labels), (test_images, test_labels) = datasets.cifar10.load_data()
train_images, test_images = train_images / 255.0, test_images / 255.0

# Створення згорткової нейронної мережі
model = keras.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10)
])

# Компіляція моделі
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# Навчання моделі
history = model.fit(train_images, train_labels, epochs=10,
                    validation_data=(test_images, test_labels))

# Оцінка моделі на тестових даних
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print(f'Точність на тестових даних: {test_acc*100:.2f}%')

# Візуалізація результатів навчання
plt.figure(figsize=(10, 4))
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Точність навчання')
plt.plot(history.history['val_accuracy'], label='Точність валідації')
plt.xlabel('Епохи')
plt.ylabel('Точність')
plt.legend()
plt.grid(True)

plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Функція втрати навчання')
plt.plot(history.history['val_loss'], label='Функція втрати валідації')
plt.xlabel('Епохи')
plt.ylabel('Функція втрати')
plt.legend()
plt.grid(True)

plt.show()
```

Цей код створює згорткову нейронну мережу (CNN) з декількома шарами згортки, пулінгу та повнозв'язаними шарами для класифікації зображень. Модель компілюється за допомогою функції втрат "SparseCategoricalCrossentropy" і оптимізатора "adam". Після навчання моделі візуалізуються результати та оцінюється її точність на тестових даних.

Зверніть увагу, що ви можете налаштовувати архітектуру мережі та параметри навчання відповідно до вашого завдання.