https://chatbotslife.com/cnn-image-classification-using-cifar-10-dataset-on-google-colab-tpu-750da8cd8510

In [1]:
import tensorflow as tf
from tensorflow.keras import layers

# Загружаем датасет MNIST
mnist = tf.keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# Нормализуем значения пикселей в диапазоне от 0 до 1
train_images = train_images / 255.0
test_images = test_images / 255.0

# Определяем архитектуру нейронной сети
model = tf.keras.Sequential([
    layers.Flatten(input_shape=(28, 28)),
    layers.Dense(128, activation='relu'),
    layers.Dense(10)
])

# Компилируем модель
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# Обучаем модель на тренировочных данных
model.fit(train_images, train_labels, epochs=10)

# Оцениваем точность модели на тестовых данных
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)

print('\nТочность на тестовых данных:', test_acc)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
313/313 - 1s - loss: 0.0877 - accuracy: 0.9762 - 648ms/epoch - 2ms/step

Точность на тестовых данных: 0.9761999845504761


В этом примере мы используем полносвязную нейронную сеть с одним скрытым слоем из 128 нейронов и выходным слоем из 10 нейронов (по числу классов). Мы компилируем модель, используя оптимизатор Adam и функцию потерь SparseCategoricalCrossentropy. Затем мы обучаем модель на тренировочных данных и оцениваем ее точность на тестовых данных.

Этот код создает полносвязную нейронную сеть с одним скрытым слоем из 128 нейронов и выходным слоем из 10 нейронов (по числу классов).

Первый слой Flatten преобразует входные изображения (28x28 пикселей) в одномерный массив (размерность 784).

Затем мы добавляем полносвязный слой с 128 нейронами и функцией активации ReLU. Этот слой принимает на вход одномерный массив размерности 784 и выдает на выходе другой одномерный массив размерности 128.

Наконец, мы добавляем выходной слой с 10 нейронами, по числу классов в датасете MNIST. Этот слой не имеет функции активации, так как мы будем использовать функцию потерь SparseCategoricalCrossentropy, которая принимает на вход вероятности для каждого класса.

Таким образом, архитектура этой нейронной сети состоит из двух полносвязных слоев и не имеет сверточных слоев, так как мы работаем с одномерными массивами, а не с изображениями.

# Сверточная нейронная сеть для классификации изображений CIFAR-10:


In [2]:
import tensorflow as tf
from tensorflow.keras import layers

# Загружаем датасет CIFAR-10
cifar10 = tf.keras.datasets.cifar10
(train_images, train_labels), (test_images, test_labels) = cifar10.load_data()

# Нормализуем значения пикселей в диапазоне от 0 до 1
train_images = train_images / 255.0
test_images = test_images / 255.0

# Определяем архитектуру сверточной нейронной сети
model = tf.keras.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10)
])

# Компилируем модель
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# Обучаем модель на тренировочных данных
model.fit(train_images, train_labels, epochs=10)

# Оцениваем точность модели на тестовых данных
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)

print('\nТочность на тестовых данных:', test_acc)


Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10

KeyboardInterrupt: ignored

В этом примере мы используем сверточную нейронную сеть с тремя сверточными слоями и двумя полносвязными слоями. Мы компилируем модель, используя оптимизатор Adam и функцию потерь SparseCategoricalCrossentropy. Затем мы обучаем модель на тренировочных данных и оцениваем ее точность на тестовых данных.



In [None]:
model = tf.keras.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10)
])

Это определение архитектуры сверточной нейронной сети для классификации изображений CIFAR-10 в TensorFlow.

* layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)) - сверточный слой с 32 фильтрами размера (3, 3), функцией активации ReLU и входными данными размера (32, 32, 3).
* layers.MaxPooling2D((2, 2)) - слой подвыборки, который уменьшает размерность выходных данных в два раза.
* layers.Conv2D(64, (3, 3), activation='relu') - еще один сверточный слой с 64 фильтрами размера (3, 3) и функцией активации ReLU.
* layers.MaxPooling2D((2, 2)) - еще один слой подвыборки.
* layers.Conv2D(64, (3, 3), activation='relu') - еще один сверточный слой с 64 фильтрами размера (3, 3) и функцией активации ReLU.
* layers.Flatten() - преобразует многомерные данные в одномерный вектор.
* layers.Dense(64, activation='relu') - полносвязный слой с 64 нейронами и функцией активации ReLU.
* layers.Dense(10) - полносвязный слой с 10 нейронами, который выдает вероятности для каждого из 10 классов.

# 2. Сверточная нейронная сеть для распознавания рукописных цифр MNIST:

In [None]:
import tensorflow as tf
from tensorflow.keras import layers

# Загружаем датасет MNIST
mnist = tf.keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# Нормализуем значения пикселей в диапазоне от 0 до 1
train_images = train_images / 255.0
test_images = test_images / 255.0

# Определяем архитектуру сверточной нейронной сети
model = tf.keras.Sequential([
    layers.Reshape((28, 28, 1), input_shape=(28, 28)),
    layers.Conv2D(32, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10)
])

# Компилируем модель
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# Обучаем модель на тренировочных данных
model.fit(train_images, train_labels, epochs=10)

# Оцениваем точность модели на тестовых данных
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)

print('\nТочность на тестовых данных:', test_acc)


В этом примере мы используем сверточную нейронную сеть с двумя сверточными слоями и двумя полносвязными слоями. Мы компилируем модель, используя оптимизатор Adam и функцию пот

In [None]:
model = tf.keras.Sequential([
    layers.Reshape((28, 28, 1), input_shape=(28, 28)),
    layers.Conv2D(32, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Conv2D(64, (3, 3), activation='relu'),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(64, activation='relu'),
    layers.Dense(10)
])




Это определение архитектуры сверточной нейронной сети для распознавания рукописных цифр MNIST в Google Colab.

* layers.Reshape((28, 28, 1), input_shape=(28, 28)) - изменяет форму входных данных из (28, 28) в (28, 28, 1), чтобы они могли быть использованы сверточным слоем.
* layers.Conv2D(32, (3, 3), activation='relu') - сверточный слой с 32 фильтрами размера (3, 3) и функцией активации ReLU.
* layers.MaxPooling2D((2, 2)) - слой подвыборки, который уменьшает размерность выходных данных в два раза.
* layers.Conv2D(64, (3, 3), activation='relu') - еще один сверточный слой с 64 фильтрами размера (3, 3) и функцией активации ReLU.
* layers.MaxPooling2D((2, 2)) - еще один слой подвыборки.
layers.Flatten() - преобразует многомерные данные в одномерный вектор.
* layers.Dense(64, activation='relu') - полносвязный слой с 64 нейронами и функцией активации ReLU.
* layers.Dense(10) - полносвязный слой с 10 нейронами, который выдает вероятности для каждого из 10 классов.