In [18]:
# https://www.youtube.com/watch?v=WAciKiDP2bo&list=PLhhyoLH6IjfxVOdVC1P1L5z5azs0XjMsb&index=5 

import tensorflow as tf
from tensorflow import keras 
from tensorflow.keras import layers
from keras import datasets






In [19]:
(x_train, y_train), (x_test, y_test) = datasets.cifar10.load_data()
(x_train) = x_train.astype('float32') /255.0 # float32 для лекшого обчислення 
x_test = x_test.astype("float32") / 255.0


In [21]:
model = keras.Sequential(
    [
        keras.Input(shape=(32,32,3)),
        layers.Conv2D(32,3, padding='valid', activation='relu'), # padding Вказує, чи потрібно додавати відступи. 'valid': без додавання відступів, розмір зменшується. 'same': відступи додаються так, щоб розмір залишився таким самим.
        #filters
        # Опис: Кількість фільтрів (ядер згортки), які використовуються у шарі. Це також визначає кількість каналів у вихідному зображенні.
        # Тип: Ціле число.
        # Приклад: filters=32 (буде 32 фільтри).
        
        # kernel_size
        # Опис: Розмір фільтра (ядра згортки). Зазвичай це квадратна матриця, наприклад, 3x3 або 5x5.
        # Тип: Одне число (розмір однаковий по висоті й ширині) або кортеж з двох чисел (height, width).
        # Приклад:
        # kernel_size=3 (фільтр 3x3).
        # kernel_size=(3, 5) (фільтр 3x5).
        
        
        # strides
        # Опис: Крок переміщення фільтра по ширині й висоті.
        # Тип: Одне число або кортеж з двох чисел (height_stride, width_stride).
        # За замовчуванням: (1, 1) (фільтр переміщується на 1 піксель).
        # Приклад:
        # strides=2 (переміщення на 2 пікселі).
        # strides=(2, 3) (переміщення на 2 пікселі по висоті та 3 пікселі по ширині).

        # padding
        # Опис: Визначає, як обробляти краї зображення.
        # 'valid': без відступів. Розмір виходу зменшується.
        # 'same': додаються відступи, щоб зберегти той самий розмір вхідних і вихідних даних.
        # Тип: Строка.
        # За замовчуванням: 'valid'.
        # Приклад: padding='same'.
        
        # activation
        # Опис: Функція активації, яка застосовується до виходу шару.
        # Тип: Строка або викликаєма функція.
        # Приклад:
        # activation='relu' (Rectified Linear Unit).
        # activation='sigmoid'.
        
        # use_bias
        # Опис: Вказує, чи додавати зсув (bias) до результату згортки.
        # Тип: Булеве значення.
        # За замовчуванням: True.
        # Приклад: use_bias=False.
        
        # kernel_initializer
        # Опис: Визначає, як ініціалізувати початкові значення фільтрів.
        # Тип: Строка або викликаєма функція.
        # За замовчуванням: 'glorot_uniform'.
        # Приклад:
        # kernel_initializer='he_normal'.
        # kernel_initializer=tf.keras.initializers.RandomNormal(mean=0.0, stddev=0.05).

        #bias_initializer
        #Опис: Визначає, як ініціалізувати початкові значення зсуву (bias).
        #Тип: Строка або викликаєма функція.
        #За замовчуванням: 'zeros'.
        #Приклад: bias_initializer='ones'.

        #kernel_regularizer
        #Опис: Регуляризація для фільтрів, щоб уникнути перенавчання.
        #Тип: Об'єкт регуляризації.
        #Приклад:
        #kernel_regularizer=tf.keras.regularizers.L2(0.01).

        #bias_regularizer
        #Опис: Регуляризація для зсуву (bias).
        #Тип: Об'єкт регуляризації.
        #Приклад: bias_regularizer=tf.keras.regularizers.L2(0.01).

        #activity_regularizer
        #Опис: Регуляризація для виходу шару.
        #Тип: Об'єкт регуляризації.
        #Приклад: activity_regularizer=tf.keras.regularizers.L1(0.01).

        #input_shape
        #Опис: Розмір вхідних даних для першого шару моделі.
        #Тип: Кортеж (height, width, channels).
        #Приклад:
        #input_shape=(28, 28, 1) (зображення 28x28 з 1 каналом).

        
        layers.MaxPooling2D(pool_size=(2,2)),# pool_size 2,2 дефолтне strides=(2, 2)  переміщується на 2 пікселі по ширині та висоті.  Крок переміщення підвікна  Якщо strides не задано, воно автоматично дорівнює pool_size
        layers.Conv2D(64,3,activation='relu'),
        layers.MaxPooling2D(),
        layers.Conv2D(128, 3, activation='relu'),
        layers.Flatten(),
        layers.Dense(64, activation='relu'),
        layers.Dense(10)
    ]
) 
print(model.summary())

model.compile(
    loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True), 
    optimizer=keras.optimizers.Adam(lr=3e-4),
    metrics=['accuracy'],    
)

model.fit(x_train,y_train, batch_size=24,epochs=10,verbose=1)
model.evaluate(x_test,y_test, batch_size=100,verbose=1)


Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_29 (Conv2D)          (None, 30, 30, 32)        896       
                                                                 
 max_pooling2d_14 (MaxPoolin  (None, 15, 15, 32)       0         
 g2D)                                                            
                                                                 
 conv2d_30 (Conv2D)          (None, 13, 13, 64)        18496     
                                                                 
 max_pooling2d_15 (MaxPoolin  (None, 6, 6, 64)         0         
 g2D)                                                            
                                                                 
 conv2d_31 (Conv2D)          (None, 4, 4, 128)         73856     
                                                                 
 flatten_8 (Flatten)         (None, 2048)             

KeyboardInterrupt: 

In [9]:
def my_model():
    inputs = keras.Input(shape=(32,32,3))
    x = layers.Conv2D(32,3)(inputs)
    x = layers.BatchNormalization()(x)
    x = keras.activations.relu(x)
    x = layers.MaxPooling2D()(x)
    x = layers.Conv2D(64,5,padding='same')(x)
    x = layers.BatchNormalization()(x)
    x = keras.activations.relu(x)
    x = layers.Conv2D(128,3)(x)
    x = layers.BatchNormalization()(x)
    x = keras.activations.relu(x)
    x = layers.Flatten()(x)
    x = layers.Dense(64,activation='relu')(x)
    outputs = layers.Dense(10)(x)
    model = keras.Model(inputs = inputs,outputs = outputs)
    return model

model = my_model()
    
    
    
    
print(model.summary())

model.compile(
    loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True), 
    optimizer=keras.optimizers.Adam(lr=3e-4),
    metrics=['accuracy'],    
)

model.fit(x_train,y_train, batch_size=24,epochs=10,verbose=1)
model.evaluate(x_test,y_test, batch_size=100,verbose=1)

Model: "model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_6 (InputLayer)        [(None, 32, 32, 3)]       0         
                                                                 
 conv2d_7 (Conv2D)           (None, 30, 30, 32)        896       
                                                                 
 batch_normalization_4 (Batc  (None, 30, 30, 32)       128       
 hNormalization)                                                 
                                                                 
 tf.nn.relu_4 (TFOpLambda)   (None, 30, 30, 32)        0         
                                                                 
 max_pooling2d_5 (MaxPooling  (None, 15, 15, 32)       0         
 2D)                                                             
                                                                 
 conv2d_8 (Conv2D)           (None, 15, 15, 64)        51264 

  super().__init__(name, **kwargs)


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


[1.1432139873504639, 0.6977999806404114]

In [None]:
# додаю регуляризацію
from tensorflow.keras import regularizers
(x_train, y_train), (x_test, y_test) = datasets.cifar10.load_data()
(x_train) = x_train.astype('float32') /255.0 # float32 для лекшого обчислення 
x_test = x_test.astype("float32") / 255.0


def my_model():
    inputs = keras.Input(shape=(32,32,3))
    
    x = layers.Conv2D(32,3, padding='same',kernel_regularizer=regularizers.l2(0.01))(inputs)
    x = layers.BatchNormalization()(x)
    x = keras.activations.relu(x)
    x = layers.MaxPooling2D()(x)
    
    x = layers.Conv2D(64,3,padding='same',kernel_regularizer=regularizers.l2(0.01))(x)
    x = layers.BatchNormalization()(x)
    x = keras.activations.relu(x)
    x = layers.MaxPooling2D()(x)

    x = layers.Conv2D(128,3,padding='same',kernel_regularizer=regularizers.l2(0.01))(x)
    x = layers.BatchNormalization()(x)
    x = keras.activations.relu(x)
    
    x = layers.Flatten()(x)
    x = layers.Dense( 64,activation='relu',kernel_regularizer=regularizers.l2(0.01))(x)
    x = layers.Dropout(0.5)(x)
    outputs = layers.Dense(10)(x)
    model = keras.Model(inputs = inputs,outputs = outputs)
    return model



model = my_model()
    
    
    
    
print(model.summary())

model.compile(
    loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True), 
    optimizer=keras.optimizers.Adam(lr=3e-4),
    metrics=['accuracy'],    
)

model.fit(x_train, y_train, batch_size=64,epochs=150,verbose=1)
model.evaluate(x_test,y_test, batch_size=100,verbose=1)

InternalError: Failed copying input tensor from /job:localhost/replica:0/task:0/device:CPU:0 to /job:localhost/replica:0/task:0/device:GPU:0 in order to run _EagerConst: Dst tensor is not initialized.

In [32]:
import tensorflow as tf
print("GPU Available:", tf.config.list_physical_devices('GPU'))
x_train = tf.convert_to_tensor(x_train, dtype=tf.float32)
y_train = tf.convert_to_tensor(y_train, dtype=tf.int32)
x_train = x_train.astype('float32') / 255.0  # Нормалізація зображень
y_train = y_train.astype('int32')
tf.config.set_visible_devices(tf.config.list_physical_devices('GPU')[0], 'GPU')



with tf.device('/GPU:0'):
    model.fit(x_train, y_train, batch_size=64, epochs=150, verbose=1)


GPU Available: [PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]


InternalError: Failed copying input tensor from /job:localhost/replica:0/task:0/device:CPU:0 to /job:localhost/replica:0/task:0/device:GPU:0 in order to run _EagerConst: Dst tensor is not initialized.