In [1]:
import tensorflow as tf
from tensorflow.keras.layers import MaxPooling2D,Dense,Flatten,Conv2D
from tensorflow.keras.models import Sequential


## نگاهی عمیق تر به لایه ها


#### دسترسی به وزن های لایه ها


In [4]:
base_model = tf.keras.applications.ResNet50V2(weights= 'imagenet',
                                         input_shape = (150,150,3),
                                         include_top = False)

AttributeError: module 'h5py' has no attribute 'File'

### لایه های lambda

### ساخت لایه های اختصاصی


برای ساخت یک لایه کراس سه تابع را باید در زمان ایجاد کلاس این لایه پیاده سازی کنیم:

1. یک تابع که وزن های قابل آموزش مدل را تعریف می کند. (تابع build)

2. یک تابع که منطق لایه را مشخص می کند (تابع call)

3. و در نهایت یک تابع که ابعاد خروجی را محاسبه و تعیین می کند.

لایه های تعریف شده باید از کلاس tf.keras.layers.Layers به ارث برده شده باشند.

### پیاده سازی لایه  Noisy Relu

In [12]:
class NoisyRelu(tf.keras.layers.Layer):
    def __init__(self,**kwargs):
        super(NoisyRelu,self).__init__(**kwargs)

    

اگر به تعریف تابع فعال سازی noisy relu دقت کرده باشید می بینید که این لایه هیچ پارامتر آموزش پذیری ندارد. برای همین نیازی به تابع build نداریم.



In [13]:
def call(self,x):
    tf.maximum(0, x + tf.random.normal())

In [14]:
def compute_output_shape(self,input_shape):
    return input_shape

In [25]:
tf.random.normal(shape = (1,1))

<tf.Tensor: shape=(1, 1), dtype=float32, numpy=array([[0.16257451]], dtype=float32)>

حالا می توانیم همه این ها را کنار هم قرار دهیم.

In [30]:
class NoisyRelu(tf.keras.layers.Layer):
    def __init__(self,**kwargs):
        super(NoisyRelu,self).__init__(**kwargs)
    def call(self,x):
        return tf.maximum(0.0, x + tf.random.normal(shape = (1,1)))
    def compute_output_shape(self,input_shape):
        return input_shape

#### آموزش و امتحان لایه جدید ساخته شده

In [34]:
model = Sequential()
model.add(Conv2D(filters = 15,kernel_size=3, input_shape = (28,28,1)))
model.add(NoisyRelu())
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Flatten())
model.add(Dense(100,activation='relu'))
model.add(Dense(10,activation='softmax'))

In [35]:
model.summary()

Model: "sequential_6"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_6 (Conv2D)            (None, 26, 26, 15)        150       
_________________________________________________________________
noisy_relu_6 (NoisyRelu)     (None, 26, 26, 15)        0         
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 13, 13, 15)        0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 2535)              0         
_________________________________________________________________
dense (Dense)                (None, 100)               253600    
_________________________________________________________________
dense_1 (Dense)              (None, 10)                1010      
Total params: 254,760
Trainable params: 254,760
Non-trainable params: 0
________________________________________________

### پیاده سازی لایه Attention

حالا نوبت این است که تابع build را تعریف کنیم.



In [None]:
def build(self,input_shape):
    self.

In [None]:
class ScaledDotProductAttention(Layer):
    """
        Implementation according to:
            "Attention is all you need" by A Vaswani, N Shazeer, N Parmar (2017)
    """

    def __init__(self, return_attention=False, **kwargs):    
        self._return_attention = return_attention
        self.supports_masking = True
        super(ScaledDotProductAttention, self).__init__(**kwargs)
    
    def compute_output_shape(self, input_shape):
        self._validate_input_shape(input_shape)

        if not self._return_attention:
            return input_shape[-1]
        else:
            return [input_shape[-1], [input_shape[0][0], input_shape[0][1], input_shape[1][2]]]
    
    def _validate_input_shape(self, input_shape):
        if len(input_shape) != 3:
            raise ValueError("Layer received an input shape {0} but expected three inputs (Q, V, K).".format(input_shape))
        else:
            if input_shape[0][0] != input_shape[1][0] or input_shape[1][0] != input_shape[2][0]:
                raise ValueError("All three inputs (Q, V, K) have to have the same batch size; received batch sizes: {0}, {1}, {2}".format(input_shape[0][0], input_shape[1][0], input_shape[2][0]))
            if input_shape[0][1] != input_shape[1][1] or input_shape[1][1] != input_shape[2][1]:
                raise ValueError("All three inputs (Q, V, K) have to have the same length; received lengths: {0}, {1}, {2}".format(input_shape[0][0], input_shape[1][0], input_shape[2][0]))
            if input_shape[0][2] != input_shape[1][2]:
                raise ValueError("Input shapes of Q {0} and V {1} do not match.".format(input_shape[0], input_shape[1]))
    
    def build(self, input_shape):
        self._validate_input_shape(input_shape)
        
        super(ScaledDotProductAttention, self).build(input_shape)
    
    def call(self, x, mask=None):
        q, k, v = x
        d_k = q.shape.as_list()[2]

        # in pure tensorflow:
        # weights = tf.matmul(x_batch, tf.transpose(y_batch, perm=[0, 2, 1]))
        # normalized_weights = tf.nn.softmax(weights/scaling)
        # output = tf.matmul(normalized_weights, x_batch)
        
        weights = K.batch_dot(q,  k, axes=[2, 2])

        if mask is not None:
            # add mask weights
            if isinstance(mask, (list, tuple)):
                if len(mask) > 0:
                    raise ValueError("mask can only be a Tensor or a list of length 1 containing a tensor.")

                mask = mask[0]

            weights += -1e10*(1-mask)

        normalized_weights = K.softmax(weights / np.sqrt(d_k))
        output = K.batch_dot(normalized_weights, v)
        
        if self._return_attention:
            return [output, normalized_weights]
        else:
            return output

### منابع

https://github.com/zimmerrol/keras-utility-layer-collection/blob/master/kulc/layer_normalization.py
https://github.com/zimmerrol/keras-utility-layer-collection
    https://github.com/Zelgunn/CustomKerasLayers