In [1]:
import torch.nn as nn

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
class ScaledEmbedding(nn.Embedding):
    """
    Embedding layer that initialises its values
    to using a normal variable scaled by the inverse
    of the embedding dimension.
    """

    def reset_parameters(self):
        """
        Initialize parameters.
        """

        self.weight.data.normal_(0, 1.0 / self.embedding_dim)
        if self.padding_idx is not None:
            self.weight.data[self.padding_idx].fill_(0)

In [5]:
import torch
import torch.nn as nn

# Assuming A and B are instances of ScaledEmbedding
# (Make sure you have the ScaledEmbedding class defined in your code)

# Instantiate two ScaledEmbedding instances
embedding_dim = 100  # Replace with the desired embedding dimension
vocab_size = 1000    # Replace with the desired vocabulary size

A = ScaledEmbedding(vocab_size, embedding_dim)
B = ScaledEmbedding(vocab_size, embedding_dim)

# Assuming you have input indices for the embeddings
input_indices = torch.LongTensor([1, 2, 3, 4])

# Forward pass through the embeddings
embedded_A = A(input_indices)
embedded_B = B(input_indices)

# Multiply the embeddings (matrix multiplication)
result = torch.matmul(embedded_A, embedded_B.t())  # .t() transposes the B matrix

# Print the result
print(result.shape)


torch.Size([4, 4])


In [21]:
class ZeroEmbedding(nn.Embedding):
    """
    Embedding layer that initialises its values
    to zero.

    Used for biases.
    """

    def reset_parameters(self):
        """
        Initialize parameters.
        """

        self.weight.data.zero_()
        if self.padding_idx is not None:
            self.weight.data[self.padding_idx].fill_(0)

In [22]:
B = ZeroEmbedding(100,100)

In [25]:
R = B(input_indices)
R

tensor([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
         0., 0., 0., 0.],
        [0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
   