<a href="https://colab.research.google.com/github/yukinaga/learning_transformer/blob/main/section_3/03_positionwise_feed_forward.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Position-wise Feed-Forward Networks
PyTorchを使い、「Position-wise Feed-Forward Networks」を実装します。

## PositionwiseFeedForwardクラス
論文「Attention Is All You Need」に基づき、Position-wise Feed-Forward Networksをクラスとして実装します。  
https://arxiv.org/abs/1706.03762


In [None]:
import torch
import torch.nn as nn

class PositionwiseFeedForward(nn.Module):
    def __init__(self, d_model, d_ff, dropout=0.1):
        """
        Args:
            d_model (int): The dimension of the model (also the input and output dimension).
            d_ff (int): The dimension of the feed-forward hidden layer.
            dropout (float): Dropout probability.
        """
        super(PositionwiseFeedForward, self).__init__()
        self.w_1 = nn.Linear(d_model, d_ff)
        self.w_2 = nn.Linear(d_ff, d_model)
        self.dropout = nn.Dropout(dropout)
        self.relu = nn.ReLU()

    def forward(self, x):
        """
        Args:
            x (Tensor): Input tensor, shape [batch_size, seq_len, d_model]

        Returns:
            Tensor: Output tensor, shape [batch_size, seq_len, d_model]
        """
        return self.w_2(self.dropout(self.relu(self.w_1(x))))

## PositionwiseFeedForwardクラスの使用
各設定を行い、PositionwiseFeedForwardクラスを使用します。

In [None]:
import torch

# ハイパーパラメータの設定
batch_size = 8
seq_len = 50
d_model = 512  # モデルの次元数
d_ff = 2048  # フィードフォワード隠れ層の次元数

# PositionwiseFeedForwardモジュールのインスタンス化
positionwise_ff = PositionwiseFeedForward(d_model, d_ff)

# ランダムなテンソルを生成
x = torch.randn(batch_size, seq_len, d_model)

# forwardメソッドを呼び出し
output = positionwise_ff(x)

# 出力の表示
print(output.size())  # 出力テンソルのサイズを表示: [batch_size, seq_len, d_model]

出力が計算されたことが確認できます。