Transformer Implementation in PyTorch

This project implements a complete Transformer model from scratch using PyTorch, following the DataCamp tutorial "Building a Transformer with PyTorch".

Project Structure

transformer_pytorch/
├── transformer/
│   ├── __init__.py
│   ├── model.py          # Complete Transformer implementation
│   ├── attention.py      # Multi-Head Attention mechanism  
│   ├── feedforward.py    # Position-wise Feed-Forward Network
│   ├── positional.py     # Positional Encoding
│   ├── encoder.py        # Encoder Layer
│   └── decoder.py        # Decoder Layer
├── train.py              # Training script
├── demo.py               # Example usage
├── requirements.txt      # Dependencies
└── README.md            # This file

Features

Complete Transformer architecture implementation
Multi-Head Attention mechanism
Position-wise Feed-Forward Networks
Positional Encoding with sinusoidal functions
Encoder and Decoder blocks with residual connections
Layer normalization and dropout for regularization
Training loop with sample data
Model evaluation capabilities

Installation

pip install -r requirements.txt

Usage

Basic Training

python train.py

Demo

python demo.py

Model Architecture

The transformer consists of:

Multi-Head Attention: Captures dependencies across different positions
Feed-Forward Networks: Position-wise fully connected layers
Positional Encoding: Provides sequence order context
Layer Normalization: Stabilizes training
Residual Connections: Helps train deeper networks
Dropout: Prevents overfitting

Hyperparameters

Parameter	Default	Description
d_model	512	Model embedding dimension
num_heads	8	Number of attention heads
num_layers	6	Number of encoder/decoder layers
d_ff	2048	Feed-forward network dimension
dropout	0.1	Dropout rate
max_seq_length	100	Maximum sequence length

Based on

DataCamp Tutorial: "Building a Transformer with PyTorch"
Original Paper: "Attention is All You Need" (Vaswani et al., 2017)

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
transformer		transformer
tutorial_step_by_step		tutorial_step_by_step
.gitignore		.gitignore
README.md		README.md
TUTORIAL.md		TUTORIAL.md
demo.py		demo.py
requirements.txt		requirements.txt
test_components.py		test_components.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Transformer Implementation in PyTorch

Project Structure

Features

Installation

Usage

Basic Training

Demo

Model Architecture

Hyperparameters

Based on

About

Uh oh!

Releases

Packages

Languages

dueprincipati/transformer_pytorch

Folders and files

Latest commit

History

Repository files navigation

Transformer Implementation in PyTorch

Project Structure

Features

Installation

Usage

Basic Training

Demo

Model Architecture

Hyperparameters

Based on

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages