Generalized Consistency Trajectory Models

Official PyTorch implementation of Generalized Consistency Trajectory Models for Image Manipulation by Beomsu Kim*, Jaemin Kim*, Jeongsol Kim, and Jong Chul Ye (*Equal contribution).

Diffusion models suffer from two limitations.

They require large number of function evaluations (NFEs) to generate high-fidelity images.
They only enable noise-to-image generation.

We propose the Generalized Consistency Trajectory Model (GCTM), which learns the probability flow ODE (PFODE) between arbitrary distributions via Flow Matching theory. Thus, GCTMs are capable of

Noise-to-image and image-to-image translation,
Score or velocity evaluation with NFE = 1,
Traversal between arbitrary points of the PFODE with NFE = 1.

Consequently, GCTMs are applicable to a wide variety of tasks, such as but not limited to

Unconditional generation
Image-to-image translation
Zero-shot and supervised image restoration
Image editing
Latent manipulation

Unconditional Generation

Image-to-Image Translation

Zero-shot and Supervised Image Restoration

Image Editing

Latent Manipulation

Environment

CUDA version 12.0
NVCC version 11.5.119
Python version 3.11.5
PyTorch version 2.0.1+cu118
Torchvision version 0.15.2+cu118
Torchaudio version 2.0.2+cu118

Datasets

CIFAR10 : https://www.cs.toronto.edu/~kriz/cifar.html
FFHQ : https://github.com/NVlabs/ffhq-dataset
Image-to-Image : https://efrosgans.eecs.berkeley.edu/pix2pix/datasets/

Training

Use train_gctm.py to train unconditional and image-to-image models, and use train_gctm_inverse.py to train supervised image restoration models. To train unconditional or image-to-image models, one first needs to create a FID_stats directory and save the Inception activation statistics in the format (dataset name)_(resolution).npz. Inception activation statistics can be computed using save_fid_stats function in ./pytorch_fid/fid_score.py. Or, you can just comment out FID evaluation lines in the training code.

Example training scripts are provided in the ./configs directory. For instance, to train a CIFAR10 unconditional model with independent coupling, one may use the command

sh ./configs/unconditional/cifar10.sh

References

If you find this paper useful for your research, please consider citing

@article{
  kim2024gctm,
  title={Generalized Consistency Trajectory Models for Image Manipulation},
  author={Beomsu Kim and Jaemin Kim and Jeongsol Kim and Jong Chul Ye},
  journal={arXiv preprint arXiv:2403.12510},
  year={2024}
}

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
assets		assets
configs		configs
corruption		corruption
dnnlib		dnnlib
pytorch_fid		pytorch_fid
torch_utils		torch_utils
LICENSE		LICENSE
README.md		README.md
averagemeter.py		averagemeter.py
couplings.py		couplings.py
data.py		data.py
discretizations.py		discretizations.py
distances.py		distances.py
networks.py		networks.py
solvers.py		solvers.py
train_gctm.py		train_gctm.py
train_gctm_inverse.py		train_gctm_inverse.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Generalized Consistency Trajectory Models

Unconditional Generation

Image-to-Image Translation

Zero-shot and Supervised Image Restoration

Image Editing

Latent Manipulation

Environment

Datasets

Training

References

About

Releases

Packages

Languages

License

1202kbs/GCTM

Folders and files

Latest commit

History

Repository files navigation

Generalized Consistency Trajectory Models

Unconditional Generation

Image-to-Image Translation

Zero-shot and Supervised Image Restoration

Image Editing

Latent Manipulation

Environment

Datasets

Training

References

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages