MaXTron: Mask Transformer with Trajectory Attention for Video Panoptic Segmentation

This repo contains the code for our paper MaXTron: Mask Transformer with Trajectory Attention for Video Panoptic Segmentation

MaXTron is a simple yet effective unified meta-architecture for video segmentation, which enriches existing clip-level segmenters by introducing a within-clip tracking module and a cross-clip tracking module, thus achieving better temporally consistent segmentation results.

Getting Started

For detailed usage of MaXTron, see

MaXTron w/ Video-kMaX

MaXTron w/ Tube-Link

Demos

Citing MaXTron

If you use MaXTron in your research, please use the following BibTeX entry.

@misc{he2023maxtron,
      title={MaXTron: Mask Transformer with Trajectory Attention for Video Panoptic Segmentation}, 
      author={Ju He and Qihang Yu and Inkyu Shin and Xueqing Deng and Xiaohui Shen and Alan Yuille and Liang-Chieh Chen},
      year={2023},
      eprint={2311.18537},
      archivePrefix={arXiv},
      primaryClass={cs.CV}
}

Acknowledgement

kMaX-DeepLab

Tube-Link

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
MaXTron_Tube-Link		MaXTron_Tube-Link
MaXTron_Video-kMaX		MaXTron_Video-kMaX
imgs		imgs
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MaXTron: Mask Transformer with Trajectory Attention for Video Panoptic Segmentation

Getting Started

Demos

Citing MaXTron

Acknowledgement

About

Releases

Packages

Languages

License

TACJu/Axial-VS

Folders and files

Latest commit

History

Repository files navigation

MaXTron: Mask Transformer with Trajectory Attention for Video Panoptic Segmentation

Getting Started

Demos

Citing MaXTron

Acknowledgement

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages