Video Mask Transfiner

Video Mask Transfiner for High-Quality Video Instance Segmentation [ECCV 2022]

Video Mask Transfiner for High-Quality Video Instance Segmentation,
Lei Ke, Henghui Ding, Martin Danelljan, Yu-Wing Tai, Chi-Keung Tang, Fisher Yu
ECCV 2022 (arXiv 2207.14012)

HQ-YTVIS: High-Quality Video Instance Segmentation Dataset

Mask annotation comparison between Youtube-VIS and HQ-YTVIS. HQ-YTVIS serves as a new benchmark to facilitate future development (training & evaluation) of VIS methods aiming at higher mask quality.

hq_ytvis_1.mp4

Mask annotations in Youtube-VIS (Left Video) vs. Mask annotations in HQ-YTVIS (Right Video). Please visit our Dataset Page for detailed descriptions of using HQ-YTVIS benchmark.

Dataset Download: HQ-YTVIS Annotation Link
Dataset Usage: replace our annotation json to original YTVIS annotation files.

HQ-YTVIS Evaluation API

Please refer to our Installation Guidance and Tube-Mask AP & Tube-Boundary AP Usage Example.

python eval_hqvis.py --save-path prediction_results.json

VMT Code (under construction)

Install

Please refer to INSTALL.md for installation instructions and dataset preparation.

Usages

Please refer to USAGE.md for dataset preparation and detailed running (including testing, visualization, etc.) instructions.

ytvis_result1.mp4

Model zoo on HQ-YTVIS model

Train on HQ-YTVIS train set and COCO, evaluate on HQ-YTVIS test set.

AP^B: Tube-Boundary AP (proposed in Eq.1 of the paper)

AP^M: Tube-Mask AP (proposed in YTVIS paper)

Model	AP^B	AP^B₇₅	AR^B₁	AP^M	AR^M₇₅	download
VMT_r50	30.7	24.2	31.5	50.5	54.5	weight
VMT_r101	33.0	29.3	33.3	51.6	55.8	weight
VMT_swin_L	44.8	43.4	43.0	64.8	70.1	weight

Citation

@inproceedings{vmt,
    title = {Video Mask Transfiner for High-Quality Video Instance Segmentation},
    author = {Ke, Lei and Ding, Henghui and Danelljan, Martin and Tai, Yu-Wing and Tang, Chi-Keung and Yu, Fisher},
    booktitle = {European Conference on Computer Vision (ECCV)},
    year = {2022}
}

@inproceedings{transfiner,
    title={Mask Transfiner for High-Quality Instance Segmentation},
    author={Ke, Lei and Danelljan, Martin and Li, Xia and Tai, Yu-Wing and Tang, Chi-Keung and Yu, Fisher},
    booktitle = {CVPR},
    year = {2022}
}

Acknowledgement

We thank Mask Transfiner and SeqFormer for their open source codes.

Name		Name	Last commit message	Last commit date
Latest commit History 48 Commits
cocoapi_hq		cocoapi_hq
datasets		datasets
figures		figures
models		models
models_swin		models_swin
scripts		scripts
tools		tools
util		util
INSTALL.md		INSTALL.md
LICENSE		LICENSE
README.md		README.md
USAGE.md		USAGE.md
__init__.py		__init__.py
eval_hqvis.py		eval_hqvis.py
requirements.txt		requirements.txt

License

SysCV/vmt

Folders and files

Latest commit

History

Repository files navigation

Video Mask Transfiner

HQ-YTVIS: High-Quality Video Instance Segmentation Dataset

HQ-YTVIS Evaluation API

VMT Code (under construction)

Install

Usages

Model zoo on HQ-YTVIS model

Citation

Acknowledgement

About

Resources

License

Stars

Watchers

Forks

Languages