UniCast: A Unified Multimodal Prompting Framework for Time Series Forecasting

Implementation of multimodal time-series forecasting framework in UniCast: A Unified Multimodal Prompting Framework for Time Series Forecasting

Sehyuk Park¹, Soyeon Caren Han^{1, 2} Eduard Hovy²

¹ Pohang University of Science and Technology ² The University of Melbourne

¹ percy212@postech.ac.kr, drcarenhan@postech.ac.kr ² caren.han@unimelb.edu.au, eduard.hovy@unimelb.edu.au

Requirements

This project leverages two Time-Series Foundation Models: Timer and Chronos.
Each model requires a separate Python environment:

Timer: python==3.10.16
Chronos: python==3.11.11

Other dependencies can be installed from the corresponding requirements.txt file for each model.

Environment Setup

Timer:

conda create -n timer python=3.10.16
conda activate timer
pip install -r requirements/timer_requirements.txt

Chronos:

conda create -n chronos python=3.11.11
conda activate chronos
pip install -r requirements/chronos_requirements.txt

Dataset Preparation

We use a subset of the evaluation dataset from Chronos.

All CSV files are stored in the csv/ folder.
The dataset/ folder contains a create_dataset.py script for each dataset.

For converting time-series data into images, we follow the plotting approach used in ViTST.

To generate the datasets, simply run:

cd dataset
bash create_dataset.sh

Pretrained Models

UniCast utilizes:

Time-Series Models: Timer, Chronos
Vision Encoders: CLIP, BLIP
Text Encoders: Qwen, LLaMA

Each model requires its corresponding pretrained configuration and weights.
For each model, a save_pretrained_model.py script is provided in its respective folder.

To download and save all pretrained models, simply run:

cd models
bash save_pretrained_model.sh

Run

For each TSFM, separate shell scripts are provided for training and testing.
These scripts are configured to iterate over different combinations of vision encoders and text encoders.

To train:

# For Timer
bash train_multi_modal_timer.sh

# For Chronos
bash train_multi_modal_chronos.sh

To evaluate:

# For Timer
bash test_multi_modal_timer.sh

# For Chronos
bash test_multi_modal_chronos.sh

Evaluation Results

When compared with six baseline models, UniCast achieved better performance in a parameter-efficient manner while keeping the backbone frozen. Incorporating either visual or textual context improves performance over the time-series-only model, while combining both modalities consistently yields the best results.

Qualitative Analysis

The figure compares four configurations: TSFM Zero-Shot, TSFM with Prompt Tuning, TSFM with Vision Encoder, and TSFM with both Vision and Text Encoders. It shows that adding more modalities enables the model to capture patterns more effectively.

Citation

If you find our UniCast framework helpful, we would appreciate it if you could cite our paper.

@misc{park2025unicastunifiedmultimodalprompting,
      title={UniCast: A Unified Multimodal Prompting Framework for Time Series Forecasting}, 
      author={Sehyuk Park and Soyeon Caren Han and Eduard Hovy},
      year={2025},
      eprint={2508.11954},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2508.11954}, 
}

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
csv		csv
dataset		dataset
figures		figures
models		models
requirements		requirements
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
test_multi_modal_chronos.py		test_multi_modal_chronos.py
test_multi_modal_chronos.sh		test_multi_modal_chronos.sh
test_multi_modal_timer.py		test_multi_modal_timer.py
test_multi_modal_timer.sh		test_multi_modal_timer.sh
train_multi_modal_chronos.py		train_multi_modal_chronos.py
train_multi_modal_chronos.sh		train_multi_modal_chronos.sh
train_multi_modal_timer.py		train_multi_modal_timer.py
train_multi_modal_timer.sh		train_multi_modal_timer.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

UniCast: A Unified Multimodal Prompting Framework for Time Series Forecasting

Requirements

Environment Setup

Dataset Preparation

Pretrained Models

Run

Evaluation Results

Qualitative Analysis

Citation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

adlnlp/unicast

Folders and files

Latest commit

History

Repository files navigation

UniCast: A Unified Multimodal Prompting Framework for Time Series Forecasting

Requirements

Environment Setup

Dataset Preparation

Pretrained Models

Run

Evaluation Results

Qualitative Analysis

Citation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages