Three-Modality Molecular Representation Learning Combined with Multi-Task Optimization for Enhanced Molecular Property Prediction

Install environment

1. create a new conda environment

conda env create -f env.yaml

conda activate MolTriFusion

Pretraining

1. preparing dataset

Download data

MPP

CYP450

SARS-CoV-2

put it into ./data_process/data/

Training dataset for contrastive learning images ,put it into ./data/images/

Train

Training Smiles with Mamba Model

python train_smiles_mamba.py

Train data using a 6-layer GCN model

You can train the GCN_train.py by using the following command:

python GCN_train.py --datasetname ${datasetname} \
                   --csv_path ${csv_path}

For example:

python GCN_train.py --datasetname BBBP \
                   --csv_path data_process/data/BBBP/processed/BBBP_processed_ac.csv

Comparative learning

First, place the pretrained dataset(images) for contrastive learning in the ./data/image directory

and

You can train the contrast.py by using the following command:

python contrast.py --datasetname ${datasetname} \
                   --csv_path ${csv_path}

For example:

python contrast.py --datasetname BBBP \
                   --csv_path data_process/data/BBBP/processed/BBBP_processed_ac.csv

Finetuning

1. Download pre-trained model

You can download pre-trained model and push it into the folder ckpts/

2. Finetune with pre-trained model

You can run finetune by simply using the following code:

python finetune.py --gpu ${gpu_no} \
                   --save_finetune_ckpt ${save_finetune_ckpt} \
                   --log_dir ${log_dir} \
                   --dataroot ${dataroot} \
                   --dataset ${dataset} \
                   --task_type ${task_type} \
                   --resume ${resume} \
                   --image_aug \
                   --lr ${lr} \
                   --batch ${batch} \
                   --epochs ${epoch}

For example:

python finetune.py --gpu 0 \
                   --save_finetune_ckpt 1 \
                   --log_dir ./logs/bbbp \
                   --dataroot ./datasets/finetuning/benchmarks \
                   --dataset bbbp \
                   --task_type classification \
                   --resume ./ckpts/ImageMol.pth.tar \
                   --image_aug \
                   --lr 0.5 \
                   --batch 64 \
                   --epochs 20

Evaluate models

You can evaluate the finetuned model by using the following command:

python evaluate.py --dataroot ${dataroot} \
                   --dataset ${dataset} \
                   --task_type ${task_type} \
                   --resume ${resume} \
                   --batch ${batch}

For example:

python evaluate.py --dataroot ./datasets/finetuning/benchmarks \
                   --dataset bbbp \
                   --task_type classification \
                   --resume ./bbbp.pth \
                   --batch 128

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
Models		Models
data		data
data_process		data_process
dataloader		dataloader
model		model
smiles_to_graph/processed		smiles_to_graph/processed
utils		utils
GCN_train.py		GCN_train.py
README.md		README.md
Voc		Voc
adaptation_layers.py		adaptation_layers.py
cnn_model_utils.py		cnn_model_utils.py
config.py		config.py
contrast.py		contrast.py
env.yaml		env.yaml
evaluate.py		evaluate.py
finetune.py		finetune.py
pretrain_smiles_create_json.py		pretrain_smiles_create_json.py
smiles_to_graph_deal.py		smiles_to_graph_deal.py
train_smiles_mamba.py		train_smiles_mamba.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Three-Modality Molecular Representation Learning Combined with Multi-Task Optimization for Enhanced Molecular Property Prediction

Install environment

1. create a new conda environment

Pretraining

1. preparing dataset

Train

Training Smiles with Mamba Model

Train data using a 6-layer GCN model

Comparative learning

Finetuning

1. Download pre-trained model

2. Finetune with pre-trained model

Evaluate models

About

Uh oh!

Releases

Packages

Languages

0range2025/TMRL-MTO

Folders and files

Latest commit

History

Repository files navigation

Three-Modality Molecular Representation Learning Combined with Multi-Task Optimization for Enhanced Molecular Property Prediction

Install environment

1. create a new conda environment

Pretraining

1. preparing dataset

Train

Training Smiles with Mamba Model

Train data using a 6-layer GCN model

Comparative learning

Finetuning

1. Download pre-trained model

2. Finetune with pre-trained model

Evaluate models

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages