from pytorch_lightning.core.lightning import LightningModule

Multiple Datasets

Lightning supports multiple dataloaders in a few ways.

Create a dataloader that iterates multiple datasets under the hood.
In the validation and test loop you also have the option to return multiple dataloaders which lightning will call sequentially.

Multiple training dataloaders

For training, the best way to use multiple dataloaders is to create a DataLoader class which wraps your multiple dataloaders (this of course also works for testing and validation dataloaders).

(reference)

class ConcatDataset(torch.utils.data.Dataset):

def __init__(self, *datasets):: self.datasets = datasets
def __getitem__(self, i):: return tuple(d[i] for d in self.datasets)
def __len__(self):: return min(len(d) for d in self.datasets)

class LitModel(LightningModule):

def train_dataloader(self):

concat_dataset = ConcatDataset(

datasets.ImageFolder(traindir_A), datasets.ImageFolder(traindir_B)

)

loader = torch.utils.data.DataLoader(

concat_dataset, batch_size=args.batch_size, shuffle=True, num_workers=args.workers, pin_memory=True

) return loader

def val_dataloader(self):

# SAME ...

def test_dataloader(self):

# SAME ...

Test/Val dataloaders

For validation and test dataloaders, lightning also gives you the additional option of passing multiple dataloaders back from each call.

See the following for more details:

~pytorch_lightning.core.datamodule.LightningDataModule.val_dataloader
~pytorch_lightning.core.datamodule.LightningDataModule.test_dataloader

def val_dataloader(self):: loader_1 = Dataloader() loader_2 = Dataloader() return [loader_1, loader_2]

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

multiple_loaders.rst

multiple_loaders.rst

Multiple Datasets

Multiple training dataloaders

Test/Val dataloaders

Files

multiple_loaders.rst

Latest commit

History

multiple_loaders.rst

File metadata and controls

Multiple Datasets

Multiple training dataloaders

Test/Val dataloaders