Separate random generation from transforms #115

fmassa · 2017-03-21T17:16:51Z

This PR factors out the random number generation from the transforms. This way, the same random transform can be applied to different inputs (from eventually different domains).

In the dataset, if the user wants to support the same random transforms applied to different input, a set of generators should be passed in the constructor of the dataset.

class MySegmentationDataset(torch.utils.data.Dataset):
    def __init__(self, transforms=None, target_transforms=None, generators=None):
        self.transforms = transforms
        self.target_transforms = target_transforms
        self.generators = generators

    def __getitem__(self, idx):
      # load img and target
      ...
      # generate random numbers, if generator is provided
      if self.generators is not None:
            for g in self.generators:
                g.generate()

        if self.transforms is not None:
            img = self.transforms(img)

        if self.target_transforms is not None:
            target = self.transforms(target)

        return img, target

An example of how it should be used is presented as follows:

# create random generators
crop_generator = torchvision.transforms.RandomCropGenerator()
flip_generator = torchvision.transforms.RandomFlipGenerator()

generators = (crop_generator, flip_generator)

# random transforms that consumes the generators
crop = RandomCrop(img_size, generator=crop_generator)
flip = RandomHorizontalFlip(generator=flip_generator)

# composed transforms that reuses crop and flip
train_input_transform = torchvision.transforms.Compose([
    crop,
    flip,
    torchvision.transforms.ToTensor(),
    normalize,
])
train_target_transform = torchvision.transforms.Compose([
    crop,
    flip,
    torchvision.transforms.ToTensor(),
    torchvision.transforms.Lambda(lambd=lambda x: x.long())
])

# create dataset, but need to pass the generators as well
mydataset = MySegmentationDataset(train_input_transform,
                    train_target_transform,
                    generators)

img, target = mydataset[0]

A few points worth noting:

I'm not sure how the random state generator behaves on a multi-threaded setup (@colesbury ?)
For more complex transforms such as RandomSizedCrop, the size of the image is required for the generator. We can add an extra *args, **kwargs in the call to each generate method. I'll add that if you agree with that.
We need to pass an extra set of generators to the constructor of the dataset, and call generate at each __getitem__, which might not be ideal.

cc @bodokaiser @ellisbrown @desimone @felixgwu

bodokaiser · 2017-03-21T19:25:07Z

👍

I believe this will not work with num_workers > 1 in DataLoader. Here we see that the loader passes the same dataset instance to all workers so different workers will access same dataset.generators. I guess the best would be to create copies in DataLoader so that every worker has its own dataset instance however this may be a problem with datasets which do a lot of caching for example. So maybe it would be better to create generators on every call to __getitem__ or pass some seed directly to the transform call?

alykhantejani · 2017-09-13T10:15:01Z

@fmassa can this be closed in favor of #240?

Separate random generation from transforms

107cac0

fmassa mentioned this pull request Apr 6, 2017

Add VOC Detection and Segmentation Datasets #86

Closed

fmassa mentioned this pull request May 8, 2017

Random transforms for both input and target? #9

Closed

fmassa mentioned this pull request Aug 24, 2017

Proposal for extending transforms #230

Closed

fmassa closed this Sep 19, 2017

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Separate random generation from transforms #115

Separate random generation from transforms #115

fmassa commented Mar 21, 2017

bodokaiser commented Mar 21, 2017

alykhantejani commented Sep 13, 2017

Separate random generation from transforms #115

Separate random generation from transforms #115

Conversation

fmassa commented Mar 21, 2017

bodokaiser commented Mar 21, 2017

alykhantejani commented Sep 13, 2017