Generalising Video Classification Training Script (references/video_classification/train.py)

The `references/video_classification/train.py` script can be generalised for finetuning on any dataset with just a few changes.

3 additional arguments would be needed:

```python
parser.add_argument('--train-dir', default='train_avi-480p', help='name of train dir')
parser.add_argument('--val-dir', default='val_avi-480p', help='name of val dir')
parser.add_argument('--output-classes', default=None, help='no. of output classes (if finetuning)')
```

Some minimal changes to the script:

Modifying lines 119-120
```python
traindir = os.path.join(args.data_path, args.train_dir)
valdir = os.path.join(args.data_path, args.valid_dir)
```

One additional line after line 205:
```python
#line 205
model = torchvision.models.video.__dict__[args.model](pretrained=args.pretrained)

#additional chunk for fine-tuning
if args.output_classes is not None:
    model.fc.out_features = args.output_classes

#line 206
model.to(device)
```


If this makes sense to you guys, I'll be happy to put in a PR for it.




Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Generalising Video Classification Training Script (references/video_classification/train.py) #1540

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Generalising Video Classification Training Script (references/video_classification/train.py) #1540

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions