In [1]:
import torch
from video_diffusion_pytorch import Unet3D, GaussianDiffusion, Trainer

In [2]:
model = Unet3D(
    dim = 64,
    dim_mults = (1, 2, 4, 8),
)

In [3]:
diffusion = GaussianDiffusion(
    model,
    image_size = 64,
    num_frames = 20,
    timesteps = 1000,
    loss_type = 'l1' # L1 or L2
).cuda()

In [4]:
trainer = Trainer(
    diffusion,
    '/home/s_gladkykh/thesis/gif_dataset_64',                         # this folder path needs to contain all your training data, as .gif files, of correct image size and number of frames
    train_batch_size = 12,
    train_lr = 1e-4,
    save_and_sample_every = 1000,
    train_num_steps = 700000,         # total training steps
    gradient_accumulate_every = 2,    # gradient accumulation steps
    ema_decay = 0.995,                # exponential moving average decay
    amp = True                        # turn on mixed precision
)

found 1710 videos as gif files at /home/s_gladkykh/thesis/gif_dataset_64


In [None]:
trainer.train()

0: 0.8737179636955261
0: 0.8692553639411926
1: 0.8401175141334534
1: 0.8407535552978516
2: 0.8152998089790344
2: 0.8167557120323181
3: 0.7955003976821899
3: 0.7922370433807373
4: 0.7760370373725891
4: 0.778008222579956
5: 0.7572596669197083
5: 0.7583755850791931
6: 0.7443184852600098
6: 0.7375518679618835
7: 0.7162826657295227
7: 0.7269980907440186
8: 0.6970553994178772
8: 0.7137145400047302
9: 0.7104430198669434
9: 0.6930174231529236
10: 0.679938018321991
10: 0.6569937467575073
11: 0.637891411781311
11: 0.6765943169593811
12: 0.6456329226493835
12: 0.6316298842430115
13: 0.6422481536865234
13: 0.6195756793022156
14: 0.5944401621818542
14: 0.6189068555831909
15: 0.593522310256958
15: 0.58649742603302
16: 0.6333237886428833
16: 0.5795661807060242
17: 0.5579012632369995
17: 0.5508252382278442
18: 0.5723781585693359
18: 0.5358274579048157
19: 0.4898602068424225
19: 0.5018917918205261
20: 0.46141350269317627
20: 0.5378347039222717
21: 0.45317405462265015
21: 0.5352942943572998
22: 0.504791

sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [13:44<00:00,  1.21it/s]
sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [04:45<00:00,  3.50it/s]


1001: 0.09949130564928055
1001: 0.04971320927143097
1002: 0.11682542413473129
1002: 0.06703163683414459
1003: 0.07616030424833298
1003: 0.09586948156356812
1004: 0.11696603894233704
1004: 0.062138721346855164
1005: 0.0881078690290451
1005: 0.13302935659885406
1006: 0.06396172195672989
1006: 0.07097432762384415
1007: 0.10337522625923157
1007: 0.09155663847923279
1008: 0.05881490185856819
1008: 0.06018461287021637
1009: 0.07491415739059448
1009: 0.14768527448177338
1010: 0.07842113077640533
1010: 0.11047641187906265
1011: 0.07453674077987671
1011: 0.08519771695137024
1012: 0.0689752995967865
1012: 0.05440652742981911
1013: 0.07942438125610352
1013: 0.058971554040908813
1014: 0.10131484270095825
1014: 0.08398192375898361
1015: 0.05269857123494148
1015: 0.12662924826145172
1016: 0.06630655378103256
1016: 0.05246160551905632
1017: 0.1189788207411766
1017: 0.053332891315221786
1018: 0.06019120290875435
1018: 0.055481791496276855
1019: 0.07398570328950882
1019: 0.07701897621154785
1020: 0.091

sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [13:44<00:00,  1.21it/s]
sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [04:45<00:00,  3.50it/s]


2001: 0.04903029277920723
2001: 0.047228217124938965
2002: 0.06401760876178741
2002: 0.06012822315096855
2003: 0.09430380910634995
2003: 0.04364548996090889
2004: 0.038472436368465424
2004: 0.09339006245136261
2005: 0.1033225804567337
2005: 0.040345653891563416
2006: 0.08159569650888443
2006: 0.07526687532663345
2007: 0.042376406490802765
2007: 0.050695113837718964
2008: 0.06367653608322144
2008: 0.05248419567942619
2009: 0.0667196735739708
2009: 0.07961153239011765
2010: 0.06262853741645813
2010: 0.07336432486772537
2011: 0.05303105339407921
2011: 0.040846485644578934
2012: 0.04591759666800499
2012: 0.09029857069253922
2013: 0.05950441583991051
2013: 0.051840148866176605
2014: 0.09164933115243912
2014: 0.04359928146004677
2015: 0.0520598478615284
2015: 0.03185500204563141
2016: 0.06376704573631287
2016: 0.13048173487186432
2017: 0.03252220153808594
2017: 0.11285998672246933
2018: 0.035795897245407104
2018: 0.04009848088026047
2019: 0.09297633916139603
2019: 0.07691003382205963
2020: 0

sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [13:44<00:00,  1.21it/s]
sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [04:45<00:00,  3.51it/s]


3001: 0.041356511414051056
3001: 0.03571135923266411
3002: 0.06726467609405518
3002: 0.07124824076890945
3003: 0.05816725641489029
3003: 0.03524988144636154
3004: 0.05054882913827896
3004: 0.04126013070344925
3005: 0.04360140115022659
3005: 0.04443340376019478
3006: 0.06132635846734047
3006: 0.05586619675159454
3007: 0.04840359091758728
3007: 0.1416304111480713
3008: 0.04873792082071304
3008: 0.07450342178344727
3009: 0.0873962864279747
3009: 0.052121978253126144
3010: 0.04320090264081955
3010: 0.08374524861574173
3011: 0.043764740228652954
3011: 0.05859619751572609
3012: 0.0768614336848259
3012: 0.037216074764728546
3013: 0.05115201696753502
3013: 0.02855338528752327
3014: 0.035216301679611206
3014: 0.062408532947301865
3015: 0.06159953027963638
3015: 0.029087886214256287
3016: 0.06526865810155869
3016: 0.04990364983677864
3017: 0.07188641279935837
3017: 0.0521213561296463
3018: 0.039494261145591736
3018: 0.04603708162903786
3019: 0.046106211841106415
3019: 0.07906725257635117
3020: 0

IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [13:44<00:00,  1.21it/s]
sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [04:45<00:00,  3.51it/s]


4001: 0.08778784424066544
4001: 0.07131845504045486
4002: 0.054917145520448685
4002: 0.04199172183871269
4003: 0.04454993084073067
4003: 0.058762334287166595
4004: 0.04437684640288353
4004: 0.07333529740571976
4005: 0.06250884383916855
4005: 0.03886014595627785
4006: 0.048143304884433746
4006: 0.03538201376795769
4007: 0.03958834707736969
4007: 0.04273524507880211
4008: 0.049132052809000015
4008: 0.048671722412109375
4009: 0.03579992055892944
4009: 0.05704445019364357
4010: 0.03595762327313423
4010: 0.03730826452374458
4011: 0.05878785625100136
4011: 0.05126762390136719
4012: 0.05553094670176506
4012: 0.03617988899350166
4013: 0.03927887976169586
4013: 0.04468759894371033
4014: 0.05971889570355415
4014: 0.08643341064453125
4015: 0.023834621533751488
4015: 0.06617821007966995
4016: 0.044519271701574326
4016: 0.054103054106235504
4017: 0.052571553736925125
4017: 0.03918900713324547
4018: 0.038763612508773804
4018: 0.04162534326314926
4019: 0.03912551701068878
4019: 0.07203228026628494
40

sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [13:44<00:00,  1.21it/s]
sampling loop time step:  18%|███████████████▋                                                                      | 183/1000 [00:52<03:53,  3.50it/s]IOPub message rate exceeded.
The Jupyter server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--ServerApp.iopub_msg_rate_limit`.

Current values:
ServerApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
ServerApp.rate_limit_window=3.0 (secs)

sampling loop time step: 100%|█████████████████████████████████████████████████████████████████████████████████████| 1000/1000 [04:45<00:00,  3.50it/s]


12001: 0.01661866344511509
12001: 0.03889257088303566
12002: 0.06231838837265968
12002: 0.02470497600734234
12003: 0.031252793967723846
12003: 0.05538506060838699
12004: 0.04705671966075897
12004: 0.03189047425985336
12005: 0.07385283708572388
12005: 0.04296489804983139
12006: 0.03919145464897156
12006: 0.030767425894737244
12007: 0.024110222235322
12007: 0.029594451189041138
12008: 0.04113076999783516
12008: 0.028872016817331314
12009: 0.032376617193222046
12009: 0.02445017546415329
12010: 0.031543731689453125
12010: 0.0376923643052578
12011: 0.030930373817682266
12011: 0.0825502946972847
12012: 0.01593954674899578
12012: 0.05687207356095314
12013: 0.0651756152510643
12013: 0.04707874357700348
12014: 0.03408826142549515
12014: 0.027658505365252495
12015: 0.026514975354075432
12015: 0.02295607700943947
12016: 0.05044260248541832
12016: 0.02785451151430607
12017: 0.03967022895812988
12017: 0.032206807285547256
12018: 0.020522085949778557
12018: 0.03878666087985039
12019: 0.0614102371037