downsampled-diffusion/train.py at main · simonamtoft/downsampled-diffusion · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
import json

from utils import DATASETS, get_args, modify_config
from models import MODEL_NAMES
from trainers import setup_trainer

# setup path to data root
DATA_ROOT = '../data/'

# define WANDB project name
WANDB_PROJECT = 'ddpm-test'

# standard config for every model
CONFIG = {
    'lr': 1e-3,         # standard for VAE and DRAW models
    'rnd_flip': False,  # whether to use rnd flip transformation or not
}

# specific model architecture config
CONFIG_MODEL = {
    'ddpm': {
        'lr': 2e-4,                 # iddpm paper: 2e-4 for 32x32, 2e-5 for 256x256
        'unet_chan': 128,           # iddpm paper: 128
        'unet_dims': (1, 2, 2, 2),  # iddpm paper: (1, 2, 2, 2) for 32x32, (1, 2, 3, 4) for 64x64
        'unet_dropout': 0.1,        # iddpm paper: 0.1 for linear, 0.3 for cosine
        'T': 1000,                  # iddpm paper: 4000, ddpm: 1000
        'loss_type': 'simple',      # simple, vlb, hybrid
        'beta_schedule': 'linear',  # linear, cosine, sqrt_linear, sqrt
        'ema_decay': 0.995,         # iddpm + ddpm: 0.9999
        'loss_flat': 'sum',         # whether to mean or sum over non-batch dimensions of the loss
        'val_split': 0,
    },
    'dddpm': {
        'd_mode': 'convolutional_res', # deterministic convolutional_res
        'u_mode': 'convolutional_res',
        'd_dropout': 0,
        'd_chans': 64,
        'd_n_blocks': 3,
        'u_n_blocks': 3,
        'unet_in': 8,
        # define loss mode for reconstruction
        # if true, recon loss is computed directly by
        # z = downsample(x), x_hat = upsample(z), l_recon = L2(x, x_hat)
        'ae_loss': True,
        't_rec_max': 100,
        'force_latent': True,
    },
    'draw': {
        'h_dim': 400,
        'z_dim': 200,
        'T': 16,
    },
    'vae': {
        'h_dim': [512, 256, 128, 64],
        'z_dim': 64,
        'as_beta': True,
    },
    'lvae': {
        'h_dim': [512, 256, 256],
        'z_dim': [64, 32, 32],
        'as_beta': True,
    }
}


if __name__ == '__main__':
    # Get CLI arguments
    config, mute = get_args(CONFIG, DATASETS, MODEL_NAMES)

    # add specific model architecture stuff to config
    config = modify_config(config, CONFIG_MODEL[config['model']])
    if config['model'] == 'ddpm':
        if config['n_downsamples'] > 0:
            config['model'] = 'dddpm'
            config = modify_config(config, CONFIG_MODEL['dddpm'])

    # setup model and trainer
    trainer, config = setup_trainer(config, mute, DATA_ROOT, WANDB_PROJECT, 0)

    # print out train configuration
    print('\nTraining configuration dict:')
    print(json.dumps(config, sort_keys=False, indent=4) + '\n')

    # train model
    _ = trainer.train()

    print("train.py script finished!")