zhendch commited on
Commit
e4986da
·
verified ·
1 Parent(s): 97a4f77

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +10 -10
README.md CHANGED
@@ -96,7 +96,7 @@ Script for the TransDiff-L 1StepAR setting (Pretrain TransDiff-L with a width of
96
  torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
97
  main.py \
98
  --img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
99
- --model transdiff_large --diffloss_w 1024 \
100
  --diffusion_batch_mul 4 \
101
  --epochs 800 --warmup_epochs 100 --blr 1.0e-4 --batch_size 32 \
102
  --output_dir ${OUTPUT_DIR} --resume ${OUTPUT_DIR} \
@@ -112,8 +112,8 @@ Script for the TransDiff-L MRAR setting (Finetune TransDiff-L MRAR with a width
112
  ```
113
  torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
114
  main.py \
115
- --img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
116
- --model transdiff_large --diffloss_w 1024 --mrar --bf16 \
117
  --diffusion_batch_mul 2 \
118
  --epochs 40 --warmup_epochs 10 --lr 5.0e-5 --batch_size 16 --gradient_accumulation_steps 2 \
119
  --output_dir ${OUTPUT_DIR} --resume ${Transdiff-L_1StepAR_DIR} \
@@ -124,7 +124,7 @@ Script for the TransDiff-L 512x512 setting (Finetune TransDiff-L 512x512 with a
124
  torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
125
  main.py \
126
  --img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
127
- --model transdiff_large --diffloss_w 1024 --ema_rate 0.999 --bf16 \
128
  --diffusion_batch_mul 4 \
129
  --epochs 150 --warmup_epochs 10 --lr 1.0e-4 --batch_size 16 --gradient_accumulation_steps 2 \
130
  --only_train_diff \
@@ -139,7 +139,7 @@ Evaluate TransDiff-L 1StepAR with classifier-free guidance:
139
  torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
140
  main.py \
141
  --img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
142
- --model transdiff_large --diffloss_w 1024 \
143
  --output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l/ \
144
  --evaluate --eval_bsz 256 --num_images 50000 \
145
  --cfg 1.3 --scale_0 0.89 --scale_1 0.95
@@ -149,11 +149,11 @@ Evaluate TransDiff-L MRAR with classifier-free guidance:
149
  ```
150
  torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
151
  main.py \
152
- --img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
153
- --model transdiff_large --diffloss_w 1024 \
154
  --output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_mrar/ \
155
  --evaluate --eval_bsz 256 --num_images 50000 \
156
- --cfg 1.3 --scale_0 0.91 --scale_1 0.93
157
  ```
158
 
159
  Evaluate TransDiff-L 512x512 with classifier-free guidance:
@@ -161,7 +161,7 @@ Evaluate TransDiff-L 512x512 with classifier-free guidance:
161
  torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
162
  main.py \
163
  --img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
164
- --model transdiff_large --diffloss_w 1024 \
165
  --output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_512/ \
166
  --evaluate --eval_bsz 64 --num_images 50000 \
167
  --cfg 1.3 --scale_0 0.87 --scale_1 0.87
@@ -175,7 +175,7 @@ More settings for Benchmark in paper:
175
  | TransDiff-L | 1.30 | 0.89 | 0.95 |
176
  | TransDiff-H | 1.23 | 0.87 | 0.93 |
177
  | TransDiff-B MRAR | 1.30 | 0.87 | 0.91 |
178
- | TransDiff-L MRAR | 1.30 | 0.91 | 0.93 |
179
  | TransDiff-H MRAR | 1.28 | 0.87 | 0.91 |
180
  | TransDiff-L 512x512 | 1.30 | 0.87 | 0.87 |
181
 
 
96
  torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
97
  main.py \
98
  --img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
99
+ --model transdiff_large \
100
  --diffusion_batch_mul 4 \
101
  --epochs 800 --warmup_epochs 100 --blr 1.0e-4 --batch_size 32 \
102
  --output_dir ${OUTPUT_DIR} --resume ${OUTPUT_DIR} \
 
112
  ```
113
  torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
114
  main.py \
115
+ --img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 2 \
116
+ --model transdiff_large --mrar --bf16 \
117
  --diffusion_batch_mul 2 \
118
  --epochs 40 --warmup_epochs 10 --lr 5.0e-5 --batch_size 16 --gradient_accumulation_steps 2 \
119
  --output_dir ${OUTPUT_DIR} --resume ${Transdiff-L_1StepAR_DIR} \
 
124
  torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
125
  main.py \
126
  --img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
127
+ --model transdiff_large --ema_rate 0.999 --bf16 \
128
  --diffusion_batch_mul 4 \
129
  --epochs 150 --warmup_epochs 10 --lr 1.0e-4 --batch_size 16 --gradient_accumulation_steps 2 \
130
  --only_train_diff \
 
139
  torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
140
  main.py \
141
  --img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
142
+ --model transdiff_large \
143
  --output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l/ \
144
  --evaluate --eval_bsz 256 --num_images 50000 \
145
  --cfg 1.3 --scale_0 0.89 --scale_1 0.95
 
149
  ```
150
  torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
151
  main.py \
152
+ --img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 2 \
153
+ --model transdiff_large \
154
  --output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_mrar/ \
155
  --evaluate --eval_bsz 256 --num_images 50000 \
156
+ --cfg 1.3 --scale_0 0.925 --scale_1 0.95
157
  ```
158
 
159
  Evaluate TransDiff-L 512x512 with classifier-free guidance:
 
161
  torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
162
  main.py \
163
  --img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
164
+ --model transdiff_large \
165
  --output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_512/ \
166
  --evaluate --eval_bsz 64 --num_images 50000 \
167
  --cfg 1.3 --scale_0 0.87 --scale_1 0.87
 
175
  | TransDiff-L | 1.30 | 0.89 | 0.95 |
176
  | TransDiff-H | 1.23 | 0.87 | 0.93 |
177
  | TransDiff-B MRAR | 1.30 | 0.87 | 0.91 |
178
+ | TransDiff-L MRAR | 1.30 | 0.925 | 0.95 |
179
  | TransDiff-H MRAR | 1.28 | 0.87 | 0.91 |
180
  | TransDiff-L 512x512 | 1.30 | 0.87 | 0.87 |
181