Update README.md
Browse files
README.md
CHANGED
@@ -96,7 +96,7 @@ Script for the TransDiff-L 1StepAR setting (Pretrain TransDiff-L with a width of
|
|
96 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
97 |
main.py \
|
98 |
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
99 |
-
--model transdiff_large
|
100 |
--diffusion_batch_mul 4 \
|
101 |
--epochs 800 --warmup_epochs 100 --blr 1.0e-4 --batch_size 32 \
|
102 |
--output_dir ${OUTPUT_DIR} --resume ${OUTPUT_DIR} \
|
@@ -112,8 +112,8 @@ Script for the TransDiff-L MRAR setting (Finetune TransDiff-L MRAR with a width
|
|
112 |
```
|
113 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
114 |
main.py \
|
115 |
-
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size
|
116 |
-
--model transdiff_large --
|
117 |
--diffusion_batch_mul 2 \
|
118 |
--epochs 40 --warmup_epochs 10 --lr 5.0e-5 --batch_size 16 --gradient_accumulation_steps 2 \
|
119 |
--output_dir ${OUTPUT_DIR} --resume ${Transdiff-L_1StepAR_DIR} \
|
@@ -124,7 +124,7 @@ Script for the TransDiff-L 512x512 setting (Finetune TransDiff-L 512x512 with a
|
|
124 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
125 |
main.py \
|
126 |
--img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
127 |
-
--model transdiff_large --
|
128 |
--diffusion_batch_mul 4 \
|
129 |
--epochs 150 --warmup_epochs 10 --lr 1.0e-4 --batch_size 16 --gradient_accumulation_steps 2 \
|
130 |
--only_train_diff \
|
@@ -139,7 +139,7 @@ Evaluate TransDiff-L 1StepAR with classifier-free guidance:
|
|
139 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
140 |
main.py \
|
141 |
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
142 |
-
--model transdiff_large
|
143 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l/ \
|
144 |
--evaluate --eval_bsz 256 --num_images 50000 \
|
145 |
--cfg 1.3 --scale_0 0.89 --scale_1 0.95
|
@@ -149,11 +149,11 @@ Evaluate TransDiff-L MRAR with classifier-free guidance:
|
|
149 |
```
|
150 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
151 |
main.py \
|
152 |
-
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size
|
153 |
-
--model transdiff_large
|
154 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_mrar/ \
|
155 |
--evaluate --eval_bsz 256 --num_images 50000 \
|
156 |
-
--cfg 1.3 --scale_0 0.
|
157 |
```
|
158 |
|
159 |
Evaluate TransDiff-L 512x512 with classifier-free guidance:
|
@@ -161,7 +161,7 @@ Evaluate TransDiff-L 512x512 with classifier-free guidance:
|
|
161 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
162 |
main.py \
|
163 |
--img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
164 |
-
--model transdiff_large
|
165 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_512/ \
|
166 |
--evaluate --eval_bsz 64 --num_images 50000 \
|
167 |
--cfg 1.3 --scale_0 0.87 --scale_1 0.87
|
@@ -175,7 +175,7 @@ More settings for Benchmark in paper:
|
|
175 |
| TransDiff-L | 1.30 | 0.89 | 0.95 |
|
176 |
| TransDiff-H | 1.23 | 0.87 | 0.93 |
|
177 |
| TransDiff-B MRAR | 1.30 | 0.87 | 0.91 |
|
178 |
-
| TransDiff-L MRAR | 1.30 | 0.
|
179 |
| TransDiff-H MRAR | 1.28 | 0.87 | 0.91 |
|
180 |
| TransDiff-L 512x512 | 1.30 | 0.87 | 0.87 |
|
181 |
|
|
|
96 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
97 |
main.py \
|
98 |
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
99 |
+
--model transdiff_large \
|
100 |
--diffusion_batch_mul 4 \
|
101 |
--epochs 800 --warmup_epochs 100 --blr 1.0e-4 --batch_size 32 \
|
102 |
--output_dir ${OUTPUT_DIR} --resume ${OUTPUT_DIR} \
|
|
|
112 |
```
|
113 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
114 |
main.py \
|
115 |
+
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 2 \
|
116 |
+
--model transdiff_large --mrar --bf16 \
|
117 |
--diffusion_batch_mul 2 \
|
118 |
--epochs 40 --warmup_epochs 10 --lr 5.0e-5 --batch_size 16 --gradient_accumulation_steps 2 \
|
119 |
--output_dir ${OUTPUT_DIR} --resume ${Transdiff-L_1StepAR_DIR} \
|
|
|
124 |
torchrun --nproc_per_node=8 --nnodes=8 --node_rank=${NODE_RANK} --master_addr=${MASTER_ADDR} --master_port=${MASTER_PORT} \
|
125 |
main.py \
|
126 |
--img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
127 |
+
--model transdiff_large --ema_rate 0.999 --bf16 \
|
128 |
--diffusion_batch_mul 4 \
|
129 |
--epochs 150 --warmup_epochs 10 --lr 1.0e-4 --batch_size 16 --gradient_accumulation_steps 2 \
|
130 |
--only_train_diff \
|
|
|
139 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
140 |
main.py \
|
141 |
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
142 |
+
--model transdiff_large \
|
143 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l/ \
|
144 |
--evaluate --eval_bsz 256 --num_images 50000 \
|
145 |
--cfg 1.3 --scale_0 0.89 --scale_1 0.95
|
|
|
149 |
```
|
150 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
151 |
main.py \
|
152 |
+
--img_size 256 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 2 \
|
153 |
+
--model transdiff_large \
|
154 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_mrar/ \
|
155 |
--evaluate --eval_bsz 256 --num_images 50000 \
|
156 |
+
--cfg 1.3 --scale_0 0.925 --scale_1 0.95
|
157 |
```
|
158 |
|
159 |
Evaluate TransDiff-L 512x512 with classifier-free guidance:
|
|
|
161 |
torchrun --nproc_per_node=8 --nnodes=1 --node_rank=0 \
|
162 |
main.py \
|
163 |
--img_size 512 --vae_path ckpt/vae/kl16.ckpt --vae_embed_dim 16 --patch_size 1 \
|
164 |
+
--model transdiff_large \
|
165 |
--output_dir ${OUTPUT_DIR} --resume ckpt/transdiff_l_512/ \
|
166 |
--evaluate --eval_bsz 64 --num_images 50000 \
|
167 |
--cfg 1.3 --scale_0 0.87 --scale_1 0.87
|
|
|
175 |
| TransDiff-L | 1.30 | 0.89 | 0.95 |
|
176 |
| TransDiff-H | 1.23 | 0.87 | 0.93 |
|
177 |
| TransDiff-B MRAR | 1.30 | 0.87 | 0.91 |
|
178 |
+
| TransDiff-L MRAR | 1.30 | 0.925 | 0.95 |
|
179 |
| TransDiff-H MRAR | 1.28 | 0.87 | 0.91 |
|
180 |
| TransDiff-L 512x512 | 1.30 | 0.87 | 0.87 |
|
181 |
|