Spaces:

tencent
/

HunyuanImage-2.1

Running on A100

KevinNg99 commited on 2 days ago

Commit

23c68ff

1 Parent(s): b9ad1cd

default shift

Files changed (2) hide show

app.py CHANGED Viewed

@@ -264,6 +264,7 @@ class HunyuanImageApp:
                 num_inference_steps=num_inference_steps,
                 guidance_scale=guidance_scale,
                 seed=seed,
                 use_reprompt=use_reprompt,
                 use_refiner=use_refiner
             )

                 num_inference_steps=num_inference_steps,
                 guidance_scale=guidance_scale,
                 seed=seed,
+                shift=5,
                 use_reprompt=use_reprompt,
                 use_refiner=use_refiner
             )

hyimage/diffusion/pipelines/hunyuanimage_pipeline.py CHANGED Viewed

@@ -49,7 +49,7 @@ class HunyuanImagePipelineConfig:
     # Default guidance scale, will be overridden by the guidance_scale parameter in __call__
     default_guidance_scale: float = 3.5
     # Inference shift
-    shift: int = 4
     torch_dtype: str = "bf16"
     device: str = "cuda"
     version: str = ""
@@ -77,6 +77,9 @@ class HunyuanImagePipelineConfig:
                 vae_config=HUNYUANIMAGE_V2_1_VAE_32x(),
                 text_encoder_config=HUNYUANIMAGE_V2_1_TEXT_ENCODER(),
                 reprompt_config=HUNYUANIMAGE_REPROMPT(),
                 version=version,
                 **kwargs
             )
@@ -587,8 +590,6 @@ class HunyuanImagePipeline:
                     guidance_rescale=self.guidance_rescale,
                 )
-        noise_pred = noise_pred_uncond + guidance_scale * (noise_pred_text - noise_pred_uncond)
         return noise_pred
     def _decode_latents(self, latents, reorg_tokens=False):
@@ -699,7 +700,7 @@ class HunyuanImagePipeline:
         print(f"Guidance Scale:   {guidance_scale}")
         print(f"CFG Mode:         {self.cfg_mode}")
         print(f"Guidance Rescale: {self.guidance_rescale}")
-        print(f"Shift:            {self.shift}")
         print(f"Seed:             {seed}")
         print(f"Use MeanFlow:     {self.use_meanflow}")
         print(f"Use byT5:         {self.use_byt5}")

     # Default guidance scale, will be overridden by the guidance_scale parameter in __call__
     default_guidance_scale: float = 3.5
     # Inference shift
+    shift: int = 5
     torch_dtype: str = "bf16"
     device: str = "cuda"
     version: str = ""
                 vae_config=HUNYUANIMAGE_V2_1_VAE_32x(),
                 text_encoder_config=HUNYUANIMAGE_V2_1_TEXT_ENCODER(),
                 reprompt_config=HUNYUANIMAGE_REPROMPT(),
+                shift=4 if use_distilled else 5,
+                default_guidance_scale=3.25 if use_distilled else 3.5,
+                default_sampling_steps=8 if use_distilled else 50,
                 version=version,
                 **kwargs
             )
                     guidance_rescale=self.guidance_rescale,
                 )
         return noise_pred
     def _decode_latents(self, latents, reorg_tokens=False):
         print(f"Guidance Scale:   {guidance_scale}")
         print(f"CFG Mode:         {self.cfg_mode}")
         print(f"Guidance Rescale: {self.guidance_rescale}")
+        print(f"Shift:            {shift}")
         print(f"Seed:             {seed}")
         print(f"Use MeanFlow:     {self.use_meanflow}")
         print(f"Use byT5:         {self.use_byt5}")