Add image sizes to clip vision outputs. (#11923)

2026-05-05 17:57:56 +08:00 · 2026-01-16 20:02:28 -08:00
parent 0c6b36c6ac
commit 7ac999bf30
1 changed files with 1 additions and 0 deletions
--- a/comfy/clip_vision.py
+++ b/comfy/clip_vision.py
@ -66,6 +66,7 @@ class ClipVisionModel():
        outputs = Output()
        outputs["last_hidden_state"] = out[0].to(comfy.model_management.intermediate_device())
        outputs["image_embeds"] = out[2].to(comfy.model_management.intermediate_device())
+        outputs["image_sizes"] = [pixel_values.shape[1:]] * pixel_values.shape[0]
        if self.return_all_hidden_states:
            all_hs = out[1].to(comfy.model_management.intermediate_device())
            outputs["penultimate_hidden_states"] = all_hs[:, -2]