vllm/models at 082ab86f5ff5b36d138fb614cb72d1cf6b2c37fa - vllm

Files

Harry Mellor 97cfa65df7 Add pipeline parallel support to TransformersModel (#12832 )

Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
Signed-off-by: Isotr0py <2037008807@qq.com>
Co-authored-by: Isotr0py <2037008807@qq.com>

2025-03-25 10:41:45 +08:00

extensions

[Core] Integrate fastsafetensors loader for loading model weights (#10647 )

2025-03-24 08:08:02 -07:00

generative_models.md

[Misc][Doc] Add note regarding loading generation_config by default (#15281 )

2025-03-23 14:00:55 -07:00

pooling_models.md

[FEATURE] Enables /score endpoint for embedding models (#12846 )

2025-02-20 22:09:47 -08:00

supported_models.md

Add pipeline parallel support to TransformersModel (#12832 )

2025-03-25 10:41:45 +08:00