vllm/source at 21d93c140d0a97af5f0c59e660cf04bd417fd424 - vllm - Gitea: Git with a cup of tea

youngkingdom/vllm

Files

History

Antoni Baum 21d93c140d Optimize Mixtral with expert parallelism (#2090 )

2023-12-13 23:55:07 -08:00

..

Update README.md (#1292 )

2023-10-08 23:15:50 -07:00

getting_started

Update installation instruction for vLLM + CUDA 11.8 (#2086 )

2023-12-13 09:25:59 -08:00

Optimize Mixtral with expert parallelism (#2090 )

2023-12-13 23:55:07 -08:00

[Docs] Update the AWQ documentation to highlight performance issue (#1883 )

2023-12-02 15:52:47 -08:00

Update run_on_sky.rst (#2025 )

2023-12-11 10:32:58 -08:00

conf.py

Fix repo & documentation URLs (#163 )

2023-06-19 20:03:40 -07:00

index.rst

Merge EmbeddedLLM/vllm-rocm into vLLM main (#1836 )

2023-12-07 23:16:52 -08:00