vllm/quantization at 76e8a70476ef9daa970349c14c117fe91e8b4544 - vllm

Files

Robert Shaw c0c2335ce0 Integrate Marlin Kernels for Int4 GPTQ inference (#2497 )

Co-authored-by: Robert Shaw <114415538+rib-2@users.noreply.github.com>
Co-authored-by: alexm <alexm@neuralmagic.com>

2024-03-01 12:47:51 -08:00

2024-02-12 11:02:17 -08:00

2024-02-01 09:35:09 -08:00

2024-02-28 21:52:23 -08:00

2024-03-01 12:47:51 -08:00

2024-01-03 09:52:29 -08:00