vllm/quantization at 214efc2c3cb568e8eb3f7d234f3bd8f5bbe24795 - vllm

Files

Yan Ma 6b2d25efc7 [Hardware][XPU] AWQ/GPTQ support for xpu backend (#10107 )

Signed-off-by: yan ma <yan.ma@intel.com>

2024-11-18 11:18:05 -07:00

auto_awq.rst

2024-08-28 12:12:32 +00:00

bnb.rst

2024-09-24 17:08:55 -07:00

fp8_e4m3_kvcache.rst

2024-08-12 22:47:41 +00:00

fp8_e5m2_kvcache.rst

2024-08-12 22:47:41 +00:00

fp8.rst

2024-10-08 18:22:31 -07:00

gguf.rst

2024-09-19 13:15:55 -06:00

int8.rst

2024-08-16 13:59:16 -07:00

supported_hardware.rst

2024-11-18 11:18:05 -07:00