vllm/quantization at 5285589f37fdc0fb0c3fa4b05b71fadb68eb1130 - vllm

Files

History

Michael Goin ed37599544 Update supported_hardware.md for TPU INT8 (#16437 )

2025-04-11 12:28:07 +08:00

auto_awq.md

2025-03-03 21:59:09 +00:00

bnb.md

2025-04-04 23:30:45 -07:00

fp8.md

2025-01-29 11:38:29 +08:00

gguf.md

2025-04-07 05:32:06 +00:00

gptqmodel.md

2025-03-03 21:59:09 +00:00

index.md

Torchao (#14231 )

2025-04-07 19:39:28 -04:00

int4.md

2025-01-31 15:38:48 -08:00

int8.md

2025-01-31 15:38:48 -08:00

quantized_kvcache.md

2025-01-23 18:04:03 +00:00

quark.md

2025-04-01 08:32:45 -07:00

supported_hardware.md

2025-04-11 12:28:07 +08:00

torchao.md

Torchao (#14231 )

2025-04-07 19:39:28 -04:00