vllm/fp4 at 4c33d6732148fdaeb9780fa86fca1f87f2a93c19 - vllm

Files

Kaixi Hou ed7a29d9f8 [NVIDIA] Support Cutlass MLA for Blackwell GPUs (#16032 )

Signed-off-by: kaixih <kaixih@nvidia.com>

2025-04-27 06:29:21 -07:00

nvfp4_quant_entry.cu

2025-02-12 19:51:51 -08:00

nvfp4_quant_kernels.cu

2025-02-20 22:01:48 -08:00

nvfp4_scaled_mm_entry.cu

2025-03-12 05:13:11 +00:00

nvfp4_scaled_mm_kernels.cu

2025-04-27 06:29:21 -07:00