vllm/moe at 3e36fcbee642f41278a4881c9e2bfbbd7c28e607 - vllm

Files

Caleb_Du 57c22e57f9 Fix CUDA permute/unpermute for use with DeepGemm Moe (#17934 )

Signed-off-by: Caleb_Du <Caleb_Du@zju.edu.cn>

2025-07-27 07:08:00 -07:00

2025-07-02 00:51:52 +00:00

2025-07-27 07:08:00 -07:00

moe_align_sum_kernels.cu

2025-07-21 11:19:23 -07:00

moe_ops.h

2025-06-17 11:49:26 -07:00

moe_permute_unpermute_op.cu

2025-07-27 07:08:00 -07:00

moe_wna16_utils.h

2025-04-29 06:46:55 -07:00

moe_wna16.cu

2025-04-17 22:13:29 -07:00

topk_softmax_kernels.cu

2025-07-24 00:37:19 -07:00

torch_bindings.cpp

2025-07-27 07:08:00 -07:00