vllm/weight_loading at 7eebe8ccaa8bb9c37d59d00cbedcd5e67308acfe - vllm

Files

Dipika Sikka 8678a69ab5 [Kernel] Expand MoE weight loading + Add Fused Marlin MoE Kernel (#7527 )

Co-authored-by: ElizaWszola <eliza@neuralmagic.com>

2024-08-21 16:17:10 -07:00

models.txt

2024-08-21 16:17:10 -07:00

run_model_weight_loading_test.sh

2024-08-13 14:30:11 -04:00

test_weight_loading.py

2024-08-13 14:30:11 -04:00