vllm/weight_loading at 3f60f2244e3ffec6198d7a41765918d1efd3bb96 - vllm

Files

Dipika Sikka fc911880cc [Kernel] Expand MoE weight loading + Add Fused Marlin MoE Kernel (#7766 )

Co-authored-by: ElizaWszola <eliza@neuralmagic.com>

2024-08-27 15:07:09 -07:00

models.txt

2024-08-27 15:07:09 -07:00

run_model_weight_loading_test.sh

2024-08-13 14:30:11 -04:00

test_weight_loading.py

2024-08-13 14:30:11 -04:00