vllm/basic_correctness at 36fb68f94792a8cec8df5b58bab7ab4d4d6158b4 - vllm

Files

Lily Liu 43c413ec57 [Kernel] Use flashinfer for decoding (#4353 )

Co-authored-by: LiuXiaoxuanPKU <llilyliupku@gmail.com>

2024-05-03 15:51:27 -07:00

test_basic_correctness.py

2024-05-03 15:51:27 -07:00

test_chunked_prefill.py

2024-05-01 19:24:13 -07:00

test_preemption.py

2024-05-02 14:31:20 -07:00