vllm/worker at 7f280d69c98e560427d2cbc9c3c3c13a83510dca - vllm

Files

Woosuk Kwon 7f280d69c9 [Optimization] Cache sampled token ids in model runner (#20291 )

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

2025-07-01 11:01:31 -07:00

__init__.py

2024-12-26 19:02:58 +09:00

test_gpu_input_batch.py

2025-06-18 21:36:33 -07:00

test_gpu_model_runner.py

2025-07-01 11:01:31 -07:00