vllm/attention at bd29cf3d3ad3dd06105f1a4bb9023bb23bdfd5ed - vllm

Files

wbn dacaf5a400 Replace head_mapping params with num_kv_heads to attention kernel. (#1997 )

Co-authored-by: wangguoya <wangguoya@baidu.com>
Co-authored-by: Yang Zhao <zhaoyangstar@foxmail.com>

2023-12-10 10:12:53 -08:00

attention_dtypes.h

2023-05-27 00:59:32 -07:00

attention_generic.cuh

2023-06-17 03:07:40 -07:00

attention_kernels.cu

2023-12-10 10:12:53 -08:00

attention_utils.cuh

2023-12-07 23:16:52 -08:00

dtype_bfloat16.cuh

2023-12-07 23:16:52 -08:00

dtype_float16.cuh

2023-12-07 23:16:52 -08:00

dtype_float32.cuh

2023-09-04 09:20:06 +09:00