Change the name to vLLM (#150)

2023-06-17 03:07:40 -07:00
parent e5464ee484
commit 0b98ba15c7
90 changed files with 342 additions and 339 deletions
--- a/tests/kernels/test_activation.py
+++ b/tests/kernels/test_activation.py
@ -1,7 +1,7 @@
 import torch
 import torch.nn.functional as F

-from cacheflow import activation_ops
+from vllm import activation_ops


 def ref_silu_and_mul(x: torch.Tensor) -> torch.Tensor:
--- a/tests/kernels/test_attention.py
+++ b/tests/kernels/test_attention.py
@ -5,7 +5,7 @@ import torch
 from xformers import ops as xops
 from xformers.ops.fmha.attn_bias import BlockDiagonalCausalMask

-from cacheflow import attention_ops
+from vllm import attention_ops

 MAX_SEQ_LEN = 4096
 TEST_SEED = 0
--- a/tests/kernels/test_cache.py
+++ b/tests/kernels/test_cache.py
@ -2,7 +2,7 @@ import random

 import torch

-from cacheflow import cache_ops
+from vllm import cache_ops


@torch.inference_mode()
--- a/tests/kernels/test_layernorm.py
+++ b/tests/kernels/test_layernorm.py
@ -1,7 +1,7 @@
 import torch
 import torch.nn as nn

-from cacheflow import layernorm_ops
+from vllm import layernorm_ops


 class RefRMSNorm(nn.Module):
--- a/tests/kernels/test_pos_encoding.py
+++ b/tests/kernels/test_pos_encoding.py
@ -4,7 +4,7 @@ import torch
 import torch.nn as nn
 import torch.nn.functional as F

-from cacheflow import pos_encoding_ops
+from vllm import pos_encoding_ops


 def rotate_half(x: torch.Tensor) -> torch.Tensor: