Only emit warning about internal tokenizer if it isn't being used (#939)

2023-09-04 08:50:55 -07:00 · 2023-09-04 08:50:55 -07:00 · e15932bb60
parent ce741ba3e4
commit e15932bb60
1 changed files with 2 additions and 1 deletions
--- a/vllm/transformers_utils/tokenizer.py
+++ b/vllm/transformers_utils/tokenizer.py
@ -25,7 +25,8 @@ def get_tokenizer(
                "Cannot use the fast tokenizer in slow tokenizer mode.")
        kwargs["use_fast"] = False

-    if "llama" in tokenizer_name.lower() and kwargs.get("use_fast", True):
+    if ("llama" in tokenizer_name.lower() and kwargs.get("use_fast", True)
+            and tokenizer_name != _FAST_LLAMA_TOKENIZER):
        logger.info(
            "For some LLaMA-based models, initializing the fast tokenizer may "
            "take a long time. To eliminate the initialization time, consider "