fix:Spark's large language model token calculation error #7911 (#8755)

2024-09-25 14:51:42 +08:00 · 2024-09-25 14:51:42 +08:00 · d0e0111f88
parent 2328944987
commit d0e0111f88
2 changed files with 7 additions and 4 deletions
--- a/api/core/app/apps/base_app_runner.py
+++ b/api/core/app/apps/base_app_runner.py
@ -309,7 +309,7 @@ class AppRunner:
            if not prompt_messages:
                prompt_messages = result.prompt_messages

-            if not usage and result.delta.usage:
+            if result.delta.usage:
                usage = result.delta.usage

        if not usage:
--- a/api/core/model_runtime/model_providers/spark/llm/llm.py
+++ b/api/core/model_runtime/model_providers/spark/llm/llm.py
@ -213,18 +213,21 @@ class SparkLargeLanguageModel(LargeLanguageModel):
        :param prompt_messages: prompt messages
        :return: llm response chunk generator result
        """
+        completion = ""
        for index, content in enumerate(client.subscribe()):
            if isinstance(content, dict):
                delta = content["data"]
            else:
                delta = content
-
+            completion += delta
            assistant_prompt_message = AssistantPromptMessage(
                content=delta or "",
            )
-
+            temp_assistant_prompt_message = AssistantPromptMessage(
+                content=completion,
+            )
            prompt_tokens = self.get_num_tokens(model, credentials, prompt_messages)
-            completion_tokens = self.get_num_tokens(model, credentials, [assistant_prompt_message])
+            completion_tokens = self.get_num_tokens(model, credentials, [temp_assistant_prompt_message])

            # transform usage
            usage = self._calc_response_usage(model, credentials, prompt_tokens, completion_tokens)