agent: Fix max token count mismatch when not using burn mode (#34025)

Closes #31854 Release Notes: - agent: Fixed an issue where the maximum token count would be displayed incorrectly when burn mode was not being used.
2025-07-07 23:13:24 +02:00 · 2025-07-07 23:13:24 +02:00 · 66a1c356bf
commit 66a1c356bf
parent a9107dfaeb
7 changed files with 64 additions and 17 deletions
--- a/crates/language_model/src/language_model.rs
+++ b/crates/language_model/src/language_model.rs
@ -26,7 +26,7 @@ use std::time::Duration;
 use std::{fmt, io};
 use thiserror::Error;
 use util::serde::is_default;
-use zed_llm_client::CompletionRequestStatus;
+use zed_llm_client::{CompletionMode, CompletionRequestStatus};

 pub use crate::model::*;
 pub use crate::rate_limiter::*;
@ -462,6 +462,10 @@ pub trait LanguageModel: Send + Sync {
    }

    fn max_token_count(&self) -> u64;
+    /// Returns the maximum token count for this model in burn mode (If `supports_burn_mode` is `false` this returns `None`)
+    fn max_token_count_in_burn_mode(&self) -> Option<u64> {
+        None
+    }
    fn max_output_tokens(&self) -> Option<u64> {
        None
    }
@ -557,6 +561,18 @@ pub trait LanguageModel: Send + Sync {
    }
 }

+pub trait LanguageModelExt: LanguageModel {
+    fn max_token_count_for_mode(&self, mode: CompletionMode) -> u64 {
+        match mode {
+            CompletionMode::Normal => self.max_token_count(),
+            CompletionMode::Max => self
+                .max_token_count_in_burn_mode()
+                .unwrap_or_else(|| self.max_token_count()),
+        }
+    }
+}
+impl LanguageModelExt for dyn LanguageModel {}
+
 pub trait LanguageModelTool: 'static + DeserializeOwned + JsonSchema {
    fn name() -> String;
    fn description() -> String;