Add support for getting the token count for all parts of Gemini generation requests (#29630)

* `CountTokensRequest` now takes a full `GenerateContentRequest` instead of just content. * Fixes use of `models/` prefix in `model` field of `GenerateContentRequest`, since that's required for use in `CountTokensRequest`. This didn't cause issues before because it was always cleared and used in the path. Release Notes: - N/A
2025-05-04 15:32:45 -06:00 · 2025-05-04 15:32:45 -06:00 · 76ad1a29a5
commit 76ad1a29a5
parent 86484233c0
3 changed files with 90 additions and 33 deletions
--- a/crates/language_models/src/provider/cloud.rs
+++ b/crates/language_models/src/provider/cloud.rs
@ -718,7 +718,8 @@ impl LanguageModel for CloudLanguageModel {
            CloudModel::Google(model) => {
                let client = self.client.clone();
                let llm_api_token = self.llm_api_token.clone();
-                let request = into_google(request, model.id().into());
+                let model_id = model.id().to_string();
+                let generate_content_request = into_google(request, model_id.clone());
                async move {
                    let http_client = &client.http_client();
                    let token = llm_api_token.acquire(&client).await?;
@ -736,9 +737,9 @@ impl LanguageModel for CloudLanguageModel {
                        };
                    let request_body = CountTokensBody {
                        provider: zed_llm_client::LanguageModelProvider::Google,
-                        model: model.id().into(),
+                        model: model_id,
                        provider_request: serde_json::to_value(&google_ai::CountTokensRequest {
-                            contents: request.contents,
+                            generate_content_request,
                        })?,
                    };
                    let request = request_builder
@ -895,7 +896,7 @@ impl LanguageModel for CloudLanguageModel {
                            prompt_id,
                            mode,
                            provider: zed_llm_client::LanguageModelProvider::Google,
-                            model: request.model.clone(),
+                            model: request.model.model_id.clone(),
                            provider_request: serde_json::to_value(&request)?,
                        },
                    )