Merge branch 'main' into ollama-inline-completions

2025-08-17 17:08:49 -04:00 · 2025-08-17 17:08:49 -04:00 · e775252c62
commit e775252c62
parent 44231c7568 2dbc951058
626 changed files with 15620 additions and 13811 deletions
--- a/crates/language_models/src/provider/cloud.rs
+++ b/crates/language_models/src/provider/cloud.rs
@ -941,6 +941,8 @@ impl LanguageModel for CloudLanguageModel {
                    request,
                    model.id(),
                    model.supports_parallel_tool_calls(),
+                    model.supports_prompt_cache_key(),
+                    None,
                    None,
                );
                let llm_api_token = self.llm_api_token.clone();
--- a/crates/language_models/src/provider/open_ai.rs
+++ b/crates/language_models/src/provider/open_ai.rs
@ -14,7 +14,7 @@ use language_model::{
    RateLimiter, Role, StopReason, TokenUsage,
 };
 use menu;
-use open_ai::{ImageUrl, Model, ResponseStreamEvent, stream_completion};
+use open_ai::{ImageUrl, Model, ReasoningEffort, ResponseStreamEvent, stream_completion};
 use schemars::JsonSchema;
 use serde::{Deserialize, Serialize};
 use settings::{Settings, SettingsStore};
@ -45,6 +45,7 @@ pub struct AvailableModel {
    pub max_tokens: u64,
    pub max_output_tokens: Option<u64>,
    pub max_completion_tokens: Option<u64>,
+    pub reasoning_effort: Option<ReasoningEffort>,
 }

 pub struct OpenAiLanguageModelProvider {
@ -213,6 +214,7 @@ impl LanguageModelProvider for OpenAiLanguageModelProvider {
                    max_tokens: model.max_tokens,
                    max_output_tokens: model.max_output_tokens,
                    max_completion_tokens: model.max_completion_tokens,
+                    reasoning_effort: model.reasoning_effort.clone(),
                },
            );
        }
@ -301,7 +303,25 @@ impl LanguageModel for OpenAiLanguageModel {
    }

    fn supports_images(&self) -> bool {
-        false
+        use open_ai::Model;
+        match &self.model {
+            Model::FourOmni
+            | Model::FourOmniMini
+            | Model::FourPointOne
+            | Model::FourPointOneMini
+            | Model::FourPointOneNano
+            | Model::Five
+            | Model::FiveMini
+            | Model::FiveNano
+            | Model::O1
+            | Model::O3
+            | Model::O4Mini => true,
+            Model::ThreePointFiveTurbo
+            | Model::Four
+            | Model::FourTurbo
+            | Model::O3Mini
+            | Model::Custom { .. } => false,
+        }
    }

    fn supports_tool_choice(&self, choice: LanguageModelToolChoice) -> bool {
@ -350,7 +370,9 @@ impl LanguageModel for OpenAiLanguageModel {
            request,
            self.model.id(),
            self.model.supports_parallel_tool_calls(),
+            self.model.supports_prompt_cache_key(),
            self.max_output_tokens(),
+            self.model.reasoning_effort(),
        );
        let completions = self.stream_completion(request, cx);
        async move {
@ -365,7 +387,9 @@ pub fn into_open_ai(
    request: LanguageModelRequest,
    model_id: &str,
    supports_parallel_tool_calls: bool,
+    supports_prompt_cache_key: bool,
    max_output_tokens: Option<u64>,
+    reasoning_effort: Option<ReasoningEffort>,
 ) -> open_ai::Request {
    let stream = !model_id.starts_with("o1-");

@ -455,6 +479,11 @@ pub fn into_open_ai(
        } else {
            None
        },
+        prompt_cache_key: if supports_prompt_cache_key {
+            request.thread_id
+        } else {
+            None
+        },
        tools: request
            .tools
            .into_iter()
@ -471,6 +500,7 @@ pub fn into_open_ai(
            LanguageModelToolChoice::Any => open_ai::ToolChoice::Required,
            LanguageModelToolChoice::None => open_ai::ToolChoice::None,
        }),
+        reasoning_effort,
    }
 }

--- a/crates/language_models/src/provider/open_ai_compatible.rs
+++ b/crates/language_models/src/provider/open_ai_compatible.rs
@ -355,7 +355,16 @@ impl LanguageModel for OpenAiCompatibleLanguageModel {
            LanguageModelCompletionError,
        >,
    > {
-        let request = into_open_ai(request, &self.model.name, true, self.max_output_tokens());
+        let supports_parallel_tool_call = true;
+        let supports_prompt_cache_key = false;
+        let request = into_open_ai(
+            request,
+            &self.model.name,
+            supports_parallel_tool_call,
+            supports_prompt_cache_key,
+            self.max_output_tokens(),
+            None,
+        );
        let completions = self.stream_completion(request, cx);
        async move {
            let mapper = OpenAiEventMapper::new();
--- a/crates/language_models/src/provider/vercel.rs
+++ b/crates/language_models/src/provider/vercel.rs
@ -355,7 +355,9 @@ impl LanguageModel for VercelLanguageModel {
            request,
            self.model.id(),
            self.model.supports_parallel_tool_calls(),
+            self.model.supports_prompt_cache_key(),
            self.max_output_tokens(),
+            None,
        );
        let completions = self.stream_completion(request, cx);
        async move {
--- a/crates/language_models/src/provider/x_ai.rs
+++ b/crates/language_models/src/provider/x_ai.rs
@ -359,7 +359,9 @@ impl LanguageModel for XAiLanguageModel {
            request,
            self.model.id(),
            self.model.supports_parallel_tool_calls(),
+            self.model.supports_prompt_cache_key(),
            self.max_output_tokens(),
+            None,
        );
        let completions = self.stream_completion(request, cx);
        async move {