Add configurable low-speed timeout for OpenAI provider (#11668)

This PR adds a setting to allow configuring the low-speed timeout for the Assistant when using the OpenAI provider. The `low_speed_timeout_in_seconds` accepts a number of seconds that the HTTP client can go below a minimum speed limit (currently set to 100 bytes/second) before it times out. ```json { "assistant": { "version": "1", "provider": { "name": "openai", "low_speed_timeout_in_seconds": 60 } }, } ``` This should help the case where the `openai` provider is being used with a local model that requires higher timeouts. Issue: https://github.com/zed-industries/zed/issues/9913 Release Notes: - Added a `low_speed_timeout_in_seconds` setting to the Assistant's OpenAI provider ([#9913](https://github.com/zed-industries/zed/issues/9913)).
2024-05-10 13:19:21 -04:00 · 2024-05-10 13:19:21 -04:00 · 0d26beb91b
commit 0d26beb91b
parent 19994fc190
7 changed files with 59 additions and 9 deletions
--- a/crates/assistant/src/assistant_settings.rs
+++ b/crates/assistant/src/assistant_settings.rs
@ -153,6 +153,8 @@ pub enum AssistantProvider {
        default_model: OpenAiModel,
        #[serde(default = "open_ai_url")]
        api_url: String,
+        #[serde(default)]
+        low_speed_timeout_in_seconds: Option<u64>,
    },
 }

@ -222,12 +224,14 @@ impl AssistantSettingsContent {
                    Some(AssistantProvider::OpenAi {
                        default_model: settings.default_open_ai_model.clone().unwrap_or_default(),
                        api_url: open_ai_api_url.clone(),
+                        low_speed_timeout_in_seconds: None,
                    })
                } else {
                    settings.default_open_ai_model.clone().map(|open_ai_model| {
                        AssistantProvider::OpenAi {
                            default_model: open_ai_model,
                            api_url: open_ai_url(),
+                            low_speed_timeout_in_seconds: None,
                        }
                    })
                },
@ -364,14 +368,17 @@ impl Settings for AssistantSettings {
                        AssistantProvider::OpenAi {
                            default_model,
                            api_url,
+                            low_speed_timeout_in_seconds,
                        },
                        AssistantProvider::OpenAi {
                            default_model: default_model_override,
                            api_url: api_url_override,
+                            low_speed_timeout_in_seconds: low_speed_timeout_in_seconds_override,
                        },
                    ) => {
                        *default_model = default_model_override;
                        *api_url = api_url_override;
+                        *low_speed_timeout_in_seconds = low_speed_timeout_in_seconds_override;
                    }
                    (merged, provider_override) => {
                        *merged = provider_override;
@ -408,7 +415,8 @@ mod tests {
            AssistantSettings::get_global(cx).provider,
            AssistantProvider::OpenAi {
                default_model: OpenAiModel::FourTurbo,
-                api_url: open_ai_url()
+                api_url: open_ai_url(),
+                low_speed_timeout_in_seconds: None,
            }
        );

@ -429,7 +437,8 @@ mod tests {
            AssistantSettings::get_global(cx).provider,
            AssistantProvider::OpenAi {
                default_model: OpenAiModel::FourTurbo,
-                api_url: "test-url".into()
+                api_url: "test-url".into(),
+                low_speed_timeout_in_seconds: None,
            }
        );
        cx.update_global::<SettingsStore, _>(|store, cx| {
@ -448,7 +457,8 @@ mod tests {
            AssistantSettings::get_global(cx).provider,
            AssistantProvider::OpenAi {
                default_model: OpenAiModel::Four,
-                api_url: open_ai_url()
+                api_url: open_ai_url(),
+                low_speed_timeout_in_seconds: None,
            }
        );

--- a/crates/assistant/src/completion_provider.rs
+++ b/crates/assistant/src/completion_provider.rs
@ -18,6 +18,7 @@ use futures::{future::BoxFuture, stream::BoxStream};
 use gpui::{AnyView, AppContext, BorrowAppContext, Task, WindowContext};
 use settings::{Settings, SettingsStore};
 use std::sync::Arc;
+use std::time::Duration;

 pub fn init(client: Arc<Client>, cx: &mut AppContext) {
    let mut settings_version = 0;
@ -33,10 +34,12 @@ pub fn init(client: Arc<Client>, cx: &mut AppContext) {
        AssistantProvider::OpenAi {
            default_model,
            api_url,
+            low_speed_timeout_in_seconds,
        } => CompletionProvider::OpenAi(OpenAiCompletionProvider::new(
            default_model.clone(),
            api_url.clone(),
            client.http_client(),
+            low_speed_timeout_in_seconds.map(Duration::from_secs),
            settings_version,
        )),
    };
@ -51,9 +54,15 @@ pub fn init(client: Arc<Client>, cx: &mut AppContext) {
                    AssistantProvider::OpenAi {
                        default_model,
                        api_url,
+                        low_speed_timeout_in_seconds,
                    },
                ) => {
-                    provider.update(default_model.clone(), api_url.clone(), settings_version);
+                    provider.update(
+                        default_model.clone(),
+                        api_url.clone(),
+                        low_speed_timeout_in_seconds.map(Duration::from_secs),
+                        settings_version,
+                    );
                }
                (
                    CompletionProvider::ZedDotDev(provider),
@ -74,12 +83,14 @@ pub fn init(client: Arc<Client>, cx: &mut AppContext) {
                    AssistantProvider::OpenAi {
                        default_model,
                        api_url,
+                        low_speed_timeout_in_seconds,
                    },
                ) => {
                    *provider = CompletionProvider::OpenAi(OpenAiCompletionProvider::new(
                        default_model.clone(),
                        api_url.clone(),
                        client.http_client(),
+                        low_speed_timeout_in_seconds.map(Duration::from_secs),
                        settings_version,
                    ));
                }
--- a/crates/assistant/src/completion_provider/open_ai.rs
+++ b/crates/assistant/src/completion_provider/open_ai.rs
@ -7,6 +7,7 @@ use futures::{future::BoxFuture, stream::BoxStream, FutureExt, StreamExt};
 use gpui::{AnyView, AppContext, FontStyle, FontWeight, Task, TextStyle, View, WhiteSpace};
 use open_ai::{stream_completion, Request, RequestMessage, Role as OpenAiRole};
 use settings::Settings;
+use std::time::Duration;
 use std::{env, sync::Arc};
 use theme::ThemeSettings;
 use ui::prelude::*;
@ -17,6 +18,7 @@ pub struct OpenAiCompletionProvider {
    api_url: String,
    default_model: OpenAiModel,
    http_client: Arc<dyn HttpClient>,
+    low_speed_timeout: Option<Duration>,
    settings_version: usize,
 }

@ -25,6 +27,7 @@ impl OpenAiCompletionProvider {
        default_model: OpenAiModel,
        api_url: String,
        http_client: Arc<dyn HttpClient>,
+        low_speed_timeout: Option<Duration>,
        settings_version: usize,
    ) -> Self {
        Self {
@ -32,13 +35,21 @@ impl OpenAiCompletionProvider {
            api_url,
            default_model,
            http_client,
+            low_speed_timeout,
            settings_version,
        }
    }

-    pub fn update(&mut self, default_model: OpenAiModel, api_url: String, settings_version: usize) {
+    pub fn update(
+        &mut self,
+        default_model: OpenAiModel,
+        api_url: String,
+        low_speed_timeout: Option<Duration>,
+        settings_version: usize,
+    ) {
        self.default_model = default_model;
        self.api_url = api_url;
+        self.low_speed_timeout = low_speed_timeout;
        self.settings_version = settings_version;
    }

@ -112,9 +123,16 @@ impl OpenAiCompletionProvider {
        let http_client = self.http_client.clone();
        let api_key = self.api_key.clone();
        let api_url = self.api_url.clone();
+        let low_speed_timeout = self.low_speed_timeout;
        async move {
            let api_key = api_key.ok_or_else(|| anyhow!("missing api key"))?;
-            let request = stream_completion(http_client.as_ref(), &api_url, &api_key, request);
+            let request = stream_completion(
+                http_client.as_ref(),
+                &api_url,
+                &api_key,
+                request,
+                low_speed_timeout,
+            );
            let response = request.await?;
            let stream = response
                .filter_map(|response| async move {