Increase rate limits for computing embeddings (#11326)

- Also, remove the rate limit for getting cached embeddings entirely. Release Notes: - N/A
2024-05-02 16:36:45 -07:00 · 2024-05-02 16:36:45 -07:00 · b58bf64f0a
commit b58bf64f0a
parent 47b38a0428
1 changed files with 1 additions and 25 deletions
--- a/crates/collab/src/rpc.rs
+++ b/crates/collab/src/rpc.rs
@ -4501,7 +4501,7 @@ impl RateLimit for ComputeEmbeddingsRateLimit {
        std::env::var("EMBED_TEXTS_RATE_LIMIT_PER_HOUR")
            .ok()
            .and_then(|v| v.parse().ok())
-            .unwrap_or(120) // Picked arbitrarily
+            .unwrap_or(5000) // Picked arbitrarily
    }
    fn refill_duration() -> chrono::Duration {
@ -4573,25 +4573,6 @@ async fn compute_embeddings(
    Ok(())
 }
 struct GetCachedEmbeddingsRateLimit;
 impl RateLimit for GetCachedEmbeddingsRateLimit {
    fn capacity() -> usize {
        std::env::var("EMBED_TEXTS_RATE_LIMIT_PER_HOUR")
            .ok()
            .and_then(|v| v.parse().ok())
            .unwrap_or(120) // Picked arbitrarily
    }
    fn refill_duration() -> chrono::Duration {
        chrono::Duration::hours(1)
    }
    fn db_name() -> &'static str {
        "get-cached-embeddings"
    }
 }
 async fn get_cached_embeddings(
    request: proto::GetCachedEmbeddings,
    response: Response<proto::GetCachedEmbeddings>,
@ -4599,11 +4580,6 @@ async fn get_cached_embeddings(
 ) -> Result<()> {
    authorize_access_to_language_models(&session).await?;
    session
        .rate_limiter
        .check::<GetCachedEmbeddingsRateLimit>(session.user_id())
        .await?;
    let db = session.db().await;
    let embeddings = db.get_embeddings(&request.model, &request.digests).await?;