AQBot-Desktop
diff --git a/‎src-tauri/crates/agent/src/bridge.rs‎
Lines changed: 2 additions & 0 deletions b/‎src-tauri/crates/agent/src/bridge.rs‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎src-tauri/crates/core/src/db.rs‎
Lines changed: 1 addition & 0 deletions b/‎src-tauri/crates/core/src/db.rs‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src-tauri/crates/core/src/repo/provider_import.rs‎
Lines changed: 1 addition & 0 deletions b/‎src-tauri/crates/core/src/repo/provider_import.rs‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src-tauri/crates/core/src/types.rs‎
Lines changed: 5 additions & 0 deletions b/‎src-tauri/crates/core/src/types.rs‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎src-tauri/crates/providers/src/anthropic.rs‎
Lines changed: 1 addition & 0 deletions b/‎src-tauri/crates/providers/src/anthropic.rs‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src-tauri/crates/providers/src/gemini.rs‎
Lines changed: 1 addition & 0 deletions b/‎src-tauri/crates/providers/src/gemini.rs‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src-tauri/crates/providers/src/openai_compat.rs‎
Lines changed: 79 additions & 1 deletion b/‎src-tauri/crates/providers/src/openai_compat.rs‎
Lines changed: 79 additions & 1 deletion
diff --git a/‎src-tauri/crates/providers/src/openai_responses.rs‎
Lines changed: 3 additions & 0 deletions b/‎src-tauri/crates/providers/src/openai_responses.rs‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎src-tauri/crates/providers/src/reasoning.rs‎
Lines changed: 1 addition & 0 deletions b/‎src-tauri/crates/providers/src/reasoning.rs‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎src-tauri/src/commands/conversations.rs‎
Lines changed: 32 additions & 0 deletions b/‎src-tauri/src/commands/conversations.rs‎
Lines changed: 32 additions & 0 deletions
@@ -244,6 +244,7 @@ fn convert_request(
             .and_then(|overrides| overrides.use_max_completion_tokens),
         thinking_param_style: model_param_overrides
             .and_then(|overrides| overrides.thinking_param_style.clone()),
+        extra_body: model_param_overrides.and_then(|overrides| overrides.extra_body.clone()),
     }
 }
 
@@ -495,6 +496,7 @@ mod tests {
             reasoning_profile: Some("siliconflow_enable_thinking".to_string()),
             reasoning_options: None,
             reasoning_default: None,
+            extra_body: None,
         }
     }
 
 
@@ -149,6 +149,7 @@ fn empty_param_overrides() -> ModelParamOverrides {
         reasoning_profile: None,
         reasoning_options: None,
         reasoning_default: None,
+        extra_body: None,
     }
 }
 
 
@@ -256,6 +256,7 @@ fn empty_param_overrides_for_import(provider_type: &ProviderType) -> Option<Mode
         reasoning_profile: Some(profile),
         reasoning_options: None,
         reasoning_default: None,
+        extra_body: None,
     })
 }
 
 
@@ -269,6 +269,8 @@ pub struct ModelParamOverrides {
     pub reasoning_options: Option<Vec<String>>,
     /// Optional default reasoning option key for this model.
     pub reasoning_default: Option<String>,
+    /// Model-specific extra JSON body fields for OpenAI-compatible chat requests.
+    pub extra_body: Option<serde_json::Map<String, serde_json::Value>>,
 }
 
 // === Conversation & Message ===
@@ -981,6 +983,9 @@ pub struct ChatRequest {
     /// Thinking parameter format: "reasoning_effort" (default) or "enable_thinking" (SiliconFlow).
     #[serde(skip_serializing_if = "Option::is_none")]
     pub thinking_param_style: Option<String>,
+    /// Extra JSON body fields flattened into OpenAI-compatible chat requests.
+    #[serde(skip_serializing_if = "Option::is_none")]
+    pub extra_body: Option<serde_json::Map<String, serde_json::Value>>,
 }
 
 #[derive(Debug, Clone, Serialize, Deserialize)]
 
@@ -405,6 +405,7 @@ mod tests {
             reasoning_profile: Some(reasoning_profile.to_string()),
             use_max_completion_tokens: None,
             thinking_param_style: None,
+            extra_body: None,
         }
     }
 
 
@@ -456,6 +456,7 @@ mod tests {
             reasoning_profile: Some("gemini_thinking_level".to_string()),
             use_max_completion_tokens: None,
             thinking_param_style: None,
+            extra_body: None,
         }
     }
 
 
@@ -132,6 +132,19 @@ struct StreamOptions {
     include_usage: bool,
 }
 
+const RESERVED_EXTRA_BODY_FIELDS: &[&str] = &[
+    "model",
+    "messages",
+    "stream",
+    "stream_options",
+    "tools",
+    "temperature",
+    "top_p",
+    "max_tokens",
+    "max_completion_tokens",
+    "reasoning_effort",
+];
+
 #[derive(Serialize)]
 struct OpenAIMessage {
     role: String,
@@ -727,6 +740,22 @@ fn normalized_max_completion_tokens<P: OpenAICompatPolicy>(
     })
 }
 
+fn merge_model_extra_body(
+    extra: &mut Map<String, Value>,
+    custom: Option<&Map<String, Value>>,
+) {
+    let Some(custom) = custom else {
+        return;
+    };
+
+    for (key, value) in custom {
+        if RESERVED_EXTRA_BODY_FIELDS.contains(&key.as_str()) {
+            continue;
+        }
+        extra.insert(key.clone(), value.clone());
+    }
+}
+
 fn build_request<P: OpenAICompatPolicy>(
     policy: &P,
     request: &ChatRequest,
@@ -740,7 +769,8 @@ fn build_request<P: OpenAICompatPolicy>(
         let effort = r.reasoning_effort.clone()?;
         policy.normalize_reasoning_effort(&r.level, effort)
     });
-    let extra = policy.extra_body_fields(reasoning.as_ref());
+    let mut extra = policy.extra_body_fields(reasoning.as_ref());
+    merge_model_extra_body(&mut extra, request.extra_body.as_ref());
 
     // Use max_completion_tokens only when the model/request contract requires it.
     let use_completion_tokens = policy.use_max_completion_tokens(request);
@@ -838,6 +868,7 @@ mod tests {
             reasoning_profile: None,
             use_max_completion_tokens: None,
             thinking_param_style: None,
+            extra_body: None,
         }
     }
 
@@ -1394,6 +1425,53 @@ mod tests {
         assert!(serialized.get("temperature").is_none());
         assert!(serialized.get("top_p").is_none());
     }
+
+    #[test]
+    fn openai_compat_flattens_model_extra_body_fields() {
+        let mut request = base_chat_request("gpt-4o");
+        request.extra_body = Some(
+            serde_json::json!({
+                "enable_thinking": true,
+                "vendor_options": {
+                    "trace": "enabled"
+                }
+            })
+            .as_object()
+            .expect("object")
+            .clone(),
+        );
+
+        let body = build_request(&OpenAIPolicy, &request, &request.messages, true);
+        let serialized = serde_json::to_value(body).expect("request json");
+
+        assert_eq!(serialized["enable_thinking"], json!(true));
+        assert_eq!(serialized["vendor_options"]["trace"], json!("enabled"));
+        assert!(serialized.get("extra_body").is_none());
+    }
+
+    #[test]
+    fn openai_compat_extra_body_cannot_override_core_fields() {
+        let mut request = base_chat_request("gpt-4o");
+        request.extra_body = Some(
+            serde_json::json!({
+                "model": "other-model",
+                "stream": false,
+                "max_tokens": 1,
+                "enable_thinking": true
+            })
+            .as_object()
+            .expect("object")
+            .clone(),
+        );
+
+        let body = build_request(&OpenAIPolicy, &request, &request.messages, true);
+        let serialized = serde_json::to_value(body).expect("request json");
+
+        assert_eq!(serialized["model"], json!("gpt-4o"));
+        assert_eq!(serialized["stream"], json!(true));
+        assert_eq!(serialized["max_tokens"], json!(300_000));
+        assert_eq!(serialized["enable_thinking"], json!(true));
+    }
 }
 
 #[async_trait]
 
@@ -1176,6 +1176,7 @@ mod tests {
             reasoning_profile: None,
             use_max_completion_tokens: None,
             thinking_param_style: None,
+            extra_body: None,
         };
         let built = build_request(&request, false);
         assert_eq!(built.max_output_tokens, Some(100));
@@ -1204,6 +1205,7 @@ mod tests {
             reasoning_profile: None,
             use_max_completion_tokens: None,
             thinking_param_style: None,
+            extra_body: None,
         };
         let built = build_request(&request, false);
         assert_eq!(built.max_output_tokens, Some(16));
@@ -1230,6 +1232,7 @@ mod tests {
             reasoning_profile: Some("openai_responses_reasoning".to_string()),
             use_max_completion_tokens: None,
             thinking_param_style: None,
+            extra_body: None,
         };
         let built = build_request(&request, false);
         let reasoning = built.reasoning.expect("reasoning should be sent");
 
@@ -198,6 +198,7 @@ mod tests {
             reasoning_profile: None,
             use_max_completion_tokens: None,
             thinking_param_style: None,
+            extra_body: None,
         }
     }
 
 
@@ -314,6 +314,12 @@ fn resolve_chat_model_params(
     }
 }
 
+fn model_extra_body_from_overrides(
+    model_param_overrides: Option<&ModelParamOverrides>,
+) -> Option<serde_json::Map<String, serde_json::Value>> {
+    model_param_overrides.and_then(|params| params.extra_body.clone())
+}
+
 pub(crate) async fn persist_attachments(
     state: &AppState,
     conversation_id: &str,
@@ -1970,6 +1976,7 @@ fn build_search_query_request(
         reasoning_profile: None,
         use_max_completion_tokens,
         thinking_param_style: None,
+        extra_body: None,
     }
 }
 
@@ -2169,6 +2176,7 @@ async fn generate_ai_title_with(
         reasoning_profile: None,
         use_max_completion_tokens,
         thinking_param_style: None,
+        extra_body: None,
     };
 
     let registry = ProviderRegistry::create_default();
@@ -2843,6 +2851,7 @@ fn spawn_stream_task(
                 reasoning_profile: reasoning_profile.clone(),
                 use_max_completion_tokens,
                 thinking_param_style: thinking_param_style.clone(),
+                extra_body: model_extra_body_from_overrides(model_param_overrides.as_ref()),
             };
 
             let mut stream = adapter.chat_stream(&ctx, request);
@@ -4417,6 +4426,7 @@ async fn do_compress(
         reasoning_profile: None,
         use_max_completion_tokens: comp_use_max,
         thinking_param_style: None,
+        extra_body: None,
     };
 
     let ctx = ProviderRequestContext {
@@ -4721,9 +4731,31 @@ mod tests {
             reasoning_profile: None,
             reasoning_options: None,
             reasoning_default: None,
+            extra_body: None,
         }
     }
 
+    #[test]
+    fn model_extra_body_is_cloned_from_model_param_overrides() {
+        let extra_body = serde_json::json!({
+            "enable_thinking": true,
+            "thinking": {
+                "type": "enabled"
+            }
+        })
+        .as_object()
+        .expect("object")
+        .clone();
+        let mut overrides = test_param_overrides(None, None, None);
+        overrides.extra_body = Some(extra_body.clone());
+
+        assert_eq!(
+            model_extra_body_from_overrides(Some(&overrides)),
+            Some(extra_body)
+        );
+        assert_eq!(model_extra_body_from_overrides(None), None);
+    }
+
     fn test_docx_bytes(text: &str) -> Vec<u8> {
         let cursor = Cursor::new(Vec::new());
         let mut archive = zip::ZipWriter::new(cursor);
Original file line number	Diff line number	Diff line change
`@@ -244,6 +244,7 @@ fn convert_request(`
`244`	`244`	`.and_then(\|overrides\| overrides.use_max_completion_tokens),`
`245`	`245`	`thinking_param_style: model_param_overrides`
`246`	`246`	`.and_then(\|overrides\| overrides.thinking_param_style.clone()),`
	`247`	`+ extra_body: model_param_overrides.and_then(\|overrides\| overrides.extra_body.clone()),`
`247`	`248`	`}`
`248`	`249`	`}`
`249`	`250`
`@@ -495,6 +496,7 @@ mod tests {`
`495`	`496`	`reasoning_profile: Some("siliconflow_enable_thinking".to_string()),`
`496`	`497`	`reasoning_options: None,`
`497`	`498`	`reasoning_default: None,`
	`499`	`+ extra_body: None,`
`498`	`500`	`}`
`499`	`501`	`}`
`500`	`502`
Original file line number	Diff line number	Diff line change
`@@ -149,6 +149,7 @@ fn empty_param_overrides() -> ModelParamOverrides {`
`149`	`149`	`reasoning_profile: None,`
`150`	`150`	`reasoning_options: None,`
`151`	`151`	`reasoning_default: None,`
	`152`	`+ extra_body: None,`
`152`	`153`	`}`
`153`	`154`	`}`
`154`	`155`
Original file line number	Diff line number	Diff line change
`@@ -256,6 +256,7 @@ fn empty_param_overrides_for_import(provider_type: &ProviderType) -> Option<Mode`
`256`	`256`	`reasoning_profile: Some(profile),`
`257`	`257`	`reasoning_options: None,`
`258`	`258`	`reasoning_default: None,`
	`259`	`+ extra_body: None,`
`259`	`260`	`})`
`260`	`261`	`}`
`261`	`262`
Original file line number	Diff line number	Diff line change
`@@ -405,6 +405,7 @@ mod tests {`
`405`	`405`	`reasoning_profile: Some(reasoning_profile.to_string()),`
`406`	`406`	`use_max_completion_tokens: None,`
`407`	`407`	`thinking_param_style: None,`
	`408`	`+ extra_body: None,`
`408`	`409`	`}`
`409`	`410`	`}`
`410`	`411`
Original file line number	Diff line number	Diff line change
`@@ -456,6 +456,7 @@ mod tests {`
`456`	`456`	`reasoning_profile: Some("gemini_thinking_level".to_string()),`
`457`	`457`	`use_max_completion_tokens: None,`
`458`	`458`	`thinking_param_style: None,`
	`459`	`+ extra_body: None,`
`459`	`460`	`}`
`460`	`461`	`}`
`461`	`462`
Original file line number	Diff line number	Diff line change
`@@ -198,6 +198,7 @@ mod tests {`
`198`	`198`	`reasoning_profile: None,`
`199`	`199`	`use_max_completion_tokens: None,`
`200`	`200`	`thinking_param_style: None,`
	`201`	`+ extra_body: None,`
`201`	`202`	`}`
`202`	`203`	`}`
`203`	`204`