truefoundry · hganwani-droid · Mar 19, 2026 · cursor · Mar 19, 2026 · cursor
diff --git a/providers/databricks/databricks-claude-3-7-sonnet.yaml b/providers/databricks/databricks-claude-3-7-sonnet.yaml
@@ -2,13 +2,22 @@ costs:
     - input_cost_per_token: 0.000003
       output_cost_per_token: 0.000015
       region: "*"
+deprecationDate: "2026-04-12"
 features:
     - function_calling
     - tool_choice
     - assistant_prefill
 limits:
+    context_window: 200000
     max_input_tokens: 200000
     max_output_tokens: 128000
     max_tokens: 128000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-claude-3-7-sonnet
+thinking: true
diff --git a/providers/databricks/databricks-claude-haiku-4-5.yaml b/providers/databricks/databricks-claude-haiku-4-5.yaml
@@ -6,9 +6,17 @@ features:
     - function_calling
     - tool_choice
     - assistant_prefill
+    - system_messages
 limits:
+    context_window: 200000
     max_input_tokens: 200000
     max_output_tokens: 64000
     max_tokens: 64000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-claude-haiku-4-5
diff --git a/providers/databricks/databricks-claude-opus-4-1.yaml b/providers/databricks/databricks-claude-opus-4-1.yaml
@@ -7,8 +7,16 @@ features:
     - tool_choice
     - assistant_prefill
 limits:
+    context_window: 200000
     max_input_tokens: 200000
     max_output_tokens: 32000
     max_tokens: 32000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-claude-opus-4-1
+thinking: true
diff --git a/providers/databricks/databricks-claude-opus-4-5.yaml b/providers/databricks/databricks-claude-opus-4-5.yaml
@@ -7,8 +7,16 @@ features:
     - tool_choice
     - assistant_prefill
 limits:
+    context_window: 200000
     max_input_tokens: 200000
     max_output_tokens: 64000
     max_tokens: 64000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-claude-opus-4-5
+thinking: true
diff --git a/providers/databricks/databricks-claude-opus-4.yaml b/providers/databricks/databricks-claude-opus-4.yaml
@@ -10,5 +10,12 @@ limits:
     max_input_tokens: 200000
     max_output_tokens: 32000
     max_tokens: 32000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-claude-opus-4
+thinking: true
diff --git a/providers/databricks/databricks-claude-sonnet-4-1.yaml b/providers/databricks/databricks-claude-sonnet-4-1.yaml
@@ -10,5 +10,14 @@ limits:
     max_input_tokens: 200000
     max_output_tokens: 64000
     max_tokens: 64000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-claude-sonnet-4-1
+sources:
+    - https://platform.claude.com/docs/en/docs/about-claude/models
+thinking: true
diff --git a/providers/databricks/databricks-claude-sonnet-4-5.yaml b/providers/databricks/databricks-claude-sonnet-4-5.yaml
@@ -7,8 +7,16 @@ features:
     - tool_choice
     - assistant_prefill
 limits:
+    context_window: 200000
     max_input_tokens: 200000
     max_output_tokens: 64000
     max_tokens: 64000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-claude-sonnet-4-5
+thinking: true
diff --git a/providers/databricks/databricks-claude-sonnet-4.yaml b/providers/databricks/databricks-claude-sonnet-4.yaml
@@ -7,8 +7,16 @@ features:
     - tool_choice
     - assistant_prefill
 limits:
+    context_window: 200000
     max_input_tokens: 200000
     max_output_tokens: 64000
     max_tokens: 64000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-claude-sonnet-4
+thinking: true
diff --git a/providers/databricks/databricks-gemini-2-5-flash.yaml b/providers/databricks/databricks-gemini-2-5-flash.yaml
@@ -6,8 +6,16 @@ features:
     - function_calling
     - tool_choice
 limits:
+    context_window: 1048576
     max_input_tokens: 1048576
     max_output_tokens: 65535
     max_tokens: 65535
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-gemini-2-5-flash
+thinking: true
diff --git a/providers/databricks/databricks-gemini-2-5-pro.yaml b/providers/databricks/databricks-gemini-2-5-pro.yaml
@@ -6,8 +6,19 @@ features:
     - function_calling
     - tool_choice
 limits:
+    context_window: 1048576
     max_input_tokens: 1048576
     max_output_tokens: 65536
     max_tokens: 65536
+modalities:
+    input:
+        - text
+        - image
+        - audio
+        - video
+        - pdf
+    output:
+        - text
 mode: chat
 model: databricks-gemini-2-5-pro
+thinking: true
diff --git a/providers/databricks/databricks-gemma-3-12b.yaml b/providers/databricks/databricks-gemma-3-12b.yaml
@@ -3,8 +3,15 @@ costs:
       output_cost_per_token: 5.e-7
       region: "*"
 limits:
+    context_window: 128000
     max_input_tokens: 128000
     max_output_tokens: 32000
     max_tokens: 32000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-gemma-3-12b
diff --git a/providers/databricks/databricks-gpt-5-1.yaml b/providers/databricks/databricks-gpt-5-1.yaml
@@ -2,9 +2,19 @@ costs:
     - input_cost_per_token: 0.00000125
       output_cost_per_token: 0.00001
       region: "*"
+features:
+    - system_messages
 limits:
+    context_window: 400000
     max_input_tokens: 272000
     max_output_tokens: 128000
     max_tokens: 128000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-gpt-5-1
+thinking: true
diff --git a/providers/databricks/databricks-gpt-5-mini.yaml b/providers/databricks/databricks-gpt-5-mini.yaml
@@ -3,8 +3,15 @@ costs:
       output_cost_per_token: 0.000002
       region: "*"
 limits:
+    context_window: 400000
     max_input_tokens: 272000
     max_output_tokens: 128000
     max_tokens: 128000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-gpt-5-mini
diff --git a/providers/databricks/databricks-gpt-5-nano.yaml b/providers/databricks/databricks-gpt-5-nano.yaml
@@ -2,9 +2,18 @@ costs:
     - input_cost_per_token: 5.e-8
       output_cost_per_token: 4.e-7
       region: "*"
+features:
+    - system_messages
 limits:
+    context_window: 400000
     max_input_tokens: 272000
     max_output_tokens: 128000
     max_tokens: 128000
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-gpt-5-nano
diff --git a/providers/databricks/databricks-gpt-5.yaml b/providers/databricks/databricks-gpt-5.yaml
@@ -2,9 +2,29 @@ costs:
     - input_cost_per_token: 0.00000125
       output_cost_per_token: 0.00001
       region: "*"
+features:
+    - function_calling
+    - system_messages
+    - tool_choice
+    - structured_output
+    - tools
 limits:
+    context_window: 400000
     max_input_tokens: 272000
     max_output_tokens: 128000
     max_tokens: 128000
+messages:
+    options:
+        - system
+        - user
+        - assistant
+        - developer
+modalities:
+    input:
+        - text
+        - image
+    output:
+        - text
 mode: chat
 model: databricks-gpt-5
+thinking: true
diff --git a/providers/databricks/databricks-gpt-oss-120b.yaml b/providers/databricks/databricks-gpt-oss-120b.yaml
@@ -3,8 +3,15 @@ costs:
       output_cost_per_token: 6.e-7
       region: "*"
 limits:
-    max_input_tokens: 131072
-    max_output_tokens: 131072
-    max_tokens: 131072
+    context_window: 128000
+    max_input_tokens: 128000
+    max_output_tokens: 128000
+    max_tokens: 128000
+modalities:
+    input:
+        - text
+    output:
+        - text
 mode: chat
 model: databricks-gpt-oss-120b
+thinking: true
diff --git a/providers/databricks/databricks-gpt-oss-20b.yaml b/providers/databricks/databricks-gpt-oss-20b.yaml
@@ -3,8 +3,11 @@ costs:
       output_cost_per_token: 3.e-7
       region: "*"
 limits:
-    max_input_tokens: 131072
-    max_output_tokens: 131072
-    max_tokens: 131072
+    context_window: 128000
+modalities:
+    input:
+        - text
+    output:
+        - text
 mode: chat
 model: databricks-gpt-oss-20b
diff --git a/providers/databricks/databricks-gte-large-en.yaml b/providers/databricks/databricks-gte-large-en.yaml
@@ -6,5 +6,8 @@ limits:
     max_input_tokens: 8192
     max_tokens: 8192
     output_vector_size: 1024
+modalities:
+    input:
+        - text
 mode: embedding
 model: databricks-gte-large-en
diff --git a/providers/databricks/databricks-llama-2-70b-chat.yaml b/providers/databricks/databricks-llama-2-70b-chat.yaml
@@ -4,6 +4,7 @@ costs:
       region: "*"
 features:
     - tool_choice
+isDeprecated: true
 limits:
     max_input_tokens: 4096
     max_output_tokens: 4096

diff --git a/providers/databricks/databricks-llama-4-maverick.yaml b/providers/databricks/databricks-llama-4-maverick.yaml
@@ -3,10 +3,20 @@ costs:
       output_cost_per_token: 0.0000015
       region: "*"
 features:
+    - function_calling
     - tool_choice
+    - structured_output
 limits:
+    context_window: 128000
     max_input_tokens: 128000
     max_output_tokens: 128000
     max_tokens: 128000
+modalities:
+    input:
+        - text
+    output:
+        - text
 mode: chat
 model: databricks-llama-4-maverick
+sources:
+    - https://docs.databricks.com/aws/en/machine-learning/model-serving/score-foundation-models
diff --git a/providers/databricks/databricks-meta-llama-3-1-405b-instruct.yaml b/providers/databricks/databricks-meta-llama-3-1-405b-instruct.yaml
@@ -4,6 +4,7 @@ costs:
       region: "*"
 features:
     - tool_choice
+isDeprecated: true
 limits:
     max_input_tokens: 128000
     max_output_tokens: 128000

diff --git a/providers/databricks/databricks-meta-llama-3-1-8b-instruct.yaml b/providers/databricks/databricks-meta-llama-3-1-8b-instruct.yaml
@@ -3,8 +3,14 @@ costs:
       output_cost_per_token: 4.5e-7
       region: "*"
 limits:
-    max_input_tokens: 200000
+    context_window: 128000
+    max_input_tokens: 128000
     max_output_tokens: 128000
     max_tokens: 128000
+modalities:
+    input:
+        - text
+    output:
+        - text
 mode: chat
 model: databricks-meta-llama-3-1-8b-instruct
diff --git a/providers/databricks/databricks-meta-llama-3-3-70b-instruct.yaml b/providers/databricks/databricks-meta-llama-3-3-70b-instruct.yaml
@@ -5,8 +5,14 @@ costs:
 features:
     - tool_choice
 limits:
+    context_window: 128000
     max_input_tokens: 128000
     max_output_tokens: 128000
     max_tokens: 128000
+modalities:
+    input:
+        - text
+    output:
+        - text
 mode: chat
 model: databricks-meta-llama-3-3-70b-instruct
diff --git a/providers/databricks/databricks-meta-llama-3-70b-instruct.yaml b/providers/databricks/databricks-meta-llama-3-70b-instruct.yaml
@@ -4,6 +4,7 @@ costs:
       region: "*"
 features:
     - tool_choice
+isDeprecated: true
 limits:
     max_input_tokens: 128000
     max_output_tokens: 128000