fix: GenAI SDK client - Breaking Change: Remove the following types from vertexai.types and depend on these types from the Google GenAI SDK via google.genai.types - ComputationBasedMetricType, FunctionResponseScheduling, MediaResolution, Outcome, PairwiseChoice, RubricContentType, Blob, CodeExecutionResult, ExecutableCode, FileData, Part, PartMediaResolution, VideoMetadata, FunctionCall, FunctionResponse, FunctionResponseBlob, FunctionResponseFileData, FunctionResponsePart, PartialArg, ComputationBasedMetricSpec, LLMBasedMetricSpec, PredefinedMetricSpec, RubricGenerationSpec, BleuMetricValue, CustomOutput, ExactMatchMetricValue, PairwiseMetricResult, PointwiseMetricResult, RawOutput, RougeMetricValue, BigQuerySource, GcsSource, ModelArmorConfig

sararob · copybara-github · commit 97bea5f2af5f · 2026-03-18T16:16:49.000-07:00
PiperOrigin-RevId: 885534243
diff --git a/.kokoro/presubmit/presubmit.cfg b/.kokoro/presubmit/presubmit.cfg
@@ -1,11 +1,11 @@
 # Format: //devtools/kokoro/config/proto/build.proto
 
 # Run all sessions except system tests and docs builds
-# This only runs unit tests for Python 3.9 since unit tests are required for `cover` to run
+# This only runs unit tests for Python 3.10 since unit tests are required for `cover` to run
 # Other Python version unit tests are run separately
 env_vars: {
     key: "NOX_SESSION"
-    value: "unit-3.9 lint lint_setup_py blacken cover"
+    value: "unit-3.10 lint lint_setup_py blacken cover"
 }
 
 # Run unit tests in parallel, splitting up by file
diff --git a/tests/unit/vertexai/genai/replays/test_batch_evaluate.py b/tests/unit/vertexai/genai/replays/test_batch_evaluate.py
@@ -18,11 +18,12 @@
 
 from tests.unit.vertexai.genai.replays import pytest_helper
 from vertexai._genai import types
+from google.genai import types as genai_types
 
 
 def test_batch_eval(client):
     eval_dataset = types.EvaluationDataset(
-        gcs_source=types.GcsSource(
+        gcs_source=genai_types.GcsSource(
             uris=["gs://genai-eval-sdk-replay-test/test_data/inference_results.jsonl"]
         )
     )
@@ -52,7 +53,7 @@ def test_batch_eval(client):
 @pytest.mark.asyncio
 async def test_batch_eval_async(client):
     eval_dataset = types.EvaluationDataset(
-        gcs_source=types.GcsSource(
+        gcs_source=genai_types.GcsSource(
             uris=["gs://genai-eval-sdk-replay-test/test_data/inference_results.jsonl"]
         )
     )
diff --git a/tests/unit/vertexai/genai/replays/test_create_agent_engine_a2a_task.py b/tests/unit/vertexai/genai/replays/test_create_agent_engine_a2a_task.py
@@ -16,6 +16,7 @@
 
 from tests.unit.vertexai.genai.replays import pytest_helper
 from vertexai._genai import types
+from google.genai import types as genai_types
 import pytest
 
 
@@ -44,7 +45,7 @@ def test_create_simple_a2a_task(client):
                     role="user",
                     message_id="message123",
                     parts=[
-                        types.Part(
+                        genai_types.Part(
                             text="hello123",
                         )
                     ],
@@ -60,7 +61,7 @@ def test_create_simple_a2a_task(client):
                         display_name="display_name123",
                         description="description123",
                         parts=[
-                            types.Part(
+                            genai_types.Part(
                                 text="hello456",
                             )
                         ],
@@ -125,7 +126,7 @@ async def test_create_simple_a2a_task_async(client):
                     role="user",
                     message_id="message123",
                     parts=[
-                        types.Part(
+                        genai_types.Part(
                             text="hello123",
                         )
                     ],
@@ -141,7 +142,7 @@ async def test_create_simple_a2a_task_async(client):
                         display_name="display_name123",
                         description="description123",
                         parts=[
-                            types.Part(
+                            genai_types.Part(
                                 text="hello456",
                             )
                         ],
diff --git a/tests/unit/vertexai/genai/replays/test_create_evaluation_run.py b/tests/unit/vertexai/genai/replays/test_create_evaluation_run.py
@@ -24,23 +24,23 @@
 GENERAL_QUALITY_METRIC = types.EvaluationRunMetric(
     metric="general_quality_v1",
     metric_config=types.UnifiedMetric(
-        predefined_metric_spec=types.PredefinedMetricSpec(
+        predefined_metric_spec=genai_types.PredefinedMetricSpec(
             metric_spec_name="general_quality_v1",
         )
     ),
 )
 FINAL_RESPONSE_QUALITY_METRIC = types.EvaluationRunMetric(
     metric="final_response_quality_v1",
     metric_config=types.UnifiedMetric(
-        predefined_metric_spec=types.PredefinedMetricSpec(
+        predefined_metric_spec=genai_types.PredefinedMetricSpec(
             metric_spec_name="final_response_quality_v1",
         )
     ),
 )
 LLM_METRIC = types.EvaluationRunMetric(
     metric="llm_metric",
     metric_config=types.UnifiedMetric(
-        llm_based_metric_spec=types.LLMBasedMetricSpec(
+        llm_based_metric_spec=genai_types.LLMBasedMetricSpec(
             metric_prompt_template=(
                 "\nEvaluate the fluency of the response. Provide a score from 1-5."
             )
@@ -50,16 +50,16 @@
 EXACT_MATCH_COMPUTATION_BASED_METRIC = types.EvaluationRunMetric(
     metric="exact_match",
     metric_config=types.UnifiedMetric(
-        computation_based_metric_spec=types.ComputationBasedMetricSpec(
-            type=types.ComputationBasedMetricType.EXACT_MATCH,
+        computation_based_metric_spec=genai_types.ComputationBasedMetricSpec(
+            type=genai_types.ComputationBasedMetricType.EXACT_MATCH,
         )
     ),
 )
 BLEU_COMPUTATION_BASED_METRIC = types.EvaluationRunMetric(
     metric="exact_match_2",
     metric_config=types.UnifiedMetric(
-        computation_based_metric_spec=types.ComputationBasedMetricSpec(
-            type=types.ComputationBasedMetricType.BLEU,
+        computation_based_metric_spec=genai_types.ComputationBasedMetricSpec(
+            type=genai_types.ComputationBasedMetricType.BLEU,
             parameters={"use_effective_order": True},
         )
     ),
diff --git a/tests/unit/vertexai/genai/replays/test_custom_code_execution_metric.py b/tests/unit/vertexai/genai/replays/test_custom_code_execution_metric.py
@@ -16,6 +16,7 @@
 
 from tests.unit.vertexai.genai.replays import pytest_helper
 from vertexai._genai import types
+from google.genai import types as genai_types
 import pandas as pd
 
 
@@ -84,7 +85,7 @@ def evaluate(instance):
     )
 
     eval_dataset = types.EvaluationDataset(
-        gcs_source=types.GcsSource(
+        gcs_source=genai_types.GcsSource(
             uris=["gs://genai-eval-sdk-replay-test/test_data/inference_results.jsonl"]
         ),
     )
diff --git a/tests/unit/vertexai/genai/replays/test_internal_generate_rubrics.py b/tests/unit/vertexai/genai/replays/test_internal_generate_rubrics.py
@@ -16,7 +16,6 @@
 
 
 from tests.unit.vertexai.genai.replays import pytest_helper
-from vertexai._genai import types
 from google.genai import types as genai_types
 
 _TEST_RUBRIC_GENERATION_PROMPT = """SPECIAL INSTRUCTION: think silently. Silent thinking token budget: 16384.
@@ -157,7 +156,7 @@ def test_internal_method_generate_rubrics(client):
     ]
     response = client.evals._generate_rubrics(
         contents=test_contents,
-        rubric_generation_spec=types.RubricGenerationSpec(
+        rubric_generation_spec=genai_types.RubricGenerationSpec(
             prompt_template=_TEST_RUBRIC_GENERATION_PROMPT,
         ),
     )
diff --git a/tests/unit/vertexai/genai/test_evals.py b/tests/unit/vertexai/genai/test_evals.py
@@ -136,21 +136,19 @@ def mock_evaluate_instances_side_effect(*args, **kwargs):
                 return vertexai_genai_types.EvaluateInstancesResponse(
                     exact_match_results=vertexai_genai_types.ExactMatchResults(
                         exact_match_metric_values=[
-                            vertexai_genai_types.ExactMatchMetricValue(score=1.0)
+                            genai_types.ExactMatchMetricValue(score=1.0)
                         ]
                     )
                 )
             elif "rouge_input" in metric_config:
                 return vertexai_genai_types.EvaluateInstancesResponse(
                     rouge_results=vertexai_genai_types.RougeResults(
-                        rouge_metric_values=[
-                            vertexai_genai_types.RougeMetricValue(score=0.8)
-                        ]
+                        rouge_metric_values=[genai_types.RougeMetricValue(score=0.8)]
                     )
                 )
             elif "pointwise_metric_input" in metric_config:
                 return vertexai_genai_types.EvaluateInstancesResponse(
-                    pointwise_metric_result=vertexai_genai_types.PointwiseMetricResult(
+                    pointwise_metric_result=genai_types.PointwiseMetricResult(
                         score=0.9, explanation="Mocked LLM explanation"
                     )
                 )
@@ -678,7 +676,7 @@ def test_inference_with_gcs_destination(
             inference_result.eval_dataset_df, expected_df_to_save
         )
         assert inference_result.candidate_name == "gemini-pro"
-        assert inference_result.gcs_source == vertexai_genai_types.GcsSource(
+        assert inference_result.gcs_source == genai_types.GcsSource(
             uris=[expected_gcs_path]
         )
 
@@ -5227,7 +5225,7 @@ def test_execute_evaluation_with_agent_info(
         input_dataset = vertexai_genai_types.EvaluationDataset(
             eval_dataset_df=dataset_df
         )
-        predefined_metric = vertexai_genai_types.PredefinedMetricSpec(
+        predefined_metric = genai_types.PredefinedMetricSpec(
             metric_spec_name="tool_search_validity"
         )
         tool = {
@@ -5825,7 +5823,7 @@ def test_execute_evaluation_deduplicates_candidate_names(
             vertexai_genai_types.EvaluateInstancesResponse(
                 exact_match_results=vertexai_genai_types.ExactMatchResults(
                     exact_match_metric_values=[
-                        vertexai_genai_types.ExactMatchMetricValue(score=1.0)
+                        genai_types.ExactMatchMetricValue(score=1.0)
                     ]
                 )
             )
diff --git a/vertexai/_genai/_evals_common.py b/vertexai/_genai/_evals_common.py
@@ -1215,7 +1215,9 @@ def _execute_inference(
                     file_type="jsonl",
                 )
                 logger.info("Results saved to GCS: %s", full_dest_path)
-                evaluation_dataset.gcs_source = types.GcsSource(uris=[full_dest_path])
+                evaluation_dataset.gcs_source = genai_types.GcsSource(
+                    uris=[full_dest_path]
+                )
             else:
                 results_df.to_json(full_dest_path, orient="records", lines=True)
                 logger.info("Results saved locally to: %s", full_dest_path)
@@ -1349,8 +1351,8 @@ def _resolve_evaluation_run_metrics(
                     resolved_metrics_list.append(
                         types.EvaluationRunMetric(
                             metric=resolved_metric.name,
-                            metric_config=types.UnifiedMetric(
-                                predefined_metric_spec=types.PredefinedMetricSpec(
+                            metric_config=genai_types.UnifiedMetric(
+                                predefined_metric_spec=genai_types.PredefinedMetricSpec(
                                     metric_spec_name=resolved_metric.name,
                                 )
                             ),
@@ -1390,8 +1392,8 @@ def _resolve_evaluation_run_metrics(
                         resolved_metrics_list.append(
                             types.EvaluationRunMetric(
                                 metric=resolved_metric.name,
-                                metric_config=types.UnifiedMetric(
-                                    predefined_metric_spec=types.PredefinedMetricSpec(
+                                metric_config=genai_types.UnifiedMetric(
+                                    predefined_metric_spec=genai_types.PredefinedMetricSpec(
                                         metric_spec_name=resolved_metric.name,
                                     )
                                 ),
diff --git a/vertexai/_genai/evals.py b/vertexai/_genai/evals.py
@@ -575,9 +575,7 @@ def _GenerateInstanceRubricsRequest_to_vertex(
         setv(
             to_object,
             ["rubricGenerationSpec"],
-            _RubricGenerationSpec_to_vertex(
-                getv(from_object, ["rubric_generation_spec"]), to_object
-            ),
+            getv(from_object, ["rubric_generation_spec"]),
         )
 
     if getv(from_object, ["config"]) is not None:
@@ -768,37 +766,9 @@ def _RubricBasedMetricSpec_to_vertex(
         setv(
             to_object,
             ["rubricGenerationSpec"],
-            _RubricGenerationSpec_to_vertex(
-                getv(from_object, ["rubric_generation_spec"]), to_object
-            ),
-        )
-
-    return to_object
-
-
-def _RubricGenerationSpec_to_vertex(
-    from_object: Union[dict[str, Any], object],
-    parent_object: Optional[dict[str, Any]] = None,
-) -> dict[str, Any]:
-    to_object: dict[str, Any] = {}
-    if getv(from_object, ["prompt_template"]) is not None:
-        setv(to_object, ["promptTemplate"], getv(from_object, ["prompt_template"]))
-
-    if getv(from_object, ["rubric_content_type"]) is not None:
-        setv(
-            to_object, ["rubricContentType"], getv(from_object, ["rubric_content_type"])
+            getv(from_object, ["rubric_generation_spec"]),
         )
 
-    if getv(from_object, ["rubric_type_ontology"]) is not None:
-        setv(
-            to_object,
-            ["rubricTypeOntology"],
-            getv(from_object, ["rubric_type_ontology"]),
-        )
-
-    if getv(from_object, ["generator_model_config"]) is not None:
-        setv(to_object, ["model_config"], getv(from_object, ["generator_model_config"]))
-
     return to_object
 
 
@@ -1236,9 +1206,9 @@ def _generate_rubrics(
         *,
         contents: list[genai_types.ContentOrDict],
         predefined_rubric_generation_spec: Optional[
-            types.PredefinedMetricSpecOrDict
+            genai_types.PredefinedMetricSpecOrDict
         ] = None,
-        rubric_generation_spec: Optional[types.RubricGenerationSpecOrDict] = None,
+        rubric_generation_spec: Optional[genai_types.RubricGenerationSpecOrDict] = None,
         config: Optional[types.RubricGenerationConfigOrDict] = None,
         metric_resource_name: Optional[str] = None,
     ) -> types.GenerateInstanceRubricsResponse:
@@ -2009,7 +1979,7 @@ def generate_rubrics(
                     "Could not determine metric_spec_name from predefined_spec_name"
                 )
 
-            predefined_spec = types.PredefinedMetricSpec(
+            predefined_spec = genai_types.PredefinedMetricSpec(
                 metric_spec_name=actual_predefined_spec_name,
                 metric_spec_parameters=metric_spec_parameters,
             )
@@ -2025,7 +1995,7 @@ def generate_rubrics(
                 "generator_model_config": generator_model_config,
             }
             spec_dict = {k: v for k, v in spec_dict.items() if v is not None}
-            rubric_gen_spec = types.RubricGenerationSpec.model_validate(spec_dict)
+            rubric_gen_spec = genai_types.RubricGenerationSpec.model_validate(spec_dict)
         else:
             raise ValueError(
                 "Either metric, predefined_spec_name or prompt_template must be provided."
@@ -2758,9 +2728,9 @@ async def _generate_rubrics(
         *,
         contents: list[genai_types.ContentOrDict],
         predefined_rubric_generation_spec: Optional[
-            types.PredefinedMetricSpecOrDict
+            genai_types.PredefinedMetricSpecOrDict
         ] = None,
-        rubric_generation_spec: Optional[types.RubricGenerationSpecOrDict] = None,
+        rubric_generation_spec: Optional[genai_types.RubricGenerationSpecOrDict] = None,
         config: Optional[types.RubricGenerationConfigOrDict] = None,
         metric_resource_name: Optional[str] = None,
     ) -> types.GenerateInstanceRubricsResponse:
diff --git a/vertexai/_genai/types/__init__.py b/vertexai/_genai/types/__init__.py
diff --git a/vertexai/_genai/types/common.py b/vertexai/_genai/types/common.py

Original file line number	Diff line number	Diff line change
`@@ -18,11 +18,12 @@`
`18`	`18`
`19`	`19`	`from tests.unit.vertexai.genai.replays import pytest_helper`
`20`	`20`	`from vertexai._genai import types`
	`21`	`+from google.genai import types as genai_types`
`21`	`22`
`22`	`23`
`23`	`24`	`def test_batch_eval(client):`
`24`	`25`	`eval_dataset = types.EvaluationDataset(`
`25`		`- gcs_source=types.GcsSource(`
	`26`	`+ gcs_source=genai_types.GcsSource(`
`26`	`27`	`uris=["gs://genai-eval-sdk-replay-test/test_data/inference_results.jsonl"]`
`27`	`28`	`)`
`28`	`29`	`)`
`@@ -52,7 +53,7 @@ def test_batch_eval(client):`
`52`	`53`	`@pytest.mark.asyncio`
`53`	`54`	`async def test_batch_eval_async(client):`
`54`	`55`	`eval_dataset = types.EvaluationDataset(`
`55`		`- gcs_source=types.GcsSource(`
	`56`	`+ gcs_source=genai_types.GcsSource(`
`56`	`57`	`uris=["gs://genai-eval-sdk-replay-test/test_data/inference_results.jsonl"]`
`57`	`58`	`)`
`58`	`59`	`)`
Original file line number	Diff line number	Diff line change
`@@ -16,6 +16,7 @@`
`16`	`16`
`17`	`17`	`from tests.unit.vertexai.genai.replays import pytest_helper`
`18`	`18`	`from vertexai._genai import types`
	`19`	`+from google.genai import types as genai_types`
`19`	`20`	`import pandas as pd`
`20`	`21`
`21`	`22`
`@@ -84,7 +85,7 @@ def evaluate(instance):`
`84`	`85`	`)`
`85`	`86`
`86`	`87`	`eval_dataset = types.EvaluationDataset(`
`87`		`- gcs_source=types.GcsSource(`
	`88`	`+ gcs_source=genai_types.GcsSource(`
`88`	`89`	`uris=["gs://genai-eval-sdk-replay-test/test_data/inference_results.jsonl"]`
`89`	`90`	`),`
`90`	`91`	`)`
Original file line number	Diff line number	Diff line change
`@@ -16,7 +16,6 @@`
`16`	`16`
`17`	`17`
`18`	`18`	`from tests.unit.vertexai.genai.replays import pytest_helper`
`19`		`-from vertexai._genai import types`
`20`	`19`	`from google.genai import types as genai_types`
`21`	`20`
`22`	`21`	`_TEST_RUBRIC_GENERATION_PROMPT = """SPECIAL INSTRUCTION: think silently. Silent thinking token budget: 16384.`
`@@ -157,7 +156,7 @@ def test_internal_method_generate_rubrics(client):`
`157`	`156`	`]`
`158`	`157`	`response = client.evals._generate_rubrics(`
`159`	`158`	`contents=test_contents,`
`160`		`- rubric_generation_spec=types.RubricGenerationSpec(`
	`159`	`+ rubric_generation_spec=genai_types.RubricGenerationSpec(`
`161`	`160`	`prompt_template=_TEST_RUBRIC_GENERATION_PROMPT,`
`162`	`161`	`),`
`163`	`162`	`)`
Original file line number	Diff line number	Diff line change
`@@ -136,21 +136,19 @@ def mock_evaluate_instances_side_effect(args, *kwargs):`
`136`	`136`	`return vertexai_genai_types.EvaluateInstancesResponse(`
`137`	`137`	`exact_match_results=vertexai_genai_types.ExactMatchResults(`
`138`	`138`	`exact_match_metric_values=[`
`139`		`- vertexai_genai_types.ExactMatchMetricValue(score=1.0)`
	`139`	`+ genai_types.ExactMatchMetricValue(score=1.0)`
`140`	`140`	`]`
`141`	`141`	`)`
`142`	`142`	`)`
`143`	`143`	`elif "rouge_input" in metric_config:`
`144`	`144`	`return vertexai_genai_types.EvaluateInstancesResponse(`
`145`	`145`	`rouge_results=vertexai_genai_types.RougeResults(`
`146`		`- rouge_metric_values=[`
`147`		`- vertexai_genai_types.RougeMetricValue(score=0.8)`
`148`		`- ]`
	`146`	`+ rouge_metric_values=[genai_types.RougeMetricValue(score=0.8)]`
`149`	`147`	`)`
`150`	`148`	`)`
`151`	`149`	`elif "pointwise_metric_input" in metric_config:`
`152`	`150`	`return vertexai_genai_types.EvaluateInstancesResponse(`
`153`		`- pointwise_metric_result=vertexai_genai_types.PointwiseMetricResult(`
	`151`	`+ pointwise_metric_result=genai_types.PointwiseMetricResult(`
`154`	`152`	`score=0.9, explanation="Mocked LLM explanation"`
`155`	`153`	`)`
`156`	`154`	`)`
`@@ -678,7 +676,7 @@ def test_inference_with_gcs_destination(`
`678`	`676`	`inference_result.eval_dataset_df, expected_df_to_save`
`679`	`677`	`)`
`680`	`678`	`assert inference_result.candidate_name == "gemini-pro"`
`681`		`- assert inference_result.gcs_source == vertexai_genai_types.GcsSource(`
	`679`	`+ assert inference_result.gcs_source == genai_types.GcsSource(`
`682`	`680`	`uris=[expected_gcs_path]`
`683`	`681`	`)`
`684`	`682`
`@@ -5227,7 +5225,7 @@ def test_execute_evaluation_with_agent_info(`
`5227`	`5225`	`input_dataset = vertexai_genai_types.EvaluationDataset(`
`5228`	`5226`	`eval_dataset_df=dataset_df`
`5229`	`5227`	`)`
`5230`		`- predefined_metric = vertexai_genai_types.PredefinedMetricSpec(`
	`5228`	`+ predefined_metric = genai_types.PredefinedMetricSpec(`
`5231`	`5229`	`metric_spec_name="tool_search_validity"`
`5232`	`5230`	`)`
`5233`	`5231`	`tool = {`
`@@ -5825,7 +5823,7 @@ def test_execute_evaluation_deduplicates_candidate_names(`
`5825`	`5823`	`vertexai_genai_types.EvaluateInstancesResponse(`
`5826`	`5824`	`exact_match_results=vertexai_genai_types.ExactMatchResults(`
`5827`	`5825`	`exact_match_metric_values=[`
`5828`		`- vertexai_genai_types.ExactMatchMetricValue(score=1.0)`
	`5826`	`+ genai_types.ExactMatchMetricValue(score=1.0)`
`5829`	`5827`	`]`
`5830`	`5828`	`)`
`5831`	`5829`	`)`