mlflow · annzhang-db · Dec 10, 2023 · Nov 20, 2023 · Nov 20, 2023 · Nov 21, 2023
diff --git a/mlflow/tracking/default_experiment/databricks_notebook_experiment_provider.py b/mlflow/tracking/default_experiment/databricks_notebook_experiment_provider.py
@@ -3,55 +3,42 @@
 from mlflow.tracking.client import MlflowClient
 from mlflow.tracking.default_experiment.abstract_context import DefaultExperimentProvider
 from mlflow.utils import databricks_utils
-from mlflow.utils.mlflow_tags import (
-    MLFLOW_EXPERIMENT_SOURCE_ID,
-    MLFLOW_EXPERIMENT_SOURCE_TYPE,
-)
+from mlflow.utils.mlflow_tags import MLFLOW_EXPERIMENT_SOURCE_ID, MLFLOW_EXPERIMENT_SOURCE_TYPE
 
 
 class DatabricksNotebookExperimentProvider(DefaultExperimentProvider):
-    def in_context(self):
-        return databricks_utils.is_in_databricks_notebook()
-
-    def get_experiment_id(self):
-        return databricks_utils.get_notebook_id()
-
-
-class DatabricksRepoNotebookExperimentProvider(DefaultExperimentProvider):
-    _resolved_repo_notebook_experiment_id = None
+    _resolved_notebook_experiment_id = None
 
     def in_context(self):
-        return databricks_utils.is_in_databricks_repo_notebook()
+        return databricks_utils.is_in_databricks_notebook()
 
     def get_experiment_id(self):
-        if DatabricksRepoNotebookExperimentProvider._resolved_repo_notebook_experiment_id:
-            return DatabricksRepoNotebookExperimentProvider._resolved_repo_notebook_experiment_id
+        if DatabricksNotebookExperimentProvider._resolved_notebook_experiment_id:
+            return DatabricksNotebookExperimentProvider._resolved_notebook_experiment_id
 
         source_notebook_id = databricks_utils.get_notebook_id()
         source_notebook_name = databricks_utils.get_notebook_path()
         tags = {
-            MLFLOW_EXPERIMENT_SOURCE_TYPE: "REPO_NOTEBOOK",
             MLFLOW_EXPERIMENT_SOURCE_ID: source_notebook_id,
         }
 
-        # With the presence of the above tags, the following is a get or create in which it will
+        if databricks_utils.is_in_databricks_repo_notebook():
+            tags[MLFLOW_EXPERIMENT_SOURCE_TYPE] = "REPO_NOTEBOOK"
+
+        # With the presence of the source id, the following is a get or create in which it will
         # return the corresponding experiment if one exists for the repo notebook.
-        # If no corresponding experiment exist, it will create a new one and return
-        # the newly created experiment ID.
+        # For non-repo notebooks, it will raise an exception and we will use source_notebook_id
         try:
             experiment_id = MlflowClient().create_experiment(source_notebook_name, None, tags)
         except MlflowException as e:
             if e.error_code == databricks_pb2.ErrorCode.Name(
                 databricks_pb2.INVALID_PARAMETER_VALUE
             ):
-                # If repo notebook experiment creation isn't enabled, fall back to
-                # using the notebook ID
+                # If determined that it is not a repo notebook
                 experiment_id = source_notebook_id
             else:
                 raise e
 
-        DatabricksRepoNotebookExperimentProvider._resolved_repo_notebook_experiment_id = (
-            experiment_id
-        )
+        DatabricksNotebookExperimentProvider._resolved_notebook_experiment_id = experiment_id
 
         return experiment_id
diff --git a/mlflow/tracking/default_experiment/registry.py b/mlflow/tracking/default_experiment/registry.py
@@ -6,17 +6,13 @@
 from mlflow.tracking.default_experiment import DEFAULT_EXPERIMENT_ID
 from mlflow.tracking.default_experiment.databricks_notebook_experiment_provider import (
     DatabricksNotebookExperimentProvider,
-    DatabricksRepoNotebookExperimentProvider,
 )
 
 _logger = logging.getLogger(__name__)
 # Listed below are the list of providers, which are used to provide MLflow Experiment IDs based on
 # the current context where the MLflow client is running when the user has not explicitly set
 # an experiment. The order below is the order in which the these providers are registered.
-_EXPERIMENT_PROVIDERS = (
-    DatabricksRepoNotebookExperimentProvider,
-    DatabricksNotebookExperimentProvider,
-)
+_EXPERIMENT_PROVIDERS = (DatabricksNotebookExperimentProvider,)
 
 
 class DefaultExperimentProviderRegistry:

diff --git a/tests/tracking/default_experiment/test_databricks_notebook_experiment_provider.py b/tests/tracking/default_experiment/test_databricks_notebook_experiment_provider.py
@@ -5,7 +5,6 @@
 from mlflow.protos.databricks_pb2 import INVALID_PARAMETER_VALUE
 from mlflow.tracking.default_experiment.databricks_notebook_experiment_provider import (
     DatabricksNotebookExperimentProvider,
-    DatabricksRepoNotebookExperimentProvider,
 )
 from mlflow.utils.mlflow_tags import MLFLOW_EXPERIMENT_SOURCE_ID, MLFLOW_EXPERIMENT_SOURCE_TYPE
 
@@ -16,24 +15,22 @@ def test_databricks_notebook_default_experiment_in_context():
 
 
 def test_databricks_notebook_default_experiment_id():
-    with mock.patch("mlflow.utils.databricks_utils.get_notebook_id") as patch_notebook_id:
+    with mock.patch.object(
+        MlflowClient,
+        "create_experiment",
+        side_effect=MlflowException(message="Error message", error_code=INVALID_PARAMETER_VALUE),
+    ), mock.patch(
+        "mlflow.utils.databricks_utils.get_notebook_path",
+        return_value="path",
+    ), mock.patch(
+        "mlflow.utils.databricks_utils.get_notebook_id"
+    ) as patch_notebook_id:
         assert (
             DatabricksNotebookExperimentProvider().get_experiment_id()
             == patch_notebook_id.return_value
         )
 
 
-def test_databricks_repo_notebook_default_experiment_in_context():
-    with mock.patch(
-        "mlflow.utils.databricks_utils.is_in_databricks_repo_notebook", return_value=True
-    ):
-        assert DatabricksRepoNotebookExperimentProvider().in_context()
-    with mock.patch(
-        "mlflow.utils.databricks_utils.is_in_databricks_repo_notebook", return_value=False
-    ):
-        assert not DatabricksRepoNotebookExperimentProvider().in_context()
-
-
 def test_databricks_repo_notebook_default_experiment_gets_id_by_request():
     with mock.patch(
         "mlflow.utils.databricks_utils.get_notebook_id",
@@ -44,7 +41,8 @@ def test_databricks_repo_notebook_default_experiment_gets_id_by_request():
     ), mock.patch.object(
         MlflowClient, "create_experiment", return_value="experiment_id"
     ) as create_experiment_mock:
-        returned_id = DatabricksRepoNotebookExperimentProvider().get_experiment_id()
+        DatabricksNotebookExperimentProvider._resolved_notebook_experiment_id = None
+        returned_id = DatabricksNotebookExperimentProvider().get_experiment_id()
         assert returned_id == "experiment_id"
         tags = {MLFLOW_EXPERIMENT_SOURCE_TYPE: "REPO_NOTEBOOK", MLFLOW_EXPERIMENT_SOURCE_ID: 1234}
         create_experiment_mock.assert_called_once_with("/Repos/path", None, tags)
@@ -60,9 +58,9 @@ def test_databricks_repo_notebook_default_experiment_uses_fallback_notebook_id()
     ), mock.patch.object(
         MlflowClient, "create_experiment"
     ) as create_experiment_mock:
-        DatabricksRepoNotebookExperimentProvider._resolved_repo_notebook_experiment_id = None
+        DatabricksNotebookExperimentProvider._resolved_notebook_experiment_id = None
         create_experiment_mock.side_effect = MlflowException(
             message="not enabled", error_code=INVALID_PARAMETER_VALUE
         )
-        returned_id = DatabricksRepoNotebookExperimentProvider().get_experiment_id()
+        returned_id = DatabricksNotebookExperimentProvider().get_experiment_id()
         assert returned_id == 1234