JohnSnowLabs · JulesBelveze · Aug 2, 2023 · Jul 29, 2023 · Jul 29, 2023 · Jul 29, 2023
diff --git a/langtest/langtest.py b/langtest/langtest.py
@@ -412,6 +412,7 @@ def report(
         self,
         format: str = "dataframe",
         save_dir: str = None,
+        mlflow_tracking: bool = False,
     ) -> pd.DataFrame:
         """Generate a report of the test results.
 
@@ -488,6 +489,70 @@ def report(
 
             self.df_report = df_report.fillna("-")
 
+            if mlflow_tracking:
+                try:
+                    import mlflow
+                except ModuleNotFoundError:
+                    print("mlflow package not found. Install mlflow first")
+
+                import datetime
+
+                experiment_name = (
+                    self._actual_model
+                    if isinstance(self._actual_model, str)
+                    else self._actual_model.__class__.__module__
+                )
+
+                # Get the experiment
+                experiment = mlflow.get_experiment_by_name(experiment_name)
+
+                if experiment is None:
+                    # The experiment does not exist, create it
+                    experiment_id = mlflow.create_experiment(experiment_name)
+                else:
+                    # The experiment exists, get its ID
+                    experiment_id = experiment.experiment_id
+
+                current_datetime = datetime.datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
+                mlflow.start_run(
+                    run_name=self.task + "_testing_" + current_datetime,
+                    experiment_id=experiment_id,
+                )
+
+                df_report.apply(
+                    lambda row: mlflow.log_metric(
+                        row["test_type"] + "_pass_rate",
+                        float(row["pass_rate"].rstrip("%")) / 100,
+                    ),
+                    axis=1,
+                )
+                df_report.apply(
+                    lambda row: mlflow.log_metric(
+                        row["test_type"] + "_min_pass_rate",
+                        float(row["minimum_pass_rate"].rstrip("%")) / 100,
+                    ),
+                    axis=1,
+                )
+                df_report.apply(
+                    lambda row: mlflow.log_metric(
+                        row["test_type"] + "_pass_status", 1 if row["pass"] else 0
+                    ),
+                    axis=1,
+                )
+                df_report.apply(
+                    lambda row: mlflow.log_metric(
+                        row["test_type"] + "_pass_count", row["pass_count"]
+                    ),
+                    axis=1,
+                )
+                df_report.apply(
+                    lambda row: mlflow.log_metric(
+                        row["test_type"] + "_fail_count", row["fail_count"]
+                    ),
+                    axis=1,
+                )
+                mlflow.end_run()
+
             if format == "dataframe":
                 return self.df_report
             elif format == "dict":
@@ -562,6 +627,55 @@ def report(
 
                 df_report = df_report.reset_index(drop=True)
                 df_report = df_report.fillna("-")
+                if mlflow_tracking:
+                    try:
+                        import mlflow
+                    except ModuleNotFoundError:
+                        print("mlflow package not found. Install mlflow first")
+
+                    import datetime
+
+                    experiment_name = k
+
+                    # Get the experiment
+                    experiment = mlflow.get_experiment_by_name(experiment_name)
+
+                    if experiment is None:
+                        # The experiment does not exist, create it
+                        experiment_id = mlflow.create_experiment(experiment_name)
+                    else:
+                        # The experiment exists, get its ID
+                        experiment_id = experiment.experiment_id
+
+                    current_datetime = datetime.datetime.now().strftime(
+                        "%Y-%m-%d_%H-%M-%S"
+                    )
+                    mlflow.start_run(
+                        run_name=self.task + "_testing_" + current_datetime,
+                        experiment_id=experiment_id,
+                    )
+
+                    df_report.apply(
+                        lambda row: mlflow.log_metric(
+                            row["test_type"] + "_pass_rate",
+                            float(row["pass_rate"].rstrip("%")) / 100,
+                        ),
+                        axis=1,
+                    )
+                    df_report.apply(
+                        lambda row: mlflow.log_metric(
+                            row["test_type"] + "_min_pass_rate",
+                            float(row["minimum_pass_rate"].rstrip("%")) / 100,
+                        ),
+                        axis=1,
+                    )
+                    df_report.apply(
+                        lambda row: mlflow.log_metric(
+                            row["test_type"] + "_pass_status", 1 if row["pass"] else 0
+                        ),
+                        axis=1,
+                    )
+                    mlflow.end_run()
 
                 df_final_report = pd.concat([df_final_report, df_report])