Export model selector defaults + metadata fixes #199

tovbinm · 2018-12-18T06:53:08Z

Related issues

It's impossible to reuse model selector default models & grids without copy pasting them from our code base.
Currently model selector fails to produce model selector summary metadata when one of the models contain a stage with unsupported params (example - The problem of Xgboost #198).

Describe the proposed solution

Expose model selector defaults on all model selectors (binary, multi, regression) to allow reuse.
Skip unsupported metadata values when producing model selector summary metadata.

Describe alternatives you've considered
N/A

…ti, regression) 2. Skip unsupported metadata values when producing model selector summary metadata

codecov · 2018-12-18T07:24:06Z

Codecov Report

Merging #199 into master will decrease coverage by 17.25%.
The diff coverage is 84.33%.

@@             Coverage Diff             @@
##           master     #199       +/-   ##
===========================================
- Coverage    86.4%   69.14%   -17.26%     
===========================================
  Files         309      310        +1     
  Lines       10009    10018        +9     
  Branches      351      526      +175     
===========================================
- Hits         8648     6927     -1721     
- Misses       1361     3091     +1730

Impacted Files	Coverage Δ
...a/com/salesforce/op/utils/spark/RichMetadata.scala	`89.47% <ø> (+1.75%)`	⬆️
...alesforce/op/stages/impl/tuning/DataBalancer.scala	`84.76% <ø> (-11.43%)`	⬇️
...om/salesforce/op/stages/impl/tuning/Splitter.scala	`100% <ø> (ø)`	⬆️
.../salesforce/op/stages/impl/tuning/DataCutter.scala	`93.47% <ø> (-2.18%)`	⬇️
...sforce/op/stages/impl/selector/ModelSelector.scala	`98.07% <100%> (-0.11%)`	⬇️
...op/stages/impl/selector/ModelSelectorFactory.scala	`85.71% <100%> (ø)`	⬆️
...sification/BinaryClassificationModelSelector.scala	`96.42% <100%> (+0.27%)`	⬆️
...op/stages/impl/selector/ModelSelectorSummary.scala	`91.3% <100%> (ø)`	⬆️
...m/salesforce/op/evaluators/EvaluationMetrics.scala	`85.71% <100%> (ø)`	⬆️
...ages/impl/regression/RegressionModelSelector.scala	`96% <100%> (+0.76%)`	⬆️
... and 100 more

Continue to review full report at Codecov.

Legend - Click here to learn more
Δ = absolute <relative> (impact), ø = not affected, ? = missing data
Powered by Codecov. Last update 04cd7ff...ea8fcd7. Read the comment docs.

codecov · 2018-12-18T07:24:06Z

Codecov Report

Merging #199 into master will not change coverage.
The diff coverage is n/a.

@@           Coverage Diff           @@
##           master     #199   +/-   ##
=======================================
  Coverage   86.38%   86.38%           
=======================================
  Files         310      310           
  Lines       10019    10019           
  Branches      550      550           
=======================================
  Hits         8655     8655           
  Misses       1364     1364

Continue to review full report at Codecov.

Legend - Click here to learn more
Δ = absolute <relative> (impact), ø = not affected, ? = missing data
Powered by Codecov. Last update a4e8669...3883a54. Read the comment docs.

…model-selector-improvements

…e/TransmogrifAI into mt/model-selector-improvements

tovbinm · 2019-01-03T04:09:36Z

@kinfaikan please review

kinfaikan · 2019-01-05T00:19:55Z

core/src/main/scala/com/salesforce/op/stages/impl/selector/ModelSelectorFactory.scala

+      }
+      // if models to use has been specified and the models have been specified - filter the models by the names
+      else if (
+        modelTypesToUse.distinct.sortBy(_.entryName) != modelDefaults.modelTypesToUse.distinct.sortBy(_.entryName)


Why not simply use entire modelsAndParameters?

well, because it would yield incorrect results: List(1,2) == List(2,1) // false. That the reason I am dedupping and sorting here.

I was thinking whether it made more sense to ignore modelTypes and modelDefaults when modelsAndParameters was not empty.

1. Expose model selector defaults on all model selectors (binary, mul…

77de476

…ti, regression) 2. Skip unsupported metadata values when producing model selector summary metadata

tovbinm added the ready for review label Dec 18, 2018

tovbinm requested review from Jauntbox and kinfaikan December 18, 2018 06:53

tovbinm requested a review from leahmcguire as a code owner December 18, 2018 06:53

Merge branch 'master' into mt/model-selector-improvements

ea8fcd7

tovbinm added 2 commits December 18, 2018 23:24

Merge branch 'master' of github.com:salesforce/TransmogrifAI into mt/…

39bc9de

…model-selector-improvements

idents

dd2b1d5

tovbinm mentioned this pull request Dec 19, 2018

Automatic Feature Engineering result to DataFrame #194

Closed

tovbinm added 3 commits December 18, 2018 23:38

Merge branch 'mt/model-selector-improvements' of github.com:salesforc…

296db3e

…e/TransmogrifAI into mt/model-selector-improvements

cleanup

a791a4b

test update

a4e8669

kinfaikan reviewed Jan 5, 2019

View reviewed changes

kinfaikan approved these changes Jan 7, 2019

View reviewed changes

Merge branch 'master' into mt/model-selector-improvements

3883a54

tovbinm merged commit 421dc9e into master Jan 7, 2019

tovbinm deleted the mt/model-selector-improvements branch January 7, 2019 21:36

Jauntbox mentioned this pull request Feb 8, 2019

Release 0.5.1 #222

Merged

ericwayman pushed a commit that referenced this pull request Feb 8, 2019

Export model selector defaults + metadata fixes (#199)

c9fdc07

tovbinm mentioned this pull request Jul 11, 2019

Release 3.3.3 #26

Merged

salesforce-cla bot added the cla:signed label Feb 9, 2020

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Export model selector defaults + metadata fixes #199

Export model selector defaults + metadata fixes #199

tovbinm commented Dec 18, 2018 •

edited

Loading

codecov bot commented Dec 18, 2018

codecov bot commented Dec 18, 2018 •

edited

Loading

tovbinm commented Jan 3, 2019

kinfaikan Jan 5, 2019

tovbinm Jan 7, 2019

kinfaikan Jan 7, 2019

Export model selector defaults + metadata fixes #199

Export model selector defaults + metadata fixes #199

Conversation

tovbinm commented Dec 18, 2018 • edited Loading

codecov bot commented Dec 18, 2018

Codecov Report

codecov bot commented Dec 18, 2018 • edited Loading

Codecov Report

tovbinm commented Jan 3, 2019

kinfaikan Jan 5, 2019

Choose a reason for hiding this comment

tovbinm Jan 7, 2019

Choose a reason for hiding this comment

kinfaikan Jan 7, 2019

Choose a reason for hiding this comment

tovbinm commented Dec 18, 2018 •

edited

Loading

codecov bot commented Dec 18, 2018 •

edited

Loading