scikit-learn · glemaitre · Dec 24, 2021 · Dec 15, 2021 · Dec 15, 2021 · Dec 20, 2021
diff --git a/doc/whats_new/v1.0.rst b/doc/whats_new/v1.0.rst
@@ -35,6 +35,12 @@ Changelog
   and :class:`decomposition.MiniBatchSparsePCA` to be convex and match the referenced
   article. :pr:`19210` by :user:`Jérémie du Boisberranger <jeremiedbb>`.
 
+:mod:`sklearn.feature_selection`
+................................
+
+- |Fix| Fixed :class:`feature_selection.SelectFromModel` to improve support
+  for estimators that set `feature_names_in_`. :pr:`21991` by `Thomas Fan`_.
+
 :mod:`sklearn.metrics`
 ......................
 

diff --git a/sklearn/feature_selection/_from_model.py b/sklearn/feature_selection/_from_model.py
@@ -265,8 +265,12 @@ def fit(self, X, y=None, **fit_params):
             raise NotFittedError("Since 'prefit=True', call transform directly")
         self.estimator_ = clone(self.estimator)
         self.estimator_.fit(X, y, **fit_params)
+
         if hasattr(self.estimator_, "feature_names_in_"):
             self.feature_names_in_ = self.estimator_.feature_names_in_
+        else:
+            self._check_feature_names(X, reset=True)
+
         return self
 
     @property

diff --git a/sklearn/feature_selection/tests/test_from_model.py b/sklearn/feature_selection/tests/test_from_model.py
@@ -428,3 +428,34 @@ def test_importance_getter(estimator, importance_getter):
     )
     selector.fit(data, y)
     assert selector.transform(data).shape[1] == 1
+
+
+class RandomForestNoFeatureNames(RandomForestClassifier):
+    def fit(self, X, y):
+        super().fit(X, y)
+        # Remove feature names
+        del self.feature_names_in_
+        return self
+
+
+def test_estimator_does_not_support_feature_names():
+    """SelectFromModel works with estimators that do not support feature_names_in_.
+
+    Non-regression test for #21949.
+    """
+    pytest.importorskip("pandas")
+    X, y = datasets.load_iris(as_frame=True, return_X_y=True)
+    all_feature_names = set(X.columns)
+
+    rf = RandomForestNoFeatureNames()
+    selector = SelectFromModel(rf).fit(X, y)
+
+    # selector learns the feature names itself
+    assert_array_equal(selector.feature_names_in_, X.columns)
+
+    feature_names_out = set(selector.get_feature_names_out())
+    assert feature_names_out < all_feature_names
+
+    with pytest.warns(None) as records:
+        selector.transform(X.iloc[1:3])
+    assert not [str(record.message) for record in records]