# Отбор наилучших моделей

В машинном самообучении обучающиеся алгоритмы используются для заучивания
параметров модели путем минимизации некоторой функции потери. Вдобавок
к этому многие обучающиеся алгоритмы (например, опорно-векторный классификатор и случайные леса) также имеют гиперпараметры, которые должны быть
определены вне процесса самообучения. Например, случайные леса являются коллекциями деревьев принятия решений (отсюда и слово "лес"). Однако число
деревьев принятия решений в лесу не заучивается алгоритмом и должно быть задано априорно до подгонки. Это часто обозначается как тонкая настройка гиперпараметров, гиперпараметрическая оптимизация либо отбор моделей. Кроме того,
часто нам может потребоваться попробовать несколько обучающихся алгоритмов
(например, попробовать и опорно-векторный классификатор, и случайные леса,
чтобы увидеть, какой метод самообучения производит наилучшую модель).

В то время как существует широкое разнообразие в использовании терминологии
в этой области, в данной книге мы обозначаем отбор наилучшего обучающегося
алгоритма и его наилучших гиперпараметров, как отбор модели. Причина проста:
представьте, что имеются данные, и требуется натренировать опорно-векторный
классификатор с 10 вариантами значений гиперпараметра и классификатор случайного леса с 10 вариантами значений гиперпараметра. В результате мы пытаемся
отобрать наилучшую модель из набора, состоящего из 20 вариантов моделей.
В этой главе мы рассмотрим методы эффективного отбора наилучшей модели из
набора потенциальных вариантов.

Мы будем ссылаться на конкретные гиперпараметры, такие как С (обратная величина силы регуляризации). Не переживайте, если не знаете, что такое гиперпараметры. Мы рассмотрим их в последующих главах. Вместо этого просто обращайтесь с гиперпараметрами, как настройками обуча

**Отбор наилучших моделей
с помощью исчерпывающего поиска**

Требуется отобрать наилучшую модель, выполнив поиск по диапазону гиперпараметров.

In [8]:
# Загрузить библиотеки
import numpy as np
from sklearn import linear_model, datasets
from sklearn.model_selection import GridSearchCV
# Загрузить данные
iris = datasets. load_iris ()
features = iris.data
target = iris.target
# Создать объект логистической регрессии
logistic = linear_model.LogisticRegression()
# Создать диапазон вариантов значений штрафного гиперпараметра
penalty = ['l1', 'l2']
# Создать диапазон вариантов значений регуляризационного гиперпараметра
C = np.logspace(0, 4, 10)
# Создать словарь вариантов гиперпараметров
hyperparameters = dict(C=C, penalty=penalty)
# Создать объект решеточного поиска
gridsearch = GridSearchCV(logistic, hyperparameters, cv=5, verbose=0)
# Выполнить подгонку объекта решеточного поиска
best_model = gridsearch.fit(features, target)

np.logspace(0, 4, 10)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

array([1.00000000e+00, 2.78255940e+00, 7.74263683e+00, 2.15443469e+01,
       5.99484250e+01, 1.66810054e+02, 4.64158883e+02, 1.29154967e+03,
       3.59381366e+03, 1.00000000e+04])

Класс GridSearchCV реализует отбор модели по методу грубой силы с использованием перекрестной проверки. В частности, пользователь определяет наборы возможных значений для одного или нескольких гиперпараметров, а затем объект класса
GridSearchev тренирует модель, используя каждое значение и/или комбинацию значений. Модель с лучшей оценкой результативности отбирается как наилучшая. Например, в нашем решении в качестве обучающегося алгоритма мы использовали
логистическую регрессию, содержащую два гиперпараметра: С и регуляризационный штраф. Не переживайте, если не знаете, что такое С и регуляризация; мы рассмотрим их в следующих главах. Просто для начала уясните, что гиперпараметры
С и регуляризационный штраф могут принимать диапазон значений, которые
должны быть указаны до начала тренировки. Для гиперпараметра С мы определяем
10 возможных значений:
    
    np.logspace(0, 4, 10)
    
И точно так же мы определяем два возможных значения регуляризационного
штрафа: [ 'l1', 'l2']. Для каждой комбинации значений гиперпараметров С и регуляризационного штрафа мы тренируем модель и оцениваем ее с помощью
^-блочной перекрестной проверки. В нашем решении мы имели 10 возможных значений С, 2 возможных значения регуляризационного штрафа и 5 блоков. Они создали 10 х 2 х 5 = 100 вариантов моделей, из которых была выбрана лучшая.
После завершения работы объекта Gridsearchev можем увидеть гиперпараметры
лучшей модели:

In [11]:
# Взглянуть на наилучшие гиперпараметры
print('Лучший штраф:', best_model.best_estimator_.get_params()['penalty'])
print('Лучший C:', best_model.best_estimator_.get_params()['C'])

Лучший штраф: l2
Лучший C: 7.74263682681127


По умолчанию после определения наилучших гиперпараметров объект Gridsearchev
может переобучить модель, используя наилучшие гиперпараметры, на всем наборе
данных (вместо откладывания блока для перекрестной проверки).

Стоит отметить один параметр verbose объекта Gridsearchev. В нем нет особой необходимости, однако он может служить обнадеживающей мерой во время длительных процессов поиска, чтобы получать уведомления о том, что поиск прогрессирует. Параметр verbose задает объем сообщений, выводимых во время поиска, при
этом о обозначает отсутствие сообщений, а значения от 1 до з — вывод сообщений
с большей детализацией.

https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html#sklearn.model_selection.GridSearchCV

**. Отбор наилучших моделей
с помощью рандомизированного поиска**

Для отбора наилучшей модели требуется вычислительно более дешевый метод, чем
исчерпывающий поиск.


**Случайный поиск**

В то время как поиск по сетке рассматривает все возможные комбинации гиперпараметров, чтобы найти лучшую модель, случайный поиск выбирает и тестирует только случайную комбинацию гиперпараметров.

Эта техника вместо исчерпывающего поиска делает случайную выборку из сетки гиперпараметров.

Мы можем указать общее количество попыток случайного поиска, прежде чем будет получена наилучшая модель.

Теперь, когда у вас есть базовое понимание того, как работают случайный поиск и поиск по сетке, я покажу, как реализовать эти методы с помощью библиотеки Scikit-Learn.

In [24]:
# Загрузить библиотеки
from scipy.stats import uniform
from sklearn import linear_model, datasets
from sklearn.model_selection import RandomizedSearchCV
# Загрузить данные
iris = datasets.load_iris()
features = iris.data
target = iris.target
# Создать объект логистической регрессии
logistic = linear_model.LogisticRegression()
# Создать диапазон вариантов значений штрафного гиперпараметра
penalty = ['l1', 'l2']
# Создать диапазон вариантов значений регуляризационного гиперпараметра
С = uniform(loc=0, scale=4)
# Создать словарь вариантов гиперпараметров
hyperparameters = dict(C=C, penalty=penalty)
# Создать объект рандомизированного поиска
randomizedsearch = RandomizedSearchCV(
logistic, hyperparameters, random_state=1, n_iter=100,
cv=5, verbose=0, n_jobs=-1)
# Выполнить подгонку объекта рандомизированного поиска
best_model = randomizedsearch.fit(features, target)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

В рецепте 12.1 мы использовали объект класса GridSearchev на заданном пользователем наборе значений гиперпараметров, чтобы отыскать наилучшую модель в соответствии с оценочной функцией. Более эффеюнвный метод, чем решеточный поиск GridSearchev методом грубой силы с перебором всех значений, — это поиск
на определенном количестве случайных сочетаний гиперпараметрических значений
из предоставленных пользователем распределений (например, нормального, равномерного). В библиотеке scikit-leam этот метод рандомизированного поиска реализован С ПОМОЩЬЮ класса RandomizedSearchCV.
В случае с объектом класса RandomizedSearchCV, если мы зададим распределение, то
библиотека scikit-leam будет случайным образом отбирать без возврата образцы
значений гиперпараметров из этого распределения. В качестве примера общего
принципа работы здесь мы случайным образом отберем 10 значений из равномерного распределения в диапазоне от 0 до 4:

In [25]:
# Определить равномерное распределение между 0 и 4,
# отобрать 10 значений
uniform(loc=0, scale=4).rvs(10)

array([1.2587298 , 0.10537304, 1.62140324, 0.55577441, 1.31128041,
       3.13605778, 0.9704702 , 2.52242777, 2.9209499 , 0.33431123])

В качестве альтернативы, если мы зададим список значений, таких как два значения гиперпараметра регуляризационного штрафа, ['1Г, '12'], объект класса
RandomizedSearchCV будет выполнять случайный отбор с заменой из списка.
Так же как с объектом класса GridSearchev, мы можем увидеть значения гиперпараметров наилучшей модели:

In [26]:
# Взглянуть на лучшие гиперпараметры
print('Лучший штраф:', best_model.best_estimator_.get_params()['penalty'])
print('Лучший С:', best_model.best_estimator_.get_params() ['C'])

Лучший штраф: l2
Лучший С: 7.74263682681127


Количество отобранных комбинаций гиперпараметров (т. е. количество вариантов
натренированных моделей) задается установкой параметра n iter (количества итераций).

**Отбор наилучших моделей
из нескольких обучающихся алгоритмов**

Требуется отобрать наилучшую модель путем поиска по диапазону обучающихся
алгоритмов и их соответствующих гиперпараметров.

Создать словарь вариантов обучающихся алгоритмов и их гиперпараметров:

In [31]:
# Загрузить библиотеки
import numpy as np
from sklearn import datasets
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.pipeline import Pipeline
# Задать начальное число для генератора псевдослучайных чисел
np.random.seed(0)
# Загрузить данные
iris = datasets.load_iris()
features = iris.data
target = iris.target
# Создать конвейер
pipe = Pipeline([("classifier", RandomForestClassifier())])

# Создать словарь вариантов обучающихся алгоритмов и их гиперпараметров
search_space = [{"classifier": [LogisticRegression()],
"classifier__penalty": ['l1', 'l2'],
"classifier__C": np.logspace(0, 4, 10)},
{"classifier": [RandomForestClassifier()],
"classifier__n_estimators": [10, 100, 1000],
"classifier__max_features": [1, 2, 3]}]

# Создать объект решеточного поиска
gridsearch = GridSearchCV(pipe, search_space, cv=5, verbose=0)
# Выполнить подгонку объекта решеточного поиска
best_model = gridsearch.fit(features, target)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

В двух предыдущих рецептах мы нашли наилучшую модель путем поиска возможных гиперпараметрических значений обучающегося алгоритма. Однако что делать,
если мы не уверены, какой обучающийся алгоритм использовать? Последние версии библиотеки scikit-leam позволяют включить в поисковое пространство обучающиеся алгоритмы. В нашем решении мы определяем поисковое пространство,
которое включает два обучающихся алгоритма: логистический регрессионный
классификатор и классификатор случайного леса. Каждый обучающийся алгоритм
имеет свои гиперпараметры, и мы определяем их варианты значений, используя
формат classifier__[имя гиперпараметра]. Например, для нашей логистической регрессии для определения множества возможных значений регуляризационного
гиперпараметрического пространства с и потенциальных типов регуляризационных
штрафов penalty мы создаем словарь:

{'classifier': [LogisticRegressionO ],

'classifier__penalty': ['11', '12'],

'classifier__C : np.logspace (0, 4, 10)}

Мы также можем создать аналогичный словарь для гиперпараметров случайного
леса:

{'classifier': [RandomForestClassifier()],

'classifier__n_estimators': [10, 100, 1000],

'classifier__max_features': [1, 2, 3]}

После завершения поиска можно использовать атрибут best_estimator_ для просмотра обучающегося алгоритма и гиперпараметров наилучшей модели:

In [32]:
# Взглянуть на лучшую модель
best_model.best_estimator_.get_params()["classifier"]

**Ускорение отбора модели
с помощью распараллеливания**

Использовать на компьютере все ядра центрального процессора, установив n_jobs=-i:

In [37]:
# Загрузить библиотеки
import numpy as пр
from sklearn import linear_model, datasets
from sklearn.model_selection import GridSearchCV
# Загрузить данные
iris = datasets.load_iris()
features = iris.data
target = iris.target
# Создать объект логистической регрессии
logistic = linear_model.LogisticRegression()
# Создать диапазон вариантов значений штрафного гиперпараметра
penalty = ["l1", "l2"]
# Создать диапазон вариантов значений регуляризационного гиперпараметра
С = np.logspace(0, 4, 1000)
# Создать словарь вариантов гиперпараметров
hyperparameters = dict(C=C, penalty=penalty)
# Создать объект решеточного поиска
gridsearch = GridSearchCV(logistic, hyperparameters, cv=5,
n_jobs=-1, verbose=1)
# Выполнить подгонку объекта решеточного поиска
best_model = gridsearch.fit(features, target)

Fitting 5 folds for each of 20 candidates, totalling 100 fits


STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

**Ускорение отбора модели с помощью
алгоритмически специализированных методов**

Если используется отборное число обучающихся алгоритмов, применить модельно
специфическую перекрестно-проверочную настройку гиперпараметров, имеющуюся в библиотеке scikit-leam, например реализованную в классе LogisticRegressionev:

In [38]:
# Загрузить библиотеку
from sklearn import linear_model, datasets
# Загрузить данные
iris = datasets.load_iris()
features = iris.data
target = iris.target
# Создать объект перекрестно-проверяемой логистической регрессии
logit = linear_model.LogisticRegressionCV(Cs=100)
# Натренировать модель
logit.fit(features, target)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

Иногда характеристики обучающегося алгоритма позволяют нам отыскать наилучшие гиперпараметры значительно быстрее, чем поиск методом грубой силы либо
рандомизированный поиск модели. В библиотеке scikit-leam многие обучающиеся
алгоритмы (например, гребневая регрессия, лассо-регрессия и комбинированная
регрессия elastic net с линейной комбинацией Ё - и Z,2 -штрафов) имеют алгоритмически специфичный метод перекрестной проверки, которым следует воспользоваться. Например, класс LogisticRegression используется для выполнения стандартного логистического регрессионного классификатора, в то время как класс
LogisticRegressionev реализует эффективный перекрестно-проверяемый логистический регрессионный классификатор, который способен идентифицировать оптимальную величину гиперпараметра С.

Класс LogisticRegressionev библиотеки scikit-leam реализует метод с включением
параметра Cs. Если передается список, то параметр cs содержит варианты гиперпараметрических значений на выбор. Если задано целое число, то параметр Cs создает
список из этого количества возможных значений. Варианты значений выводятся
логарифмически из диапазона от 0.0001 до 1.0000 (диапазона разумных значений
для С).

Однако основной недостаток класса LogisticRegressionev заключается в том, что он
может выполнять поиск только диапазона значений для С. В рецепте 12.1 наше
возможное гиперпараметрическое пространство включало как С, так и еще один
гиперпараметр (регуляризационную штрафную норму). Это ограничение характерно для многих модельно специфических перекрестно-проверяемых подходов, принятых в библиотеке scikit-leam.

**Оценивание результативности
после отбора модели**

Использовать вложенную перекрестную проверку, чтобы избежать смещенной
оценки:

In [40]:
# Загрузить библиотеки
import numpy as np
from sklearn import linear_model, datasets
from sklearn.model_selection import GridSearchCV, cross_val_score
# Загрузить данные
iris = datasets.load_iris()
features = iris.data
target = iris.target
# Создать объект логистической регрессии
logistic = linear_model.LogisticRegression()
# Создать диапазон из 20 вариантов значений для С
С = np.logspace(0, 4, 20)
# Создать словарь вариантов гиперпараметров
hyperparameters = dict(C=C)
# Создать объект решеточного поиска
gridsearch = GridSearchCV(logistic, hyperparameters, cv=5,
n_jobs=-1, verbose=0)
# Выполнить вложенную перекрестную проверку и выдать среднюю оценку
cross_val_score(gridsearch, features, target).mean()

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver opt

0.9733333333333334

Идея вложенной перекрестной проверки во время отбора модели для многих людей
на первых порах воспринимается с трудом. Напомним, что в ^-блочной перекрестной проверке мы тренируем нашу модель на к -1 блоках данных, используем эту
модель для предсказания на оставшемся блоке, а затем оцениваем нашу модель по
тому, насколько хорошо предсказания нашей модели соответствуют истинным значениям. Затем мы повторяем этот процесс к раз.
В тех видах поиска для отбора модели, описанных в этой главе (например, реализованных В классах GridSearchCV И RandomizedSearchCV), М Ы применяли перекрестную
проверку для оценки того, какие значения гиперпараметра порождают наилучшие
модели. Вместе с тем возникает тонкая и в целом недооцененная проблема: поскольку мы использовали данные для отбора наилучших значений гиперпараметра,
мы не можем использовать те же данные для оценки результативности модели.
Каково же решение? Обернуть перекрестную проверку, используемую для поиска
модели, еще в одну перекрестную проверку! Во вложенной перекрестной проверке
"внутренняя" перекрестная проверка отбирает наилучшую модель, в то время как
"внешняя" перекрестная проверка предоставляет нам объективную оценку результативности модели. В нашем решении внутренняя перекрестная проверка— это
объект GridSearchev, который мы затем переносим во внешнюю перекрестную проверку С П О М О Щ Ь Ю метода cross_val_score.