# Проверка модели
Измерьте производительность вашей модели, чтобы вы могли протестировать и сравнить альтернативные варианты.

Вы создали модель. Но насколько она хороша?

На этом уроке вы научитесь использовать проверку модели для измерения качества вашей модели. Измерение качества модели - ключ к последовательному улучшению ваших моделей.

# Что такое проверка модели
Вам захочется оценить практически каждую модель, которую вы когда-либо создавали. В большинстве (хотя и не во всех) приложений важным показателем качества модели является точность прогнозирования. Другими словами, будут ли предсказания модели близки к тому, что происходит на самом деле.

Многие люди допускают огромную ошибку при измерении точности прогнозирования. Они делают прогнозы на основе своих обучающих данных и сравнивают эти прогнозы с целевыми значениями в обучающих данных. Вскоре вы увидите, в чем проблема такого подхода и как ее решить, но давайте сначала подумаем о том, как бы мы это сделали.

Сначала вам нужно представить качество модели в понятной форме. Если вы сравните прогнозируемую и фактическую стоимость жилья для 10 000 домов, вы, скорее всего, обнаружите сочетание хороших и плохих прогнозов. Просматривать список из 10 000 прогнозируемых и фактических значений было бы бессмысленно. Нам нужно свести все это в единую метрику.

Существует множество показателей для оценки качества модели, но мы начнем с одного, который называется средней абсолютной погрешностью (также называемой MAE). Давайте разберем этот показатель, начиная с последнего слова "ошибка".

Ошибка прогнозирования для каждого дома равна:

ошибка=фактическая−прогнозируемая

Итак, если дом стоил 150 000 долларов, а вы прогнозировали, что он будет стоить 100 000 долларов, ошибка составит 50 000 долларов.

Используя показатель MAE, мы берем абсолютное значение каждой ошибки. Это преобразует каждую ошибку в положительное число. Затем мы берем среднее значение этих абсолютных ошибок. Это и есть наш показатель качества модели. Простым языком это можно выразить так:

В среднем наши прогнозы отклоняются примерно на X.

Чтобы рассчитать MAE, нам сначала нужна модель. Она построена в скрытой ячейке ниже, которую вы можете просмотреть, нажав на кнопку с кодом.

In [1]:
# Код загрузки данных Скрыт здесь
import pandas as pd

# Загрузить данные
melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv'
melbourne_data = pd.read_csv(melbourne_file_path) 
# Отфильтровать строки с пропущенными значениями цен
filtered_melbourne_data = melbourne_data.dropna(axis=0)
# Выберите цель и функции
y = filtered_melbourne_data.Price
melbourne_features = ['Rooms', 'Bathroom', 'Landsize', 'BuildingArea', 
                        'YearBuilt', 'Lattitude', 'Longtitude']
X = filtered_melbourne_data[melbourne_features]

from sklearn.tree import DecisionTreeRegressor
# Определить модель
melbourne_model = DecisionTreeRegressor()
# Подходящая модель
melbourne_model.fit(X, y)

FileNotFoundError: [Errno 2] No such file or directory: '../input/melbourne-housing-snapshot/melb_data.csv'

Как только у нас будет модель, вот как мы рассчитаем среднюю абсолютную погрешность:

In [None]:
from sklearn.metrics import mean_absolute_error

predicted_home_prices = melbourne_model.predict(X)
mean_absolute_error(y, predicted_home_prices)

# Проблема с оценками "по выборке"
Показатель, который мы только что вычислили, можно назвать оценкой "по выборке". Мы использовали одну "выборку" домов как для построения модели, так и для ее оценки. Вот почему это плохо.

Представьте, что на крупном рынке недвижимости цвет дверей никак не связан с ценой дома.

Однако в выборке данных, которую вы использовали для построения модели, все дома с зелеными дверями стоили очень дорого. Задача модели состоит в том, чтобы найти закономерности, которые предсказывают цены на жилье, поэтому она увидит эту закономерность и всегда будет предсказывать высокие цены на дома с зелеными дверями.

Поскольку этот шаблон был получен на основе обучающих данных, модель будет выглядеть точной в обучающих данных.

Но если этот шаблон не будет сохраняться, когда модель увидит новые данные, модель будет очень неточной при практическом использовании.

Поскольку практическая ценность моделей заключается в прогнозировании на основе новых данных, мы измеряем производительность на основе данных, которые не использовались при построении модели. Самый простой способ сделать это - исключить некоторые данные из процесса построения модели, а затем использовать их для проверки точности модели на данных, которые ранее не использовались. Эти данные называются данными проверки.

# Их кодирование
В библиотеке scikit-learn есть функция train_test_split для разделения данных на две части. Мы будем использовать некоторые из этих данных в качестве обучающих, чтобы соответствовать модели, а другие данные будем использовать в качестве данных проверки для вычисления mean_absolute_error.

Вот код:

In [None]:
from sklearn.model_selection import train_test_split

# разделить данные на обучающие и проверочные, как для функций, так и для целевых объектов
# Разделение основано на генераторе случайных чисел. Ввод числового значения в
# аргумент random_state гарантирует, что мы получим одинаковое разделение при каждом запуске
# этого скрипта.
train_X, val_X, train_y, val_y = train_test_split(X, y, random_state = 0)
# Определить модель
melbourne_model = DecisionTreeRegressor()
# Подходящая модель
melbourne_model.fit(train_X, train_y)

# получите прогнозируемые цены на основе данных проверки
val_predictions = melbourne_model.predict(val_X)
print(mean_absolute_error(val_y, val_predictions))

# Ух ты!¶
Ваша средняя абсолютная погрешность для данных по выборке составила около 500 долларов. Для данных по выборке это более 250 000 долларов.

В этом разница между моделью, которая почти полностью соответствует действительности, и моделью, которая непригодна для большинства практических целей. Для сравнения, средняя стоимость дома в данных проверки составляет 1,1 миллиона долларов. Таким образом, погрешность в новых данных составляет около четверти от средней стоимости дома.

Существует множество способов улучшить эту модель, например, поэкспериментировать с поиском лучших функций или различных типов моделей.

# ваш ход
Прежде чем мы рассмотрим улучшение этой модели, попробуйте проверить ее на себе.