# Introduction

### Задача:  
Необходимо предсказать адекватную цену автомобиля основываясь на характеристиках машины из объявления. 

_Условия соревнования:_  
- Тестовая выборка представлена в Лидерборде целиком. Поэтому лучшие и победные решения буду проверяться на их "адекватность" (чтоб не было подгонки под тестовую выборку).
- Разрешено использовать любые ML алгоритмы и библиотеки (кроме DL).
- Ваш сабмит в соревнование должен выглядеть как `sample_submission.csv` файл - содержать 10697 строк с предсказаниями для каждого `row_ID` от 35000 до 45696 включительно.

_Метрика:_  

Метрикой в данном соревновании является __MAE - среднее абсолютное отклонение (mean absolute error).__ MAE вычисляет среднее абсолютное значение разности между прогнозами модели и фактическими значениями целевой переменной.   

Причины выбора MAE:
- Интерпретируемость - MAE легко интерпретируется, так как он представляет абсолютное среднее значение ошибки в исходных единицах измерения целевой переменной. 
- Устойчивость к выбросам - MAE менее чувствителен к выбросам в данных по сравнению с другими метриками, такими как среднеквадратическая ошибка (MSE). Здесь учитывается абсолютное отклонение и не уделяет большого внимания значениям, которые сильно выбиваются из общей тенденции. Но отсюда же и вытекает минус в некоторых задачах, эта метрика не штрафует за выбросы как MSE.
- Простота: Вычисление MAE просто и не требует сложных математических операций, как в случае MSE.

### Данные

_Данные у нас представленны тремя файлами:_
- sample_submission.csv - пример как должен выглядить наш сабмит.
- test_data.csv - тестовые данные на которых будет проверяться наша обученная модель.
- train_data.csv - данные на которых мы будет тренировать нашу модель.

_Описание признаков:_
- row_id - ID объявления
- vehicle_manufacturer - марка автомобиля
- vehicle_model - модель автомобиля
- vehicle_category - тип машины
- current_mileage - текущий пробег
- vehicle_year - год выпуска
- vehicle_gearbox_type - тип коробки передач
- doors_cnt - количество дверей
- wheels - левый/правый руль
- vehicle_color - цвет машины
- vehicle_interior_color - цвет салона машины
- car_vin - VIN номер автомобиля
- car_leather_interior - флаг наличия кожаного салоона
- deal_type - тип объявления: продажа или аренда
- final_price - стоимость машины (Целевая переменная)

### Imports
Import libraries and write settings here.

In [2]:
# Standard python libraries
import os
import time

# Essential DS libraries
import numpy as np
import pandas as pd
from sklearn.metrics import mean_absolute_error
from sklearn.model_selection import train_test_split
import torch

# LightAutoML presets, task and report generation
from lightautoml.automl.presets.tabular_presets import TabularAutoML
from lightautoml.tasks import Task

# Options for pandas
pd.options.display.max_columns = 50
pd.options.display.max_rows = 30

# Display all cell outputs
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'

from IPython import get_ipython
ipython = get_ipython()

# autoreload extension
if 'autoreload' not in ipython.extension_manager.loaded:
    %load_ext autoreload

%autoreload 2

# Visualizations
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

# Set aspects of the visual theme
sns.set_theme("notebook") # установка предварительных настроек маштабирования
sns.set_palette("husl") # установка предварительной световой палитры

ModuleNotFoundError: No module named 'lightautoml'

In [3]:
#%%capture
#!pip install -U lightautoml==0.3.8b1

!pip list update
#!pip install pandas==1.5.3

Package                       Version
----------------------------- ---------
aiofiles                      22.1.0
aiosqlite                     0.18.0
alabaster                     0.7.13
albumentations                1.3.1
alembic                       1.12.0
anaconda-anon-usage           0.4.2
anaconda-client               1.11.2
anaconda-cloud-auth           0.1.3
anaconda-navigator            2.5.0
anaconda-project              0.11.1
anyio                         3.5.0
appnope                       0.1.2
argon2-cffi                   21.3.0
argon2-cffi-bindings          21.2.0
asttokens                     2.0.5
attrs                         22.1.0
autowoe                       1.3.2
Babel                         2.11.0
backcall                      0.2.0
backports.functools-lru-cache 1.6.4
backports.tempfile            1.0
backports.weakref             1.0.post1
beautifulsoup4                4.12.2
bleach                        4.1.0
boltons                       23.0.0
Bottlene

# Analysis/Modeling
Do work here

# Results
Show graphs and stats here

# Conclusions and Next Steps
Summarize findings here