## Создание новых признаков

*Подгружаем нужные библиотеки*

In [1]:
import pandas as pd
import numpy as np

*Подгружаем файл*

In [2]:
df = pd.read_csv("data/auto_new.csv")
df.head(5)

Unnamed: 0,model auto,year of production,mileage,exterior colour,tax,transmission,wheel drive,number of owners,engine volume,engine power,engine type,fuel type,acceleration,MPG,country of the car brand,class,top speed,environmental class,price
0,Mercedes-Benz,2019,98500.0,чёрный,55050.0,автоматическая,полный,1 владелец,3.0,367.0,бензиновый,АИ-95,6.2,9.4,Германия,F,246.0,Euro 6,9299000.0
1,Mercedes-Benz,2018,51400.0,чёрный,4760.0,автоматическая,задний,2 владельца,2.1,136.0,дизельный,ДТ,12.8,5.8,Германия,M,181.0,Euro 5,12800000.0
2,Mercedes-Benz,2020,23500.0,чёрный,18675.0,автоматическая,полный,1 владелец,2.9,249.0,дизельный,ДТ,7.4,9.8,Германия,J,199.0,Euro 6,17499000.0
3,BMW,2021,50300.0,чёрный,51000.0,автоматическая,полный,2 владельца,3.0,340.0,бензиновый,АИ-95,5.5,8.6,Германия,E,250.0,Euro 6,9990000.0
4,BMW,2022,6152.0,серый,51000.0,автоматическая,полный,1 владелец,3.0,340.0,дизельный,ДТ,4.6,5.1,Германия,E,250.0,Euro 6,9900000.0


*Добавим признак, отображающий эффективность использования топлива, который будет вычисляться путем деления среднего расхода топлива на объем двигателя, - fuel utilization efficiency*

In [3]:
df["fuel utilization efficiency"] = df["MPG"] / df["engine volume"]

*Кроме того, будем отслеживать оптимальность нашего двигателя. Данный признак будет вычисляться путем умножения объема двигателя на мощность двигателя на время разгона до 100 км/ч - engine optimality*

In [4]:
df["engine optimality"] = df["engine volume"] * df["engine power"] * df["acceleration"]

*Также добавим интенсивность использования автомобиля с момента его выпуска, которая будет рассчитываться как отношение общего пробега к количеству лет использования автомобиля - intensity of use*

In [5]:
df["intensity of use"] = df["mileage"] / (2024 - df["year of production"] + 1)

In [6]:
df.head(5)

Unnamed: 0,model auto,year of production,mileage,exterior colour,tax,transmission,wheel drive,number of owners,engine volume,engine power,...,acceleration,MPG,country of the car brand,class,top speed,environmental class,price,fuel utilization efficiency,engine optimality,intensity of use
0,Mercedes-Benz,2019,98500.0,чёрный,55050.0,автоматическая,полный,1 владелец,3.0,367.0,...,6.2,9.4,Германия,F,246.0,Euro 6,9299000.0,3.133333,6826.2,16416.666667
1,Mercedes-Benz,2018,51400.0,чёрный,4760.0,автоматическая,задний,2 владельца,2.1,136.0,...,12.8,5.8,Германия,M,181.0,Euro 5,12800000.0,2.761905,3655.68,7342.857143
2,Mercedes-Benz,2020,23500.0,чёрный,18675.0,автоматическая,полный,1 владелец,2.9,249.0,...,7.4,9.8,Германия,J,199.0,Euro 6,17499000.0,3.37931,5343.54,4700.0
3,BMW,2021,50300.0,чёрный,51000.0,автоматическая,полный,2 владельца,3.0,340.0,...,5.5,8.6,Германия,E,250.0,Euro 6,9990000.0,2.866667,5610.0,12575.0
4,BMW,2022,6152.0,серый,51000.0,автоматическая,полный,1 владелец,3.0,340.0,...,4.6,5.1,Германия,E,250.0,Euro 6,9900000.0,1.7,4692.0,2050.666667


In [7]:
df.to_csv('data/auto_new_.csv', index=False)

In [8]:
df_new = pd.read_csv("data/auto_new_.csv")
df_new.head(5)

Unnamed: 0,model auto,year of production,mileage,exterior colour,tax,transmission,wheel drive,number of owners,engine volume,engine power,...,acceleration,MPG,country of the car brand,class,top speed,environmental class,price,fuel utilization efficiency,engine optimality,intensity of use
0,Mercedes-Benz,2019,98500.0,чёрный,55050.0,автоматическая,полный,1 владелец,3.0,367.0,...,6.2,9.4,Германия,F,246.0,Euro 6,9299000.0,3.133333,6826.2,16416.666667
1,Mercedes-Benz,2018,51400.0,чёрный,4760.0,автоматическая,задний,2 владельца,2.1,136.0,...,12.8,5.8,Германия,M,181.0,Euro 5,12800000.0,2.761905,3655.68,7342.857143
2,Mercedes-Benz,2020,23500.0,чёрный,18675.0,автоматическая,полный,1 владелец,2.9,249.0,...,7.4,9.8,Германия,J,199.0,Euro 6,17499000.0,3.37931,5343.54,4700.0
3,BMW,2021,50300.0,чёрный,51000.0,автоматическая,полный,2 владельца,3.0,340.0,...,5.5,8.6,Германия,E,250.0,Euro 6,9990000.0,2.866667,5610.0,12575.0
4,BMW,2022,6152.0,серый,51000.0,автоматическая,полный,1 владелец,3.0,340.0,...,4.6,5.1,Германия,E,250.0,Euro 6,9900000.0,1.7,4692.0,2050.666667
