In [None]:

#  Шаг 1. Импорт библиотек
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
import joblib

#  Шаг 2. Загрузка данных
from google.colab import files
uploaded = files.upload()  # boston.csv

df = pd.read_csv("boston.csv")
df.dropna(inplace=True)
df.head()


In [None]:

#  Шаг 3. Подготовка признаков
COLUMNS = [
    'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM',
    'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT'
]

X = df[COLUMNS]
y = df['MEDV']


In [None]:

#  Шаг 4. Разделение данных
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)


In [None]:

#  Шаг 5. Обучение модели
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

y_pred = model.predict(X_test)
rmse = mean_squared_error(y_test, y_pred, squared=False)

print(f"✅ RMSE: {rmse:.2f}")


In [None]:

#  Шаг 6. График важности признаков
importances = model.feature_importances_
feature_df = pd.DataFrame({
    'Feature': COLUMNS,
    'Importance': importances
}).sort_values(by='Importance', ascending=False)

plt.figure(figsize=(10, 6))
sns.barplot(data=feature_df, x='Importance', y='Feature', palette='coolwarm')
plt.title("Важность признаков")
plt.tight_layout()
plt.show()


In [None]:

#  Шаг 7. Корреляционная матрица
plt.figure(figsize=(12, 8))
sns.heatmap(df.corr(), annot=True, fmt=".2f", cmap="coolwarm")
plt.title("Корреляция признаков")
plt.show()


In [None]:

#  Шаг 8. Предсказание для условного дома
example_input = {
    'CRIM': 0.1,
    'ZN': 0.0,
    'INDUS': 8.0,
    'CHAS': 0,
    'NOX': 0.5,
    'RM': 6.0,
    'AGE': 70.0,
    'DIS': 3.0,
    'RAD': 4,
    'TAX': 300.0,
    'PTRATIO': 18.0,
    'B': 390.0,
    'LSTAT': 10.0
}

input_df = pd.DataFrame([example_input])
predicted_price = model.predict(input_df)[0]
print(f"💰 Предсказанная цена: ${predicted_price * 1000:.2f}")


In [None]:

#  Шаг 9. Сохранение модели
joblib.dump(model, "model_weights.mw")
print("✅ Модель сохранена как model_weights.mw")
