In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import Dense, Input
import pickle

rng = np.random.default_rng(42)
n = 1000

rooms = rng.integers(2, 6, size=n)

area = (
    rng.normal(60, 10, size=n) * (rooms == 2) +
    rng.normal(90, 12, size=n) * (rooms == 3) +
    rng.normal(120, 15, size=n) * (rooms == 4) +
    rng.normal(150, 18, size=n) * (rooms == 5)
)

floors = rng.integers(1, 4, size=n)

year_built = rng.integers(1980, 2024, size=n)

base_price_per_m2 = (
    100_000 * (rooms == 2) +
    120_000 * (rooms == 3) +
    140_000 * (rooms == 4) +
    160_000 * (rooms == 5)
)

floor_multiplier = 1.0 + (floors - 1) * 0.15

age_factor = 1.0 + (year_built - 1980) / 1000

noise = rng.normal(0, 500_000, size=n)
price = area * base_price_per_m2 * floor_multiplier * age_factor + noise

df = pd.DataFrame({
    'price': price.round(0),
    'area': area.round(1),
    'rooms': rooms,
    'floors': floors,
    'year_built': year_built,
})
df.head()

q1, q2 = df['price'].quantile([0.33, 0.66])

def price_to_class(p):
    if p <= q1:
        return 0
    if p <= q2:
        return 1
    return 2

df['price_class'] = df['price'].apply(price_to_class)

X = df[['area', 'rooms', 'floors', 'year_built']].values
y = df['price_class'].values

X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.4, random_state=42, stratify=y
)

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

model = Sequential([
    Input(shape=(X_train.shape[1],)),
    Dense(16, activation='relu'),
    Dense(8, activation='relu'),
    Dense(3, activation='softmax')
])

model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

history = model.fit(
    X_train, y_train,
    epochs=20,
    batch_size=16,
    verbose=1
)

loss, acc = model.evaluate(X_test, y_test, verbose=0)
print(f'Точность: {acc:.2f}')

model.save('house_price_model.h5')
with open('house_scaler.pkl', 'wb') as f:
    pickle.dump(scaler, f)
print('\nМодель и scaler сохранены!')

print('\n' + '='*50)
print('ПРЕДСКАЗАНИЯ НА НОВЫХ ДАННЫХ')
print('='*50)

new_houses = np.array([
    [70.0, 2, 1, 2010],
    [95.0, 3, 2, 2015],
    [130.0, 4, 2, 2020],
    [55.0, 2, 1, 1995],
    [145.0, 5, 3, 2022],
])

new_houses_scaled = scaler.transform(new_houses)

predictions = model.predict(new_houses_scaled, verbose=0)

predicted_classes = np.argmax(predictions, axis=1)

class_names = {0: 'дёшево', 1: 'средне', 2: 'дорого'}

print('\nРезультаты предсказаний:')
print('-'*50)
for i, (house, pred_class, probs) in enumerate(zip(new_houses, predicted_classes, predictions), 1):
    print(f'\nДом {i}:')
    print(f'  Площадь: {house[0]:.1f} м²')
    print(f'  Комнат: {int(house[1])}')
    print(f'  Этажей: {int(house[2])}')
    print(f'  Год постройки: {int(house[3])}')
    print(f'  Предсказанный класс: {pred_class} ({class_names[pred_class]})')
    print(f'  Вероятности:')
    for j, prob in enumerate(probs):
        print(f'    - {class_names[j]}: {prob:.2%}')

Epoch 1/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 4ms/step - accuracy: 0.4857 - loss: 0.9790
Epoch 2/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 5ms/step - accuracy: 0.6293 - loss: 0.8783
Epoch 3/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.7021 - loss: 0.7520
Epoch 4/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.7125 - loss: 0.6681
Epoch 5/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7388 - loss: 0.6068
Epoch 6/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7872 - loss: 0.5112
Epoch 7/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.7881 - loss: 0.4837
Epoch 8/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8119 - loss: 0.4567
Epoch 9/20
[1m38/38[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[



Точность: 0.95

Модель и scaler сохранены!

ПРЕДСКАЗАНИЯ НА НОВЫХ ДАННЫХ

Результаты предсказаний:
--------------------------------------------------

Дом 1:
  Площадь: 70.0 м²
  Комнат: 2
  Этажей: 1
  Год постройки: 2010
  Предсказанный класс: 0 (дёшево)
  Вероятности:
    - дёшево: 97.49%
    - средне: 2.51%
    - дорого: 0.00%

Дом 2:
  Площадь: 95.0 м²
  Комнат: 3
  Этажей: 2
  Год постройки: 2015
  Предсказанный класс: 1 (средне)
  Вероятности:
    - дёшево: 20.98%
    - средне: 78.37%
    - дорого: 0.65%

Дом 3:
  Площадь: 130.0 м²
  Комнат: 4
  Этажей: 2
  Год постройки: 2020
  Предсказанный класс: 2 (дорого)
  Вероятности:
    - дёшево: 3.24%
    - средне: 12.14%
    - дорого: 84.63%

Дом 4:
  Площадь: 55.0 м²
  Комнат: 2
  Этажей: 1
  Год постройки: 1995
  Предсказанный класс: 0 (дёшево)
  Вероятности:
    - дёшево: 99.64%
    - средне: 0.36%
    - дорого: 0.00%

Дом 5:
  Площадь: 145.0 м²
  Комнат: 5
  Этажей: 3
  Год постройки: 2022
  Предсказанный класс: 2 (дорого)
  Вероя