In [None]:
import pandas as pd
from sklearn.metrics import mean_absolute_error, mean_squared_error

data = pd.read_csv('ITIS_DATASET_GRANT1000.csv')

In [None]:
data.head()

Unnamed: 0,Средний балл успеваемости на курсе,Количество мест на грант,Количество студентов подавших заявление на грант,Минимальный балл прохождения на грант
0,77.440675,36,59,71
1,85.759468,39,84,75
2,80.138169,37,80,71
3,77.244159,39,51,71
4,71.18274,39,88,71


In [None]:
from sklearn.model_selection import train_test_split

X = data.drop(columns=['Минимальный балл прохождения на грант'])
y = data['Минимальный балл прохождения на грант']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Линейная регрессия

In [None]:
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

linear_reg_model = LinearRegression()
linear_reg_model.fit(X_train, y_train)

y_pred_linear_reg = linear_reg_model.predict(X_test)

mse_linear_reg = mean_squared_error(y_test, y_pred_linear_reg)
r2_linear_reg = r2_score(y_test, y_pred_linear_reg)
mae_linear_reg = mean_absolute_error(y_test, y_pred_linear_reg)
rmse_linear_reg = mean_squared_error(y_test, y_pred_linear_reg, squared=False)
print("Модель линейной регрессии:")
print("Среднеквадратичная ошибка (MSE):", mse_linear_reg)
print("Коэффициент детерминации (R^2):", r2_linear_reg)
print("Средняя абсолютная ошибка (MAE):", mae_linear_reg)
print("Корень из среднеквадратичной ошибки (RMSE):", rmse_linear_reg)

Модель линейной регрессии:
Среднеквадратичная ошибка (MSE): 4.966621376159258
Коэффициент детерминации (R^2): 0.5774661454854675
Средняя абсолютная ошибка (MAE): 1.7648836313437806
Корень из среднеквадратичной ошибки (RMSE): 2.2285917921771268


# Случайный лес


In [None]:
from sklearn.ensemble import RandomForestRegressor

random_forest_model = RandomForestRegressor(random_state=42)
random_forest_model.fit(X_train, y_train)

y_pred_random_forest = random_forest_model.predict(X_test)

mse_random_forest = mean_squared_error(y_test, y_pred_random_forest)
r2_random_forest = r2_score(y_test, y_pred_random_forest)
mae_random_forest = mean_absolute_error(y_test, y_pred_random_forest)
rmse_random_forest = mean_squared_error(y_test, y_pred_random_forest, squared=False)
print("Модель случайного леса:")
print("Среднеквадратичная ошибка (MSE):", mse_random_forest)
print("Коэффициент детерминации (R^2):", r2_random_forest)
print("Средняя абсолютная ошибка (MAE):", mae_random_forest)
print("Корень из среднеквадратичной ошибки (RMSE):", rmse_random_forest)

Модель случайного леса:
Среднеквадратичная ошибка (MSE): 0.1353689999999996
Коэффициент детерминации (R^2): 0.9884835220928379
Средняя абсолютная ошибка (MAE): 0.17669999999999966
Корень из среднеквадратичной ошибки (RMSE): 0.367925264150207


In [None]:
import joblib

joblib.dump(random_forest_model, 'random_forest_model.pkl')


['random_forest_model.pkl']

# K ближайших соседей

In [None]:
from sklearn.neighbors import KNeighborsRegressor

knn_model = KNeighborsRegressor()
knn_model.fit(X_train, y_train)

y_pred_knn = knn_model.predict(X_test)

mae_knn = mean_absolute_error(y_test, y_pred_knn)
rmse_knn = mean_squared_error(y_test, y_pred_knn, squared=False)
mse_knn = mean_squared_error(y_test, y_pred_knn)
r2_knn = r2_score(y_test, y_pred_knn)

print("Модель K ближайших соседей:")
print("Среднеквадратичная ошибка (MSE):", mse_knn)
print("Коэффициент детерминации (R^2):", r2_knn)
print("Средняя абсолютная ошибка (MAE):", mae_knn)
print("Корень из среднеквадратичной ошибки (RMSE):", rmse_knn)


Модель K ближайших соседей:
Среднеквадратичная ошибка (MSE): 0.10560000000000008
Коэффициент детерминации (R^2): 0.9910161110224917
Средняя абсолютная ошибка (MAE): 0.15000000000000036
Корень из среднеквадратичной ошибки (RMSE): 0.32496153618543855


In [None]:
import torch
import torch.nn as nn
from sklearn.metrics import mean_squared_error, mean_absolute_error

class NeuralNetwork(nn.Module):
    def __init__(self, input_size):
        super(NeuralNetwork, self).__init__()
        self.fc1 = nn.Linear(input_size, 64)
        self.fc2 = nn.Linear(64, 32)
        self.fc3 = nn.Linear(32, 1)

    def forward(self, x):
        x = torch.relu(self.fc1(x))
        x = torch.relu(self.fc2(x))
        x = self.fc3(x)
        return x

input_size = X_train.shape[1]
model = NeuralNetwork(input_size)

criterion = nn.MSELoss()

def evaluate_model(model, criterion, X_test, y_test):
    model.eval()
    with torch.no_grad():
        outputs = model(X_test)
        test_loss = criterion(outputs, y_test)
        mse = mean_squared_error(y_test.numpy(), outputs.numpy())
        mae = mean_absolute_error(y_test.numpy(), outputs.numpy())
        rmse = mean_squared_error(y_test.numpy(), outputs.numpy(), squared=False)
    print(f'Test Loss (MSE): {test_loss.item():.4f}')
    print(f'Mean Absolute Error (MAE): {mae:.4f}')
    print(f'Root Mean Squared Error (RMSE): {rmse:.4f}')

evaluate_model(model, criterion, X_test_tensor, y_test_tensor)


Test Loss (MSE): 5277.8750
Mean Absolute Error (MAE): 72.5680
Root Mean Squared Error (RMSE): 72.6481


  return F.mse_loss(input, target, reduction=self.reduction)
