In [3]:
from config import settings

In [4]:
import requests
import numpy as np
import json 

In [10]:
SERVER_URL = "http://127.0.0.1:8000"

In [35]:
X_class0 = np.random.rand(50, 2) * 2 -3 # От -3 до -1
y_class0 = np.zeros(50, dtype=int)

X_class1 = np.random.rand(50, 2) * 2 + 1 # От -3 до -1
y_class1 = np.ones(50, dtype=int)

X_train = np.vstack((X_class0, X_class1))
y_train = np.hstack((y_class0, y_class1))

indices = np.arange(len(X_train))
np.random.shuffle(indices)

X_train = X_train[indices]
y_train = y_train[indices]

request_data = {
    "X": X_train.tolist(),
    "y": y_train.tolist(),
    "config": {
        "model_name": "my_first_logistic_model1" 
    }
}

response = requests.post(f'{SERVER_URL}/fit', json=request_data)


In [None]:
# server/main.py   Доступен по http://127.0.0.1:8000/
import time
import os
import asyncio
from contextlib import asynccontextmanager
from typing import List, Dict
from concurrent.futures import ProcessPoolExecutor

import joblib
from fastapi import FastAPI, HTTPException
from pydantic import BaseModel, Field
from sklearn.linear_model import LogisticRegression

# Импортируем классы моделей
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
from lightgbm import LGBMClassifier
from catboost import CatBoostClassifier

# Импортируем наши Pydantic модели
from .config_models import FitRequest, PredictRequest, ModelNameConfig
from .config import settings

SUPPORTED_MODELS = {
    'LogisticRegression': LogisticRegression,
    'RandomForestClassifier': RandomForestClassifier,
    'XGBClassifier': XGBClassifier,
    'LGBMClassifier': LGBMClassifier,
    'CatBoostClassifier': CatBoostClassifier,
}

LOADED_MODELS=dict()

def _train_model_sync(
    model_path: str,
    model_type: str,
    hyperparameters: Dict,
    X: List[List[float]],
    y: List[int]
):
    """
    Это синхронная функция обучения модели, предназначения для запуска в ProcessPoolExecutor.
    """
    try:
        if os.path.exists(model_path):
            return f"Модель по пути '{model_path}' уже существует."
        
        if model_type not in SUPPORTED_MODELS:
            return f"Тип модели '{model_type}' не поддерживается."
        
        model_class = SUPPORTED_MODELS[model_type]   
        model = model_class(**hyperparameters)
        model.fit(X, y)
        joblib.dump(model, model_path)

        return None
        
    except Exception as e:
        return f"Ошибка при обучении модели: {e}"




        
@asynccontextmanager
async def lifespan(app: FastAPI):
    app.state.process_pool = ProcessPoolExecutor(max_workers=settings.TRAINING_CORES)
    print(f"Сервер запущен. Пул процессов на {settings.TRAINING_CORES} воркера(ов) создан.")
    
    yield
    
    app.state.process_pool.shutdown(wait=True) #Ждем пока все процессы завершат свою работу
    print("Пул процессов остановлен.")

app = FastAPI(title="ML Model Server", lifespan=lifespan)



#-------------------------------------------------------------------------#-------------------------------------------------------------------------

# Эндпоинты API

@app.get('/')
def read_root():
    return {"message": "Добро пожаловать на сервер для ML моделей!"}

@app.post('/fit')
async def fit_model(request: FitRequest):
    
    os.makedirs(settings.MODELS_PATH, exist_ok=True)
    model_name = request.config.model_name
    model_path = os.path.join(settings.MODELS_PATH, f'{model_name}.joblib')

    model_type = request.config.model_type
    hyperparameters = request.config.model_dump(exclude={'model_name', 'model_type'})
    X = request.X
    y = request.y

    loop = asyncio.get_running_loop()
    error_message = await loop.run_in_executor(
        app.state.process_pool,
        _train_model_sync,
        model_path,
        model_type,
        hyperparameters,
        X,
        y
    )

    if error_message:
        raise HTTPException(status_code=400, detail=error_message)

    return {
        "message": "Задача обучения модели запущена в фоновом режиме.",
        "model_name": model_name,
        "path": model_path
    }


@app.post('/predict')
def predict(request: PredictRequest):
    '''Функция, которая возвращает предсказания модели model_name'''
    model_name = request.config.model_name
    
    if model_name not in LOADED_MODELS:
        raise HTTTPException(
            status_code=404, 
            detail=f"Модель '{model_name}' не загружена для инференса. Сначала вызовите эндпоинт /load."
        )
        
    model = LOADED_MODELS[model_name]

    try:
        predictions_array = model.predict(request.X)
        predictions = predictions_array.to_list()

        return {
            "model_name": model_name,
            "predictions": predictions_list
        }
    except Exception as e:
        raise HTTPException(
            status_code=400,
            detail=f"Ошибка при выполнении предсказания моделью '{model_name}': {e}"
        )

@app.post('/load')
def load_model(config: ModelNameConfig):
    '''Функция для загрузки обученной модели в память для инференса'''
    model_name = config.model_name
    model_path = os.path.join(settings.MODELS_PATH, f'{model_name}.joblib')
    
    if model_name in LOADED_MODELS:
        return {"message": f"Модель {model_name} уже загружена"}

    try:
        model = joblib.load(model_path)
        LOADED_MODELS[model_name] = model
        return {"message": f"Модель '{model_name}' успешно загружена в память."}
    except Exception as e:
        raise HTTPException(status_code=500, detail=f"Не удалось загрузить модель '{model_name}': {e}")

@app.post('/unload')
def unload_model(config: ModelNameConfig):
    '''Функция для выгрузки обученной модели из память'''
    model_name = config.model_name

    if model_name not in LOADED_MODELS:
        return {"message": f"Модель '{model_name}' уже выгружена из памяти."} 

    del LOADED_MODELS[model_name]
    return {"message": f"Модель '{model_name}' успешно выгружена из памяти."}

@app.post('/remove')
def remove_model(config: ModelNameConfig):
    """Удалить файл обученной модели с диска."""
    model_name = config.model_name

    if model_name in LOADED_MODELS:
        raise HTTPException(status_code=409, detail=f"Модель '{model_name}' сейчас загружена для инференса. Выгрузите ее перед удалением.")

    model_path = os.path.join(settings.MODELS_PATH, f'{model_name}.joblib')

    if not os.path.exists(model_path):
        raise HTTPException(status_code=404, detail=f"Файл модели '{model_name}' не найден на диске.")

    try:
        os.remove(model_path)
        return {"message": f"Файл модели '{model_name}' успешно удален с диска."}
    except Exception as e:
        raise HTTPException(status_code=500, detail=f"Ошибка при удалении файла модели: {e}")


@app.post('/remove_all')
def remove_all_models():
    if LOADED_MODELS:
        raise HTTPException(status_code=409, detail=f"Невозможно удалить все модели, так как некоторые из них загружены в память. Сначала выгрузите все модели.")

    folder = settings.MODELS_PATH
    if not os.path.isdir(folder):
        return {"message": "Директория с моделями не существует. Нечего удалять."}
    
    try:
        shutil.rmtree(folder)
        os.makedirs(folder, exist_ok=True)
        
        return {"message": f"Все модели из директории '{folder}' были успешно удалены."}
    
    except Exception as e:
        raise HTTPException(status_code=500, detail=f"Произошла ошибка при удалении директории с моделями: {e}")






    

In [3]:
!uv add scikit-learn xgboost lightgbm catboost

[2K[2mResolved [1m86 packages[0m [2min 766ms[0m[0m                                        [0m
[2K[2mPrepared [1m7 packages[0m [2min 2m 34s[0m[0m                                            
[2K[2mInstalled [1m17 packages[0m [2min 970ms[0m[0m                              [0m
 [32m+[39m [1mcatboost[0m[2m==1.2.8[0m
 [32m+[39m [1mcontourpy[0m[2m==1.3.3[0m
 [32m+[39m [1mcycler[0m[2m==0.12.1[0m
 [32m+[39m [1mfonttools[0m[2m==4.61.1[0m
 [32m+[39m [1mgraphviz[0m[2m==0.21[0m
 [32m+[39m [1mkiwisolver[0m[2m==1.4.9[0m
 [32m+[39m [1mlightgbm[0m[2m==4.6.0[0m
 [32m+[39m [1mmatplotlib[0m[2m==3.10.8[0m
 [32m+[39m [1mnarwhals[0m[2m==2.15.0[0m
 [32m+[39m [1mnvidia-nccl-cu12[0m[2m==2.29.2[0m
 [32m+[39m [1mpandas[0m[2m==2.3.3[0m
 [32m+[39m [1mpillow[0m[2m==12.1.0[0m
 [32m+[39m [1mplotly[0m[2m==6.5.2[0m
 [32m+[39m [1mpyparsing[0m[2m==3.3.1[0m
 [32m+[39m [1mpytz[0m[2m==2025.2[0m
 [32m+[39m [1mtz

In [2]:
from pydantic import BaseModel, Field
from typing import List, Literal, Union

class BaseModelConfig(BaseModel):
    '''
    Базовая конфигурация модели
    '''
    model_name: str = Field(..., max_length=50, description="Уникальное имя модели")

class LogisticRegressionConfig(BaseModelConfig):
    """Конфигурация для обучения sklearn.linear_model.LogisticRegression."""
    
    model_type: Literal['LogisticRegression']
    
    penalty: Literal['l1', 'l2', 'elasticnet', 'none'] = 'l2'
    C: float = Field(1.0, gt=0)
    solver: Literal['newton-cg', 'lbfgs', 'liblinear', 'sag', 'saga'] = 'lbfgs'


class RandomForestConfig(BaseModelConfig):
    """Конфигурация для обучения sklearn.ensemble.RandomForestClassifier."""

    model_type: Literal['RandomForestClassifier']
    
    n_estimators: int = Field(100, gt=0)
    max_depth: int | None = Field(None, ge=1)
    min_samples_split: int = Field(2, ge=2)
    criterion: Literal['gini', 'entropy', 'log_loss'] = 'gini'


class XGBoostConfig(BaseModelConfig):
    """Конфигурация для обучения xgboost.XGBClassifier."""

    model_type: Literal['XGBClassifier']
    
    n_estimators: int = Field(100, gt=0)
    learning_rate: float = Field(0.1, gt=0)
    max_depth: int = Field(3, ge=0)


class LightGBMConfig(BaseModelConfig):
    """Конфигурация для обучения lightgbm.LGBMClassifier."""

    model_type: Literal['LGBMClassifier']
    
    n_estimators: int = Field(100, gt=0)
    learning_rate: float = Field(0.1, gt=0)
    num_leaves: int = Field(31, gt=1)

class CatBoostConfig(BaseModelConfig):
    """Конфигурация для обучения catboost.CatBoostClassifier."""
    model_type: Literal['CatBoostClassifier']
    
    iterations: int = Field(1000, gt=0)
    learning_rate: float = Field(0.03, gt=0)
    depth: int = Field(6, ge=1, le=16)
    verbose: bool = False

AnyModelConfig = Union[
    LogisticRegressionConfig,
    RandomForestConfig,
    XGBoostConfig,
    LightGBMConfig,
    CatBoostConfig,
]

class FitRequest(BaseModel):
    '''Pydantic-модель для тела POST-запроса на эндпоинт /fit''' 
    X: List[List[float]] = Field(..., description="Матрица признаков для обучения")
    y: List[int] = Field(..., description="Вектор целевой переменной")

    config: AnyModelConfig = Field(..., discriminator='model_type')
    

