In [1]:
import joblib
from dataclasses import dataclass, field, asdict
from src.processing import process_text

In [2]:
MODEL_PATH = "../models/logreg_tfidf_v_0_1_1.joblib"

In [4]:
text = '''
    Зимой я люблю кататься на лыжах. Как правило, я просто бегаю по парку.
    Но иногда я езжу в Красную Поляну, где катаюсь на горных лыжах всю зиму.
    Благо, у меня удаленная работа, и я могу совмещать любимый спорт, работу
    и страсть к путешествиям.
'''

In [9]:
@dataclass
class Prediction:
    label: str
    probabilities: dict[str, float] = field(default_factory=dict)

In [10]:
def predict(text: str) -> Prediction:    
    text_processed = process_text(text)    

    model = joblib.load(MODEL_PATH)
        
    probs = model.predict_proba([text_processed])[0].round(4).tolist()
    class_names = model.classes_
    probabilities = {class_name: prob for class_name, prob in zip(class_names, probs)}
    label = max(probabilities, key=lambda k: probabilities[k])
   
    return Prediction(label=label, probabilities=probabilities)

In [11]:
result = predict(text)

In [15]:
print("Предсказанный класс:", result.label)

Предсказанный класс: winter_sport


In [16]:
asdict(result)

{'label': 'winter_sport',
 'probabilities': {'athletics': 0.0201,
  'autosport': 0.0026,
  'basketball': 0.0023,
  'boardgames': 0.0033,
  'esport': 0.0007,
  'extreme': 0.0336,
  'football': 0.0024,
  'hockey': 0.0015,
  'martial_arts': 0.0026,
  'motosport': 0.0408,
  'tennis': 0.0021,
  'volleyball': 0.0019,
  'winter_sport': 0.8862}}