In [1]:
import pandas as pd
import random

import joblib

In [2]:
model = joblib.load('model.pkl')
vectorizer = joblib.load('tfidf_vectorizer.pkl')

In [3]:
def smart_predict(skills_text, top1_threshold=0.3, min_prob_threshold=0.027):
    X_vec = vectorizer.transform([skills_text])
    
    proba = model.predict_proba(X_vec)[0]
    classes = model.classes_
    
    top_indices = proba.argsort()[::-1]
    
    top1_prob = proba[top_indices[0]]
    
    if top1_prob >= top1_threshold:
        result = [(classes[top_indices[0]], round(top1_prob * 100, 2))]
    else:
        result = []
        for idx in top_indices:
            if proba[idx] >= min_prob_threshold:
                result.append((classes[idx], round(proba[idx] * 100, 2)))
                
    if not result:
        result.append((classes[top_indices[0]], round(proba[top_indices[0]] * 100, 2)))
        result.append((classes[top_indices[1]], round(proba[top_indices[0]] * 100, 2)))
        result.append((classes[top_indices[2]], round(proba[top_indices[0]] * 100, 2)))
    
    return result

In [4]:
user_skills = "Python, Машинное обучение, Pandas, Статистика,"

# Предсказание
predictions = smart_predict(user_skills)

print("Предсказание на основе введенных навыков:")
for profession, probability in predictions:
    print(f"- {profession} ({probability}%)")

Предсказание на основе введенных навыков:
- Аналитик данных (6.49%)
- Специалист по данным (5.95%)


In [5]:
user_skills = "Kotlin, Android Studio, Jetpack Compose"

predictions = smart_predict(user_skills)

print("\n🎯 Предсказание на основе введенных навыков:")
for profession, probability in predictions:
    print(f"- {profession} ({probability}%)")


🎯 Предсказание на основе введенных навыков:
- Мобильный разработчик (8.72%)


In [6]:
user_skills = "Python, Машинное обучение, Анализ данных, Статистика, Работа в команде, Креативность"

# Предсказание
predictions = smart_predict(user_skills)

print("\n🎯 Предсказание на основе введенных навыков:")
for profession, probability in predictions:
    print(f"- {profession} ({probability}%)")


🎯 Предсказание на основе введенных навыков:
- Специалист по данным (3.84%)


In [8]:
user_skills = "Планирование проектов, Agile, Планирование спринтов"

# Предсказание
predictions = smart_predict(user_skills)

print("\n🎯 Предсказание на основе введенных навыков:")
for profession, probability in predictions:
    print(f"- {profession} ({probability}%)")


🎯 Предсказание на основе введенных навыков:
- Руководитель проектов (5.07%)


In [14]:
user_skills = "Бухгалтерский учет, Финансовый анализ, Финансовая отчетность"

# Предсказание
predictions = smart_predict(user_skills)

print("\n🎯 Предсказание на основе введенных навыков:")
for profession, probability in predictions:
    print(f"- {profession} ({probability}%)")


🎯 Предсказание на основе введенных навыков:
- Бухгалтер (21.59%)


In [15]:
user_skills = "Управление случаями, Кризисное вмешательство, Защита интересов клиента"

# Предсказание
predictions = smart_predict(user_skills)

print("\n🎯 Предсказание на основе введенных навыков:")
for profession, probability in predictions:
    print(f"- {profession} ({probability}%)")


🎯 Предсказание на основе введенных навыков:
- Психолог (7.68%)
- Социальный работник (4.01%)
