In [None]:
# train_model.ipynb
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.datasets import load_iris
import joblib

# Загрузка набора данных ирисов Фишера
iris = load_iris()
X = iris.data  # Признаки: длина и ширина чашелистика, длина и ширина лепестка
y = iris.target  # Целевая переменная: вид ириса

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Создание модели случайного леса
model = RandomForestClassifier(n_estimators=100, random_state=42)

# Обучение модели
model.fit(X_train, y_train)

# Оценка качества модели
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Точность модели: {accuracy:.4f}")
print("\nОтчет о классификации:")
print(classification_report(y_test, y_pred, target_names=iris.target_names))

# Сохранение модели в файл
joblib.dump(model, 'iris_model.joblib')
print("Модель успешно сохранена в файл iris_model.joblib")

# Словарь для маппинга индексов классов к названиям
class_mapping = {i: name for i, name in enumerate(iris.target_names)}
joblib.dump(class_mapping, 'class_mapping.joblib')
print("Маппинг классов сохранен в файл class_mapping.joblib")


Точность модели: 1.0000

Отчет о классификации:
              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        10
  versicolor       1.00      1.00      1.00         9
   virginica       1.00      1.00      1.00        11

    accuracy                           1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30

Модель успешно сохранена в файл iris_model.joblib
Маппинг классов сохранен в файл class_mapping.joblib


: 