In [None]:
from sklearn.linear_model import LogisticRegression
from sklearn.multiclass import OneVsRestClassifier
from sklearn import datasets
import IPython.display as display
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

iris = datasets.load_iris()
X = iris.data[:, [2, 3]]
y = iris.target[:]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1, stratify=y)

sc = StandardScaler()
sc.fit(X_train)
X_train_std = sc.transform(X_train)
X_test_std = sc.transform(X_test)
# для не только взаимно исключающих классов(один объект может принадлежать двум классам)
# solver указывает алгоритм оптимизации функции издержек
# в данном случае это алгоритм Бройдена-Флетчера-Гольдфарба-Шанно с ограниченной памятью, он применяется и по умолчанию
# C - коэффициент регуляризации: чем он больше, тем регуляризация меньше, и наоборот(нужно для предотвращения переобучения)
# он добавляется к функции потерь(смотри в конспекте)
ovr_lr = OneVsRestClassifier(LogisticRegression(C=100.0, random_state=1, solver='lbfgs'))
ovr_lr.fit(X_train_std, y_train)

y_pred = ovr_lr.predict(X_test_std)
print(f"{round(accuracy_score(y_test, y_pred) * 100)}% accuracy")

98% accuracy


In [None]:
# лучше для взаимно исключающих классов(один объект может принадлежать только одному классу)
multinomial_lr = LogisticRegression(C=100.0, random_state=1, solver='lbfgs')
multinomial_lr.fit(X_train_std, y_train)

y_pred = multinomial_lr.predict(X_test_std)
print(f"{round(accuracy_score(y_test, y_pred) * 100)}% accuracy")

98% accuracy


In [None]:
ovr_lr.predict_proba(X_test_std[:3, :]) # в каждой строке вероятность принадлежности образца к каждому из трёх классов

array([[6.63770505e-09, 1.44747233e-01, 8.55252760e-01],
       [8.34031210e-01, 1.65968790e-01, 3.20815954e-13],
       [8.48822884e-01, 1.51177116e-01, 2.57998350e-14]])

In [None]:
ovr_lr.predict(X_test_std[:3, :]) # наиболее вероятные метки

array([2, 0, 0])

In [None]:
ovr_lr.predict(X_test_std[0, :] .reshape(1, -1)) # на случай если нужна метка лишь одного образца