$\[
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}\]$



**Bayesian Linear Regression**

In [1]:
# Импорт необходимых библиотек
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.linear_model import BayesianRidge
from sklearn.metrics import mean_squared_error, r2_score

# Загрузка набора данных Diabetes
diabetes = load_diabetes()
X = diabetes.data  # Признаки
y = diabetes.target  # Целевая переменная

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Создание и обучение модели Байесовской линейной регрессии
model = BayesianRidge()
model.fit(X_train, y_train)

# Предсказание на тестовых данных
y_pred = model.predict(X_test)

# Оценка качества модели
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f"Среднеквадратичная ошибка (MSE): {mse:.2f}")
print(f"Коэффициент детерминации (R^2): {r2:.2f}")

Среднеквадратичная ошибка (MSE): 2871.76
Коэффициент детерминации (R^2): 0.46


**Gaussian Naive Bayes**

In [2]:
# Импорт необходимых библиотек
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.metrics import accuracy_score, classification_report

# Загрузка набора данных Iris
iris = load_iris()
X = iris.data  # Признаки
y = iris.target  # Целевая переменная

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Создание и обучение модели Gaussian Naive Bayes
model = GaussianNB()
model.fit(X_train, y_train)

# Предсказание на тестовых данных
y_pred = model.predict(X_test)

# Оценка качества модели
accuracy = accuracy_score(y_test, y_pred)
print(f"Точность модели: {accuracy:.2f}")
print("\nОтчет о классификации:")
print(classification_report(y_test, y_pred, target_names=iris.target_names))

Точность модели: 1.00

Отчет о классификации:
              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        10
  versicolor       1.00      1.00      1.00         9
   virginica       1.00      1.00      1.00        11

    accuracy                           1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30



**Bayesian Logistic Regression**

In [3]:
# Импорт необходимых библиотек
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, classification_report

# Загрузка набора данных Iris
iris = load_iris()
X = iris.data  # Признаки
y = iris.target  # Целевая переменная

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Создание и обучение модели Байесовской логистической регрессии
model = LogisticRegression(solver='lbfgs', multi_class='auto', max_iter=200)
model.fit(X_train, y_train)

# Предсказание на тестовых данных
y_pred = model.predict(X_test)

# Оценка качества модели
accuracy = accuracy_score(y_test, y_pred)
print(f"Точность модели: {accuracy:.2f}")
print("\nОтчет о классификации:")
print(classification_report(y_test, y_pred, target_names=iris.target_names))

Точность модели: 1.00

Отчет о классификации:
              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        10
  versicolor       1.00      1.00      1.00         9
   virginica       1.00      1.00      1.00        11

    accuracy                           1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30





**Multinomial Naive Bayes**

In [4]:
# Импорт необходимых библиотек
from sklearn.datasets import fetch_20newsgroups
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.metrics import accuracy_score, classification_report
from sklearn.model_selection import train_test_split

# Загрузка набора данных 20 Newsgroups
categories = ['alt.atheism', 'soc.religion.christian', 'comp.graphics', 'sci.med']
newsgroups = fetch_20newsgroups(subset='all', categories=categories)

# Преобразование текста в числовые признаки
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(newsgroups.data)
y = newsgroups.target

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Создание и обучение модели Multinomial Naive Bayes
model = MultinomialNB()
model.fit(X_train, y_train)

# Предсказание на тестовых данных
y_pred = model.predict(X_test)

# Оценка качества модели
accuracy = accuracy_score(y_test, y_pred)
print(f"Точность модели: {accuracy:.2f}")
print("\nОтчет о классификации:")
print(classification_report(y_test, y_pred, target_names=newsgroups.target_names))

Точность модели: 0.90

Отчет о классификации:
                        precision    recall  f1-score   support

           alt.atheism       1.00      0.74      0.85       175
         comp.graphics       0.98      0.94      0.96       200
               sci.med       0.99      0.91      0.95       200
soc.religion.christian       0.71      0.99      0.82       177

              accuracy                           0.90       752
             macro avg       0.92      0.90      0.90       752
          weighted avg       0.93      0.90      0.90       752



**VB-K-means (Variational Bayesian K-means)**

In [5]:
# Импорт необходимых библиотек
from sklearn.datasets import load_iris
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score

# Загрузка набора данных Iris
iris = load_iris()
X = iris.data  # Признаки

# Создание и обучение модели K-means
model = KMeans(n_clusters=3, random_state=42)
model.fit(X)

# Предсказание кластеров
y_pred = model.labels_

# Оценка качества кластеризации
silhouette = silhouette_score(X, y_pred)
print(f"Силуэтный коэффициент: {silhouette:.2f}")

Силуэтный коэффициент: 0.55


**Dirichlet Process Mixture Models (DPMM)**

In [6]:
# Импорт необходимых библиотек
from sklearn.datasets import load_iris
from sklearn.mixture import BayesianGaussianMixture
from sklearn.metrics import silhouette_score

# Загрузка набора данных Iris
iris = load_iris()
X = iris.data  # Признаки

# Создание и обучение модели DPMM
model = BayesianGaussianMixture(n_components=3, random_state=42)
model.fit(X)

# Предсказание кластеров
y_pred = model.predict(X)

# Оценка качества кластеризации
silhouette = silhouette_score(X, y_pred)
print(f"Силуэтный коэффициент: {silhouette:.2f}")

Силуэтный коэффициент: 0.37


**Variational Bayesian Gaussian Mixture Model (VB-GMM)**

In [7]:
# Импорт необходимых библиотек
from sklearn.datasets import load_iris
from sklearn.mixture import BayesianGaussianMixture
from sklearn.metrics import silhouette_score

# Загрузка набора данных Iris
iris = load_iris()
X = iris.data  # Признаки

# Создание и обучение модели VB-GMM
model = BayesianGaussianMixture(n_components=3, random_state=42)
model.fit(X)

# Предсказание кластеров
y_pred = model.predict(X)

# Оценка качества кластеризации
silhouette = silhouette_score(X, y_pred)
print(f"Силуэтный коэффициент: {silhouette:.2f}")

Силуэтный коэффициент: 0.37
