# ロジスティック回帰

In [None]:
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression

# データセットの読み込み
df = load_breast_cancer()

X = df.data
y = df.target

# データセットを訓練データとテストデータに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ロジスティック回帰モデルの作成
model = LogisticRegression()

# モデルの訓練
model.fit(X_train, y_train)

# テストデータを用いたモデルの評価
score = model.score(X_test, y_test)

print(f'Test Accuracy: {score * 100:.2f}%')

# ナイーブベイズ

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB

# Irisデータセットの読み込み
iris = load_iris()
X = iris.data
y = iris.target

# データセットを訓練データとテストデータに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ガウシアンナイーブベイズモデルの作成
model = GaussianNB()

# モデルの訓練
model.fit(X_train, y_train)

# テストデータを用いたモデルの評価
score = model.score(X_test, y_test)

print(f'Test Accuracy: {score * 100:.2f}%')

# K近傍法

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

# データセットのロード
iris = load_iris()
X = iris.data
y = iris.target

# データセットの分割（訓練データ80%、テストデータ20%）
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)

# KNNモデルの作成と訓練（ここでは近傍点数を5としています）
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)

# テストデータを用いたモデルの評価
score = knn.score(X_test, y_test)

print(f'Test Accuracy: {score * 100:.2f}%')


# 決定木

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

# データセットのロード
iris = load_iris()
X = iris.data
y = iris.target

# データセットの分割（訓練データ80%、テストデータ20%）
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)

# 決定木モデルの作成と訓練（ここでは深さを3としています）
dt = DecisionTreeClassifier(max_depth=3, random_state=1)
dt.fit(X_train, y_train)

# テストデータを用いたモデルの評価
score = dt.score(X_test, y_test)

print(f'Test Accuracy: {score * 100:.2f}%')


# ランダムフォレスト

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

# データセットのロード
iris = load_iris()
X = iris.data
y = iris.target

# データセットの分割（訓練データ80%、テストデータ20%）
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)

# 決定木モデルの作成と訓練
dt = RandomForestClassifier(random_state=1)
dt.fit(X_train, y_train)

# テストデータを用いたモデルの評価
score = dt.score(X_test, y_test)

print(f'Test Accuracy: {score * 100:.2f}%')

# 勾配ブースティング(lightgbm)

In [None]:
from sklearn import datasets
from sklearn.model_selection import train_test_split
from lightgbm import LGBMClassifier
from sklearn.metrics import accuracy_score

# データセットのロード
iris = datasets.load_iris()
X = iris.data
y = iris.target

# データセットの分割（訓練データ80%、テストデータ20%）
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)

# LightGBMモデルの作成と訓練
lgb = LGBMClassifier(random_state=1)
lgb.fit(X_train, y_train)

# テストデータに対する予測と精度の計算
y_pred = lgb.predict(X_test)
print('Accuracy: %.2f' % accuracy_score(y_test, y_pred))

# pycaret 実践

In [None]:
!pip install pycaret==3.0.4  # 書籍執筆時点のバージョンをインストール


# 最新版をインストール場合はこちら
# !pip install pycaret 最新版をインストール

In [None]:
import pycaret


pycaret.__version__

In [None]:
from pycaret.datasets import get_data


data = get_data('iris')

In [None]:
from pycaret.classification import *


s = setup(data, target='species', session_id=123)

In [None]:
best = compare_models()

In [None]:
best