<a href="https://colab.research.google.com/github/yamaguchinorimitsu/ajax_app/blob/master/%E5%8F%82%E8%80%83%E3%82%B3%E3%83%BC%E3%83%89.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd
from sklearn.ensemble import RandomForestRegressor, RandomForestClassifier
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.impute import SimpleImputer
from sklearn.metrics import mean_squared_error, accuracy_score
from sklearn.model_selection import train_test_split

# CSVファイルの読み込み
data = pd.read_csv('data.csv')

# 欠損値の調査
missing_values = data.isnull().sum()
print("欠損値の数:\n", missing_values)

# 欠損値の補完（平均値で補完）
imputer = SimpleImputer(strategy='mean')
data_imputed = imputer.fit_transform(data)

# データを説明変数と目的変数に分割
X = data_imputed.drop('target', axis=1)
y = data_imputed['target']

# データの分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 回帰モデル（ランダムフォレスト回帰）の作成と学習
regressor_rf = RandomForestRegressor(max_depth=10, random_state=42)
regressor_rf.fit(X_train, y_train)

# 回帰モデル（線形回帰）の作成と学習
regressor_lr = LinearRegression()
regressor_lr.fit(X_train, y_train)

# 分類モデル（ランダムフォレスト分類）の作成と学習
classifier_rf = RandomForestClassifier(max_depth=10, random_state=42)
classifier_rf.fit(X_train, y_train)

# 分類モデル（ロジスティック回帰）の作成と学習
classifier_lr = LogisticRegression(random_state=42)
classifier_lr.fit(X_train, y_train)

# テストデータの予測
y_pred_rf = regressor_rf.predict(X_test)
y_pred_lr = regressor_lr.predict(X_test)
y_pred_rf_class = classifier_rf.predict(X_test)
y_pred_lr_class = classifier_lr.predict(X_test)

# 回帰モデルの評価（平均二乗誤差）
mse_rf = mean_squared_error(y_test, y_pred_rf)
mse_lr = mean_squared_error(y_test, y_pred_lr)

# 分類モデルの評価（正解率）
accuracy_rf = accuracy_score(y_test, y_pred_rf_class)
accuracy_lr = accuracy_score(y_test, y_pred_lr_class)

print("ランダムフォレスト回帰モデルの評価（平均二乗誤差）:", mse_rf)
print("線形回帰モデルの評価（平均二乗誤差）:", mse_lr)
print("ランダムフォレスト分類モデルの評価（正解率）:", accuracy_rf)
print("ロジスティック回帰モデルの評価（正解率）:", accuracy_lr)