In [1]:
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.svm import SVC
from sklearn.linear_model import LogisticRegression
import xgboost as xgb
import pandas as pd

def train_model(dataset, model_type='svm', **kwargs):
    """
    Funkcja trenująca model na podstawie podanego zbioru danych i modelu.

    Args:
        dataset: Ramka danych zawierająca cechy i etykiety.
        model_type: Typ modelu do wytrenowania ('svm' dla SVM, 'logistic' dla regresji logistycznej, 'xgboost' dla XGBoost).
        **kwargs: Dodatkowe argumenty przekazywane do konstruktora modelu.

    Returns:
        model: Wytrenowany model.
        accuracy: Dokładność modelu na zestawie testowym.
    """
    # Podziel ramkę danych na cechy (X) i etykiety (y)
    X = dataset.iloc[:, :-1]
    y = dataset.iloc[:, -1]

    # Podziel dane na zestawy treningowy i testowy
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

    # Wybierz model na podstawie podanego typu
    if model_type == 'svm':
        model = SVC(**kwargs)
    elif model_type == 'logistic':
        model = LogisticRegression(**kwargs)
    elif model_type == 'xgboost':
        model = xgb.XGBClassifier(**kwargs)

    # Trenowanie modelu na danych treningowych
    model.fit(X_train, y_train)

    # Przewidywanie na danych testowych
    y_pred = model.predict(X_test)

    # Ocenianie dokładności modelu
    accuracy = accuracy_score(y_test, y_pred)

    return model, accuracy

## Diabetes

In [18]:
# Zaimportuj dane diabetes
diabetes = pd.read_csv("diabetes_data.csv")

# Wytrenuj modele SVM, regresji logistycznej i XGBoost za pomocą funkcji
svm_model, svm_accuracy = train_model(diabetes, model_type='svm', kernel='rbf', C=1.0)
logistic_model, logistic_accuracy = train_model(diabetes, model_type='logistic')
xgboost_model, xgboost_accuracy = train_model(diabetes, model_type='xgboost')

print("Dokładność modelu SVM:", svm_accuracy)
print("Dokładność modelu regresji logistycznej:", logistic_accuracy)
print("Dokładność modelu XGBoost:", xgboost_accuracy)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


Dokładność modelu SVM: 0.7482848857769291
Dokładność modelu regresji logistycznej: 0.7440413041940731
Dokładność modelu XGBoost: 0.7488506966546432


## Hypertension

In [5]:
# Zaimportuj dane hypertension
hypertension = pd.read_csv("hypertension_data.csv")
# NaN_count = hypertension.isna().sum()
# hypertension = hypertension.dropna()

# Wytrenuj modele SVM, regresji logistycznej i XGBoost za pomocą funkcji
svm_model, svm_accuracy = train_model(hypertension, model_type='svm', kernel='rbf', C=1.0)
logistic_model, logistic_accuracy = train_model(hypertension, model_type='logistic')
xgboost_model, xgboost_accuracy = train_model(hypertension, model_type='xgboost')

print("Dokładność modelu SVM:", svm_accuracy)
print("Dokładność modelu regresji logistycznej:", logistic_accuracy)
print("Dokładność modelu XGBoost:", xgboost_accuracy)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


Dokładność modelu SVM: 0.7536454336147352
Dokładność modelu regresji logistycznej: 0.8451650038372985
Dokładność modelu XGBoost: 1.0


## Stroke

In [7]:
# Zaimportuj dane stroke
stroke = pd.read_csv("stroke_data.csv")
NaN_count = stroke.isna().sum()
stroke = stroke.dropna()

# Wytrenuj modele SVM, regresji logistycznej i XGBoost za pomocą funkcji
svm_model, svm_accuracy = train_model(stroke, model_type='svm', kernel='rbf', C=1.0)
logistic_model, logistic_accuracy = train_model(stroke, model_type='logistic')
xgboost_model, xgboost_accuracy = train_model(stroke, model_type='xgboost')

print("Dokładność modelu SVM:", svm_accuracy)
print("Dokładność modelu regresji logistycznej:", logistic_accuracy)
print("Dokładność modelu XGBoost:", xgboost_accuracy)

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


Dokładność modelu SVM: 0.651185529210462
Dokładność modelu regresji logistycznej: 0.6786849181129309
Dokładność modelu XGBoost: 0.9973111708628697
