In [4]:
#linear 

import pandas as pd
from sklearn.model_selection import train_test_split, RandomizedSearchCV
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
from scipy.stats import uniform

# Laad de data
data = pd.read_csv('UniversalBank.csv')

# Gebruik een kleiner deel van de data voor hyperparameter optimalisatie
data_subset = data.sample(frac=0.02, random_state=42)  # Verkleind tot 2%

# Verwijder de kolommen die geen nuttige informatie bevatten
X_subset = data_subset.drop(columns=['ID', 'ZIP Code', 'Personal Loan'])  
y_subset = data_subset['Personal Loan'] 

# Split de data in train en test voor hyperparameter optimalisatie
X_train_subset, X_test_subset, y_train_subset, y_test_subset = train_test_split(X_subset, y_subset, test_size=0.2, random_state=42)

# Definieer een pipeline met StandardScaler en SVC
model = Pipeline([
    ('scaler', StandardScaler()),  
    ('svc', SVC())  
])

# Definieer de parameterdistributie voor SVC
param_dist = {
    'svc__C': uniform(0.1, 10),
    'svc__kernel': ['linear', 'rbf', 'poly'],
    'svc__gamma': ['scale', 'auto']
}

# Maak een RandomizedSearchCV object met minder iteraties en minder cross-validatie vouwen
random_search = RandomizedSearchCV(model, param_dist, n_iter=5, cv=2, scoring='accuracy', random_state=42)

# Pas het RandomizedSearchCV object toe op de data subset
random_search.fit(X_train_subset, y_train_subset)

# Haal de beste parameters en het beste model op
best_params = random_search.best_params_
best_model = random_search.best_estimator_

# Gebruik de volledige dataset voor de uiteindelijke evaluatie
X = data.drop(columns=['ID', 'ZIP Code', 'Personal Loan'])
y = data['Personal Loan']

# Voorspel op de test data met het beste model
y_pred = best_model.predict(X)

# Bereken de algemene evaluatiemetric
accuracy = accuracy_score(y, y_pred)
print(f'Accuracy: {accuracy}')


Accuracy: 0.891


In [6]:
#non linear

import pandas as pd
from sklearn.model_selection import train_test_split, RandomizedSearchCV
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
from scipy.stats import uniform, randint

# Laad de data
data = pd.read_csv('UniversalBank.csv')

# Gebruik een kleiner deel van de data voor hyperparameter optimalisatie
data_subset = data.sample(frac=0.02, random_state=42)  # Verkleind tot 2%

# Verwijder de kolommen die geen nuttige informatie bevatten
X_subset = data_subset.drop(columns=['ID', 'ZIP Code', 'Personal Loan']) 
y_subset = data_subset['Personal Loan'] 

# Split de data in train en test voor hyperparameter optimalisatie
X_train_subset, X_test_subset, y_train_subset, y_test_subset = train_test_split(X_subset, y_subset, test_size=0.2, random_state=42)

# Definieer een pipeline met StandardScaler en SVC
model = Pipeline([
    ('scaler', StandardScaler()),  
    ('svc', SVC(kernel='rbf'))  
])

# Definieer de parameterdistributie voor SVC
param_dist = {
    'svc__C': uniform(0.1, 10),
    'svc__gamma': ['scale', 'auto']
}

# Maak een RandomizedSearchCV object met minder iteraties en minder cross-validatie vouwen
random_search = RandomizedSearchCV(model, param_dist, n_iter=5, cv=2, scoring='accuracy', random_state=42)

# Pas het RandomizedSearchCV object toe op de data subset
random_search.fit(X_train_subset, y_train_subset)

# Haal de beste parameters en het beste model op
best_params = random_search.best_params_
best_model = random_search.best_estimator_

# Gebruik de volledige dataset voor de uiteindelijke evaluatie
X = data.drop(columns=['ID', 'ZIP Code', 'Personal Loan'])
y = data['Personal Loan']

# Voorspel op de test data met het beste model
y_pred = best_model.predict(X)

# Bereken de algemene evaluatiemetric
accuracy = accuracy_score(y, y_pred)
print(f'Accuracy: {accuracy}')


Accuracy: 0.9278
