# **Support Vector Machines (SVM)**  
### *Maszyny wektorów nośnych*

---

## **English**

Support Vector Machines (SVM) are powerful supervised learning algorithms used for both classification and regression tasks. The main idea behind SVM is to find the optimal hyperplane that separates different classes with the maximum margin.

### **Key Concepts**

1. **Support Vectors**: Data points that lie closest to the decision boundary
2. **Hyperplane**: The decision boundary that separates classes
3. **Margin**: The distance between the hyperplane and the nearest data points
4. **Kernel Trick**: Transform data into higher dimensions to make it linearly separable

### **Mathematical Foundation**

For a binary classification problem, SVM tries to find the hyperplane defined by:

$$
w^T x + b = 0
$$

The optimization problem is:

$$
\min_{w,b} \frac{1}{2}||w||^2 + C\sum_{i=1}^{n}\xi_i
$$

Subject to:
$$
y_i(w^T x_i + b) \geq 1 - \xi_i, \quad \xi_i \geq 0
$$

where $C$ is the regularization parameter and $\xi_i$ are slack variables.

### **Kernel Functions**

Common kernel functions include:
- **Linear**: $K(x_i, x_j) = x_i^T x_j$
- **Polynomial**: $K(x_i, x_j) = (x_i^T x_j + c)^d$
- **RBF (Gaussian)**: $K(x_i, x_j) = \exp(-\gamma ||x_i - x_j||^2)$

---

## **Polish**

Maszyny wektorów nośnych (SVM) to potężne algorytmy uczenia nadzorowanego używane zarówno do zadań klasyfikacji, jak i regresji. Główną ideą SVM jest znalezienie optymalnej hiperpłaszczyzny, która separuje różne klasy z maksymalnym marginesem.

### **Kluczowe pojęcia**

1. **Wektory nośne**: Punkty danych leżące najbliżej granicy decyzyjnej
2. **Hiperpłaszczyzna**: Granica decyzyjna separująca klasy
3. **Margines**: Odległość między hiperpłaszczyzną a najbliższymi punktami danych
4. **Sztuczka jądra**: Transformacja danych do wyższych wymiarów w celu uczynienia ich liniowo separowalnymi

### **Podstawy matematyczne**

Dla problemu klasyfikacji binarnej, SVM próbuje znaleźć hiperpłaszczyznę zdefiniowaną przez:

$$
w^T x + b = 0
$$

Problem optymalizacji to:

$$
\min_{w,b} \frac{1}{2}||w||^2 + C\sum_{i=1}^{n}\xi_i
$$

z warunkami:
$$
y_i(w^T x_i + b) \geq 1 - \xi_i, \quad \xi_i \geq 0
$$

gdzie $C$ to parametr regularyzacji, a $\xi_i$ to zmienne luzu.


In [1]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.svm import SVC
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
from sklearn.datasets import make_classification, make_circles, make_moons
from sklearn.preprocessing import StandardScaler
import seaborn as sns

# Generate linearly separable data
# Generowanie danych liniowo separowalnych
np.random.seed(42)
X_linear, y_linear = make_classification(n_samples=200, n_features=2, n_redundant=0, 
                                        n_informative=2, n_clusters_per_class=1, 
                                        class_sep=2, random_state=42)

# Split the data
# Podział danych
X_train, X_test, y_train, y_test = train_test_split(X_linear, y_linear, test_size=0.2, random_state=42)

# Standardize the features
# Standaryzacja cech
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Train SVM with linear kernel
# Trenowanie SVM z jądrem liniowym
svm_linear = SVC(kernel='linear', C=1.0, random_state=42)
svm_linear.fit(X_train_scaled, y_train)

# Make predictions
# Przewidywania
y_pred_linear = svm_linear.predict(X_test_scaled)

# Calculate metrics
# Obliczenie metryk
accuracy_linear = accuracy_score(y_test, y_pred_linear)

print(f"Linear SVM Accuracy | Dokładność liniowego SVM: {accuracy_linear:.3f}")
print(f"Number of support vectors | Liczba wektorów nośnych: {len(svm_linear.support_)}")
print(f"Support vectors per class | Wektory nośne na klasę: {svm_linear.n_support_}")

print("\nClassification Report | Raport klasyfikacji:")
print(classification_report(y_test, y_pred_linear))


Linear SVM Accuracy | Dokładność liniowego SVM: 0.975
Number of support vectors | Liczba wektorów nośnych: 22
Support vectors per class | Wektory nośne na klasę: [11 11]

Classification Report | Raport klasyfikacji:
              precision    recall  f1-score   support

           0       1.00      0.96      0.98        23
           1       0.94      1.00      0.97        17

    accuracy                           0.97        40
   macro avg       0.97      0.98      0.97        40
weighted avg       0.98      0.97      0.98        40

