# Support Vector Machine jako algorytm uczenia maszynowego do danych biomedycznych

    Analizując statystyki wykorzystywanych  algorytmów uczenia maszynowego powstał poniższy graf

![title](healthcarealgorythms.png)
<h6><center><i>Figure: The most popular Machine Learning algorithms used in the medical literature. The data are generated through searching the Machine Learning algorithms within healthcare on PubMed</i></center></h6>

SVM (Support Vector Machine - Maszyna Wektrów Nośnych) jest to algortym uczenia z nadzorem do wykorzystania przy problemach klasyfikacji lub regresji. Jest jednak szeroko wykorzystywany przy klasyfikacji, w której wymagane jest podzielenie danych na dwie klasy przy pomocy płaszczyzny. Celem jest wybraniej takiej płaszczyzny by margines lub odległość między hiperpłaszczyzna a dowolonym punktem w zbiorze treningowym był jak największy żeby móc prawidłowo klasyfikować nowe dane. Wektory wsparcia to punkty danych, które są najbliżej hiperpłaszczyzny i które, jeśli zostaną usunięte, zmienią jej położenie. W SVM określenie parametrów modelu jest problemem optymalizacji wypukłej, więc rozwiązanie jest zawsze optymalne globalnie.
SVM są szeroko stosowane w badaniach klinicznych, na przykład w celu identyfikacji biomarkerów obrazowania, diagnozowania nowotworów lub chorób neurologicznych oraz ogólnie do klasyfikacji danych z niezrównoważonych zbiorów danych lub zestawów danych z brakującymi wartościami.

Zaletami korzystania z algorytmów SVM w uczeniu maszynowym są:
- Skuteczność w przestrzanich o dużych wymiarach
- Skuteczność w przypadkach, gdy liczba wymiarów jest większa niż liczba próbek
- Wydajność pod względem pamięci przez wykorzystywanie funkcji decyzyjnej w zbiorze treningowym (wektory wsparcia)
- Wszechstronność

SVM mają też swoje wady:
- Jeśli liczba funkcji jest znacznie większa niż liczba próbek, należy unikać nadmiernego dopasowania w wyborze funkcji jądra, a regularyzacja ma kluczowe znaczenie
- Maszyny SVM nie dostarczają bezpośrednio szacunków prawdopodobieństwa, są one obliczane przy użyciu kosztownej pięciokrotnej walidacji krzyżowej

Istnieje kilka rodzajów algorytmów opartych na SVM. W pakiecie do języka Python sklearn, klasy SVC (C-Support Vector Classification), NuSVC (Nu-Support Vector Classification) oraz LinearSVC (Linear Support Vector Classification) są w stanie wykonać klasyfikacje wielu klas w datasecie. Wizualizacja podanych algorytmów poniżej:

![title](svc.png)

Dalej zostaną przedstawione wyniki klasyfikacji retinopatii cukrzycowej z datasetu, z którego korzystano we wcześniejszych testach.

In [None]:
from scipy.io import arff
from sklearn.svm import LinearSVC
from sklearn.metrics import accuracy_score
import pandas as pd
from sklearn.svm import NuSVC
from sklearn import svm

from sklearn.model_selection import train_test_split
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:80% !important; }</style>"))

In [None]:


HTML('''<script>
code_show=true; 
function code_toggle() {
 if (code_show){
 $('div.input').hide();
 } else {
 $('div.input').show();
 }
 code_show = !code_show
} 
$( document ).ready(code_toggle);
</script>
<form action="javascript:code_toggle()"><input type="submit" value="Click here to toggle on/off the raw code."></form>''')

In [None]:
data = arff.loadarff('rethinpathy.arff')
df = pd.DataFrame(data[0])
df[df.columns[0:8]] = df[df.columns[0:8]].astype(int)
df[df.columns[18:20]] = df[df.columns[18:20]].astype(int)
col_names = ['Quality', 'Pre-screening', 'MA result1', 'MA result2', 'MA result3', 'MA result4', 'MA result5', 'MA result6', 'Exudates result1', 'Exudates result2', 'Exudates result3', 'Exudates result4', 'Exudates result5', 'Exudates result6', 'Exudates result7',
            'Exudates result', 'Macula - Optic disc dist', 'Optic disc diameter', 'AM/FM classification', 'Class']
df.columns = col_names
data = df[df.columns[0:19]]
target = df['Class']

data_train, data_test, target_train, target_test = train_test_split(data,target, test_size = 0.20, random_state = 10)

## LinearSVC

In [None]:
svc_model = LinearSVC(random_state=0, max_iter=10000000)

pred = svc_model.fit(data_train, target_train).predict(data_test)

print("LinearSVC acc: ", accuracy_score(target_test, pred, normalize=True))

## SVC

In [None]:
clf = svm.SVC(gamma=0.001, C=100.)

pred2 = clf.fit(data_train, target_train).predict(data_test)
print("SVC acc: ", accuracy_score(target_test, pred2, normalize=True))

## NuSVC

In [None]:
nuclf = NuSVC(nu=0.2, gamma='scale')
pred3 = nuclf.fit(data_train, target_train).predict(data_test)
print("NuSVC acc: ", accuracy_score(target_test, pred3, normalize=True))

SVC i NuSVC są podobnymi metodami, ale akceptują nieco inne zestawy parametrów i mają różne formuły matematyczne. LinearSVC jest implementacją Klasyfikacji Wektorów Wsparcia dla przypadku jądra liniowego. Jak inne klasyfikatory, SVC, NuSVC i LinearSVC przyjmują jako dane wejściowe dwie tablice: tablicę X o rozmiarze [n_samples, n_features] przechowującą próbki treningowe oraz tablicę y etykiet klasowych (łańcuchy lub liczby całkowite). Po dopasowaniu model można następnie wykorzystać do przewidywania nowych wartości. Funkcja decyzyjna SVM, tak jak wczesniej wspomniane, zależy od podzbioru danych treningowych, zwanych wektorami wsparcia.

W przypadku danych wykorzystanych przy tych testach, najlepsze wyniki daje LinearSVC. Być może dalsze eksperymenty z parametrami powyższych metod mogą dać nieco lepsze wyniki. 