# Preparació de les dades

In [9]:
from sklearn import datasets

import numpy as np

iris = datasets.load_iris()

X = iris.data[:,[2,3]]
y = iris.target

# Separació en conjunts d'entrenament (70%) i test (30%)

In [10]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.3, random_state = 1, stratify = y)

# Estandardització

In [11]:
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
sc.fit(X_train)
X_train_std = sc.transform(X_train)
X_test_std = sc.transform(X_test)

# En aquesta tasca no es demana que calculem cap mètrica per avaluar els models, una vegada entrenats.
# Per aquesta raó, no farem servir X_test_std (ni X_text, ni y_test)

# Entrenament dels models

## Logistic Regression

In [12]:
from sklearn.linear_model import LogisticRegression

lr = LogisticRegression(C=100.0,
                        random_state = 1,
                        solver = 'lbfgs',
                        multi_class='ovr')
lr.fit(X_train_std, y_train)

## SVM

In [13]:
from sklearn.svm import SVC

svm = SVC(kernel='linear',C=1.0, random_state=1, probability=True)

svm.fit(X_train_std, y_train)

## Decission Trees

In [14]:
from sklearn.tree import DecisionTreeClassifier

dt = DecisionTreeClassifier(criterion='gini',max_depth=4,
                                    random_state=1)
dt.fit(X_train_std,y_train)
# En el cas dels arbres de decisió, l'escalat no té cap efecte.
# Podríem entrenar el model directament amb X_train.
# Per mantenir la coherència amb els altres models i simplificar el servei,
#  entrenam també aquest model amb les dades normalitzades.

## KNN

In [15]:
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=3, p=2, metric='minkowski')

knn.fit(X_train_std, y_train)

# Serialització dels models

In [16]:
import pickle

# A més de cada model, hem de serialitzar el StandardScaler (sc)
#  per poder aplicar la mateixa transformació a les dades d'entrada de les prediccions

with open('../models/lr.pck', 'wb') as f:
    pickle.dump((sc, lr), f)

with open('../models/svm.pck', 'wb') as f:
    pickle.dump((sc, svm), f)

with open('../models/dt.pck', 'wb') as f:
    pickle.dump((sc, dt), f)

with open('../models/knn.pck', 'wb') as f:
    pickle.dump((sc, knn), f)
