In [10]:
from support.datatools import *
from support.paths import *
from objectives.logist import *

%load_ext autoreload
%autoreload 1
%aimport support.datatools

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [11]:
# train, valid, test = extract_paths(VALID_FOLD, TEST_FOLD)
train_generator = batch_generator(train,
                                  batch_size=BATCH_SIZE, 
                                  in_shape=IN_SHAPE,
                                  lower=LOWER,
                                  upper=UPPER,
                                  shift=SHIFT,
                                  undersampling=UNDERSAMPLING,
                                  oversampling=OVERSAMPLING,
                                  CPU=CPU)

valid_generator = batch_generator(valid,
                                  batch_size=BATCH_SIZE, 
                                  in_shape=IN_SHAPE,
                                  lower=LOWER,
                                  upper=UPPER,
                                  shift=0, 
                                  undersampling=0,
                                  oversampling=1,
                                  CPU=CPU)

In [12]:
a = next(train_generator)

TypeError: only integer scalar arrays can be converted to a scalar index

In [4]:
TEST_FOLD = str(2)
VALID_FOLD = str(3)
SHIFT = 2
BATCH_SIZE = 32
NB_EPOCH = 20
OVERSAMPLING = .7
UNDERSAMPLING = 8
LOWER = -1000
UPPER = 400

IN_SHAPE = [(0, 22, 22), 
            (18, 0, 22), 
            (18, 22, 0)]

CPU = 6

In [9]:
class LR(ClassifierMixin, BaseEstimator):
    def __init__(self, lr=1, l1=1e-4, l2=1e-4, num_iter=1000, verbose=0):
        self.l1 = l1
        self.l2 = l2
        self.w = None
        self.lr = lr
        self.verbose = verbose
        self.num_iter = num_iter

    def fit_generator(self, train_generator, 
                      samples_per_epoch, nb_epoch, 
                      validation_data, 
                      nb_val_samples):
        """
        Обучение логистической регрессии.
        Настраивает self.w коэффициенты модели.
        Если self.verbose == True, то выводите значение 
        функции потерь на итерациях метода оптимизации. 
        :param X: numpy.array размера  (N, M), dtype = np.float
        :param y: numpy.array размера  (N,), dtype = np.int
        :return: self
        """
        for i in range(samples_per_epoch):
            X, y = next(train_generator)
            
            n, d = X.shape
        self.w = np.random.randn(d)
        self.w[self.w < -3] = -3
        self.w[self.w > 3] = 3

        for i in range(self.num_iter):
            w_new = self.w - self.lr * gradf(self.w, X, y, self.l1, self.l2)
                
            if self.verbose != 0:
                print "Iteration " + str(i) + ". Current loss is " + str(lossf(self.w, X, y, self.l1, self.l2))
            self.w = w_new
        return self

    def predict_proba(self, X):
        """
        Предсказание вероятности принадлежности объекта к классу 1.
        Возвращает np.array размера (N,) чисел в отрезке от 0 до 1.
        :param X: numpy.array размера  (N, M), dtype = np.float
        :return: numpy.array размера  (N,), dtype = np.int
        """
        return special.expit(np.matmul(X, self.w))

    def predict(self, X):
        """
        Предсказание класса для объекта.
        Возвращает np.array размера (N,) элементов 1 или -1.
        :param X: numpy.array размера  (N, M), dtype = np.float
        :return:  numpy.array размера  (N,), dtype = np.int
        """
        predicts = (self.predict_proba(X) > .5) * 2 - 1
        return predicts 

def test_work():
    print "Start test"
    X, y = make_classification(n_features=100, n_samples=1000)
    y = 2 * (y - 0.5)

    try:
        clf = LR(lr=1, l1=1e-4, l2=1e-4, num_iter=1000, verbose=0)
    except Exception:
        assert False, "Создание модели завершается с ошибкой"
        return

    try:
        clf = clf.fit(X, y)
    except Exception:
        assert False, "Обучение модели завершается с ошибкой"
        return

    assert isinstance(lossf(clf.w, X, y, 1e-3, 1e-3), float), "Функция потерь должна быть скалярной и иметь тип np.float"
    assert gradf(clf.w, X, y, 1e-3, 1e-3).shape == (100,), "Размерность градиента должна совпадать с числом параметров"
    assert gradf(clf.w, X, y, 1e-3, 1e-3).dtype == np.float, "Вектор градиента, должен состоять из элементов типа np.float"
    assert clf.predict(X).shape == (1000,), "Размер вектора предсказаний, должен совпадать с количеством объектов"
    assert np.min(clf.predict_proba(X)) >= 0, "Вероятности должны быть не меньше, чем 0"
    assert np.max(clf.predict_proba(X)) <= 1, "Вероятности должны быть не больше, чем 1"
    assert len(set(clf.predict(X))) == 2, "Метод предсказывает больше чем 2 класса на двух классовой задаче"
    print "End tests"

test_work()

SyntaxError: invalid syntax (<ipython-input-9-54c197611a82>, line 35)