### Straight Line Segments

Uma técnica baseada na distância entre os pontos e um segmento de reta.

Seja $p, q \in \mathbb{R}^{d+1}$. O SLS (Straight Line Segments) $L_{p,q}$ com extremidades $p$ e $q$ é dada por: 

$$ L_{p,q} = \{x \in \mathbb{R}^{d+1} : x = p + \lambda (p - q), 0 \leq \lambda \leq 1\} $$ 

Seja $x \in \mathbb{R}^{d}$, definindo $x_{e} \in \mathbb{R}^{d+1}$ como sendo o $x$ inserido num espaço $d+1$, onde, neste eixo, possui valor zero. Vetorialmente $x_{e} = (x, 0)$
<br>Agora definimos pseudo-distância entre $x$ e $L_{p,q}$ como:

$$ distP(x,L) = \dfrac{dist(x_{e}, p) + dist(x_{e}, q) - dist(p, q)}{2},$$

onde $dist(a,b)$ é a distância euclidiana entre $a$ e $b$.
<br>Note que se $x_{e} \in L$, então o $distP(x,L) = 0$. E se $p = q$, $distP(x,L) = dist(x_{e},p) = dist(x_{e},q)$
<br> Seja $\xi$ uma coleção de SLS: 
$$\xi = \{L_{p_{i} ,q_{i}} : p_{i}, q_{i} \in \mathbb{R}^{d+1}, i = 1, ..., n\}$$

Dados duas coleções $\xi_{0}$ e $\xi_{1}$, vamos definir $T(x, \xi_{0}, \xi_{1})$ como sendo: 
$$ T(x, \xi_{0}, \xi_{1}) = \sum_{L \in \xi_{1}} \dfrac{1}{distP(x,L) + \varepsilon} - \sum_{L \in \xi_{0}} \dfrac{1}{distP(x,L) + \varepsilon} $$

Observe que se $x_{e}$ está "próximo" de $\xi_{0}$ e "longe" de $\xi_{1}$, então $T(x, \xi_{0}, \xi_{1})$ tende a $-\infty$, o caso contrário, tende a $+\infty$.
<br>Seja $\xi = \{\xi_{0}, \xi_{1}\}$, a função $y_{\xi}(x): \mathbb{R}^{d} \rightarrow [0,1]$ é dada por: 
$$y_{\xi}(x) = \dfrac{1}{1 + e^{-T(x, \xi_{0}, \xi_{1})}}$$

Onde é também conhecido como sigmoid.
<br>Vamos agora definir a função erro: 
$$e_{i}(y_{\xi}) = y_{\xi} - y_i$$
$$E(y_{\xi}) = \dfrac{1}{n} \sum_{i=1}^{n} [e_{i}(y_{\xi})]^2 $$

Assim, em geral, queremos minimizar a função $E$

#### Placing Algorithm

Input: Amostra $S = \{(x_{i},y_{i}) : x_{i} \in \mathbb{R}^{d}, y_{i} \in [0,1], i = 1,2,...,n\}$
<br>Output: Dois conjuntos $\xi_{0}, \xi_{1}$ de SLS 

In [78]:
def placing(S):
    x0, x1 = S[0][S[1] <= 0.5], S[0][S[1] > 0.5]
#     d = S[0].shape[1]
    d = 1
    
    x0m, x1m = np.mean(x0, axis=0), np.mean(x1, axis=0)
    x0v, x1v = np.var(x0, axis=0), np.var(x1, axis=0)
    x0s, x1s = x0v**0.5, x1v**0.5 #or np.std(x0, axis=0), np.std(x1, axis=0)
    flag = True
    while flag:
        vec0, vec1 = np.array(rdir(d)), np.array(rdir(d))
        if np.linalg.norm(vec0) == 1 and np.linalg.norm(vec1) == 1:
            flag = False
    
    a0, a1 = x0m - np.linalg.norm(x0v)*vec0, x1m - np.linalg.norm(x1v)*vec1
    b0, b1 = x0m + np.linalg.norm(x0v)*vec0, x1m + np.linalg.norm(x1v)*vec1
    
    var = np.linalg.norm(x0s) + np.linalg.norm(x1s)
    p0, p1 = np.append(a0, var), np.append(a1, var)
    q0, q1 = np.append(b0, var), np.append(b1, var)
    
    lamb = random.uniform(0,1)
    L0 = p0 + lamb*(q0 - p0)
    L1 = p1 + lamb*(q1 - p1)
    return (L0, L1)

In [None]:
def training(S, maxSLS, placing):
    L0, L1 = placing(S)
    countSLS = 2
    while countSLS < maxSLS:
        alpha = 0.1
        error = 1
        derror = 1
        while derror < 1e-8 or alpha < 1e-8:
            Disp = ComputeDisp()
            beta = alpha
            d = 1
            for i in range(MAX):
                L0, L1 = MoveSLS()
                Olderror = error
                derror = Olderror - error
                error = E(yl)
                derror = Olderror - error
                if derror < 0:
                    d = (-1)*d
                beta = beta/2
                alpha = alpha + d*beta
        if CountSLS < maxSLS:
            OnemoreSLS()
        countSLS += 1
    return (L0, L1)

In [None]:
def ComputeDisp

In [88]:
i = 0
a = 0
while i < 10 or a < 10:
    a+=1
    i+=1
a

10

$\xi_j = p_j + \lambda (q_j - p_j), \lambda \in [0,1]$

In [55]:
import random
from random import gauss
#random unit vector
def rdir(dims):
    vec = [gauss(0, 1) for i in range(dims)]
    mag = sum(x**2 for x in vec) ** .5
    return [x/mag for x in vec]

In [56]:
from matplotlib import pyplot as plt
import numpy as np
from sklearn.datasets import load_breast_cancer
data = load_breast_cancer(True)

In [75]:
(p0, q0) , (p1, q1) = placing(data)

In [76]:
X, y = data
lamb = random.uniform(0,1)
# plt.plot(X[:, 20], y, "x")
teste = (X[:,20], y)
(p0, q0) , (p1, q1) = placing(teste)
L0 = p0 + lamb*(q0 - p0)
L1 = p1 + lamb*(q1 - p1)