# Małe zadanie domowe 7

W tym zadaniu zajmiemy się przykładowym problemem klasyfikacji binarnej. Będziemy rozpatrywać obiekty, które są opisywane przez dwie cechy (zwane też zmiennymi niezależnymi) A i B. Dowolny obiekt określony przez wartości cech A i B należy do dokładnie jednej z dwóch możliwych klas, które będziemy oznaczać $C_I$ i $C_{II}$; inaczej rzecz ujmując, zakładamy, że na przestrzeni cech obiektów zdefiniowany jest pewien podział na dwie rozłączne klasy $C_I$ i $C_{II}$. 

Rozważmy następujący model predykcyjny, który na podstawie danych wartości cechy A ($x^A$) i cechy B ($x^B$) zwraca wartość $M_\mathbf{w}(x^A,x^B)$ interpretowaną jako prawdopodobieństwo przynależności obiektu do klasy $C_{II}$:  

$$M_\mathbf{w}(x^A,x^B) = \frac{1}{1+e^{-(w_Ax^A+w_Bx^B)}},$$

gdzie $\mathbf{w} = (w_A, w_B)$ to odpowiednio wagi dla wartości cech $A$ i $B$. Zwykle wartości wag zapewniające dobre własności predykcyjne modelu znajdowane są w procesie określanym terminem "uczenie pod nadzorem". W tym zadaniu nie będziemy jednak przeprowadzać takiego uczenia. Zamiast tego zbadamy jak nasz model zachowuje się dla pewnych wartości tych wag, tj. dla każdej kombinacji wartości dla $w_A$ i $w_B$, gdzie $w_A \in [0, 0.1, 0.2, ..., 1]$ oraz $w_B \in [2, 2.1, 2.2, ..., 3]$. 

Zachowanie modelu zbadamy na danych $D = \{(x^A_i, x^B_i, \Pr(C_{II})_i)\}_{i=1}^5$ dotyczących pięciu obiektów o wartościach cech i prawdopodobieństwie przynależności do klasy $C_{II}$ przedstawionych w poniższej tabeli:

\begin{array}{|c|c|c|c|}
\hline
\mathbf{i} & \mathbf{x^A_i} & \mathbf{x^B_i} & \mathbf{\Pr(C_{II})_i}\\
\hline
1 & 1.0 & 1.3 & 0\\
\hline
2 & 2.2 & 1.1 & 1\\
\hline
3 & 2.0 & 2.4 & 1\\
\hline
4 & 1.5 & 3.2 & 0\\
\hline
5 & 3.2 & 1.2 & 1\\
\hline
\end{array}

[Tabelka w HTML. Do odkomentowania należy usunąć tę linijkę i znaki \]: # na końcu kodu HTML.
<table>
  <tr>
    <th>A</th>
    <th>B</th>
    <th>$C_{II}</th>
  </tr>
  <tr>
    <th>1.0</th>
    <th>1.3</th>
    <th>0</th>
  </tr>
  <tr>
    <th>2.2</th>
    <th>1.1</th>
    <th>1</th>
  </tr>
  <tr>
    <th>2.0</th>
    <th>2.4</th>
    <th>1</th>
  </tr>
  <tr>
    <th>1.5</th>
    <th>3.2</th>
    <th>0</th>
  </tr>
  <tr>
    <th>3.2</th>
    <th>1.2</th>
    <th>1</th>
  </tr>
</table>]: #
    
Zakładamy, że wiemy do jakiej klasy dany obiekt należy, dlatego w tabeli są tylko dwie wartości prawdopodobieństwa przynależności do klasy $C_{II}$: 1 jeżeli obiekt należy do klasy $C_{II}$ i 0 w przeciwnym przypadku (tzn. obiekt należy do klasy $C_I$). 

Własności predykcyjne naszego modelu dla danej pary wartości wag $w_A$ i $w_B$ ocenimy wyliczając błąd średniokwadratowy (ang. *Mean Squared Error*) dla danych $D$ zadany wzorem

$$MSE_\mathbf{w}(D) = \frac{1}{n}\sum_{i=1}^{n}\left(\Pr(C_{II})_i - M_\mathbf{w}(x^A_i,x^B_i)\right)^2.$$

Proszę napisać program w Pythonie w miarę możliwości wykorzystujący wektoryzację NumPy (tzn. starajmy się jak najmniej korzystać z instrukcji pętli w Pythonie), który oblicza wartości błędu średniokwadratowego dla wszystkich kombinacji wartości wag podanych powyżej.

Wynikiem działania programu powinna być tablica 2D z wartościami błędów dla poszczególnych kombinacji wag.

In [2]:
import numpy as np

In [39]:
w_a = np.arange(0, 1.1, 0.1)
w_b = np.arange(2, 3.1, 0.1)

x_a = np.array([1.0, 2.2, 2.0, 1.5, 3.2])
x_b = np.array([1.3, 1.1, 2.4, 3.2, 1.2])

Pr = np.array([0, 1, 1, 0, 1])

M = 1 / (1 + np.exp(-(w_a[:, None, None] * x_a + w_b[None, :, None] * x_b)))
MSE = np.sum(np.power(Pr[None, None, :] - M, 2), axis=-1) / M.shape[-1]

In [40]:
MSE

array([[0.37602458, 0.37852564, 0.38079628, 0.38285294, 0.38471142,
        0.38638693, 0.38789412, 0.38924701, 0.390459  , 0.39154275,
        0.39251017],
       [0.37713954, 0.37962026, 0.38185393, 0.38386168, 0.38566319,
        0.38727685, 0.38871983, 0.39000813, 0.3911566 , 0.39217899,
        0.39308797],
       [0.37854624, 0.38093782, 0.38307887, 0.38499316, 0.38670242,
        0.3882266 , 0.389584  , 0.39079138, 0.39186408, 0.3928161 ,
        0.39366016],
       [0.38007569, 0.38233936, 0.38435757, 0.38615516, 0.38775462,
        0.38917633, 0.39043878, 0.39155874, 0.39255137, 0.39343041,
        0.39420823],
       [0.38162515, 0.38374184, 0.38562327, 0.38729436, 0.38877745,
        0.39009263, 0.39125799, 0.3922898 , 0.3932027 , 0.39400984,
        0.39472301],
       [0.38313475, 0.38509775, 0.38683859, 0.38838154, 0.38974825,
        0.39095808, 0.39202836, 0.39297461, 0.3938107 , 0.39454903,
        0.3952007 ],
       [0.38457153, 0.38638165, 0.38798407, 0.38940202, 0.