# Środowisko pracy

Na zajęciach będziemy korzystać z języka Python w wersji 3.7 (lub nowszej) oraz zestawu konkretnych pakietów. Na własną odpowiedzialność można korzystać z innych wersji Pythona. Poprzednie wersje Pythona (w szczególności 2.x) nie są zalecane i mogą nie być kompatybilne z notebookami!

## Lokalnie

1. Ściągnąć repozytorium przedmiotu: `git clone https://github.com/gmum/ml2022-23`  
(Można również ściągnąć zipa repozytorium "ręcznie")


2. Ściągnąć minicondę: https://conda.io/en/latest/miniconda.html (Niewymagane jeśli zainstalowana jest `Anaconda`)  
Na windowsie: uruchomić `Anaconda Prompt`


3. Stworzyć środowisko razem z wymaganymi paczkami:  
```
conda create --name ml python=3.7 numpy=1.19.1 scipy=1.5.2 matplotlib=3.1.1 scikit-learn=0.23.2 jupyter notebook
```


4. Aktywować środowisko:
Unix/MacOS: `conda activate ml`  
Windows: w `Anaconda Prompt`: `activate ml`


5. OPCJONALNIE: Doinstalować PyTorcha: https://pytorch.org/  
 * GPU: `conda install pytorch torchvision cudatoolkit=10.2 -c pytorch`
 * CPU only: `conda install pytorch torchvision cpuonly  -c pytorch`


6. W folderze repo odpalić serwer jupytera: `jupyter notebook`


7. Sprawdzić w przeglądarce czy wszystko działa

### Test środowiska

In [48]:
import matplotlib
import numpy as np
import scipy
import sklearn
#import torch  # uncomment if necessary

## Colaboratory (opcjonalnie)
W przyszłości do notebooków mogą być potrzebne większe zasoby obliczeniowe. W tym celu będziemy korzystać z narzędzia [Google Colaboratory](https://colab.research.google.com/), które udostępnia za darmo dostęp do GPU. Opcjonalnie można teraz przetestować jego działanie:

1. Wrzucić folder z repo na swojego Google Drive.

2. Otworzyć ten plik i z dostępnych aplikacji wybrać `Colaboratory`

3. Sprawdzić powyższą komórką czy wszystko działa.

# Wstęp do pakietów naukowych: NumPy

Na początek polecam zaznajomić się z podstawami NumPy, polecany tutorial na kompletny wstęp: https://numpy.org/devdocs/user/absolute_beginners.html
Dodatkowo z kolejnej części https://numpy.org/devdocs/user/basics.html warto zaznajomić się z: Data types, Array creation, Indexing, Broadcasting.

Rada ogólna: nie bać się "googlowania" i czytania dokumentacji.

**Kolejne zajęcia będą zakładać znajomość podstaw korzystania z numpy. Dla osób, które nie potrafią samodzielnie wykonać poniższych ćwiczeń, przetworzenie materiału z powyższych poradników jest obowiązkowe.**

### Zadanie 1.
Używając funkcji [`np.random.normal`](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.random.normal.html) wylosować dwie macierze **różnych** rozmiarów, i następnie przenożyć je przez siebie macierzowo tak aby otrzymać macierz rozmiaru `9x6`.

In [49]:
A = np.random.normal(1, 10, size=(9, np.random.randint(2, 20)))
B = np.random.normal(1, 10, size=(A.shape[1], 6))

C = np.matmul(A, B)

print([m.shape for m in [A, B, C]])

assert A.shape != B.shape
assert C.shape == (9,6)



[(9, 6), (6, 6), (9, 6)]


### Zadanie 2.

Zaimplementować funkcję $\sigma$, która przyjmuje macierz numpy $X$ (**uwaga**: nie mylić z `np.matrix`!) i zwraca macierz tego samego rozmiaru z wartościami funkcji:
$$\sigma(x) = \frac{1}{1 + e^{-x}}$$
odpowiednio dla każdego $x$.

Hint: [`np.e`](https://docs.scipy.org/doc/numpy/reference/constants.html#numpy.e)

In [50]:
def sigmoid(x: np.ndarray) -> np.ndarray:
    return 1/(1+pow(np.e, -x))
  
X = np.random.uniform(low=-10, high=10, size=(1000, 2000))

assert sigmoid(X).max() <= 1.
assert sigmoid(X).min() >= 0.

In [51]:
%%timeit n=10
sigmoid(X)

24.7 ms ± 176 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


### Zadanie 3.
Ustandaryzować wartości w macierzy $X$ per kolumna, tzn. dla każdej wartości $x$ w kolumnie wykonać:

$$ f(x_{ij}) = \frac{x_{ij} - \mu_j}{\sigma_j} $$

gdzie $\mu_j$ to średnia wartość kolumny $j$, a $\sigma_j$ to odchylenie standardowe kolumny $j$.

In [57]:
X = np.random.uniform(low=-10, high=10, size=(100, 10))

X_hat = (X- np.mean(X, axis=0))/np.std(X, axis=0)


assert np.allclose(X_hat.mean(0), 0.)
assert np.allclose(X_hat.std(0), 1.)

### Zadanie 4.

Dla funkcji $\sigma$ z Zadania 2, narysować jej wykres dla argumentów z zakresu $(-10, 10)$. Użyjemy do tego funkcji `plot` z biblioteki [matplotlib](https://matplotlib.org/).

Narysowany wykres powinien przypominać poniższy:

![sigmoid](https://raw.githubusercontent.com/gmum/ml2022-23/main/lab/resources/sigmoid.png)

In [None]:
import matplotlib.pyplot as plt

X = np.linspace(-10, 10, 1000)

Y = sigmoid(X)

plt.plot(X, Y)
plt.show()
