# Zasady zaliczenia ćwiczeń

## Obecność

Na ćwiczeniach obecność nie jest obowiązkowa
* ze względu na formę ćwiczeń (zdalną) frekwencja na zajęciach nie jest sprawdzana
* nie zwalnia to oczywiście z obowiązku oddawania prac domowych

## Ocena z ćwiczeń

Ocena z ćwiczeń będzie opierać się na cotygodniowych zadaniach domowych oraz dużym projekcie semestralnym.

### Prace domowe
W trakcie każdych zajęć studenci otrzymają do wypełnienia notebooka z ćwiczeniami. **Na początku semestru należy założyć prywatne repozytorium na GitHubie przeznaczone na rozwiązane notebooki oraz dać dostęp do repozytorium prowadzącemu ćwiczenia.**

Każdy notebook należy rozwiązać i wysłać prowadzącemu w przeciągu tygodnia, do godziny 23:59 w dniu poprzedzającym kolejne zajęcia, tzn:
- Grupa środowa musi wysłać swoje rozwiązania do 23:59 we wtorek.
- Grupa czwartkowa musi wysłać swoje rozwiązania do 23:59 w środę.

- Każdy notebook będzie oceniany w przedziale 0-5 punktów. Prac domowych w formie notebooków będzie co najmniej 10, a suma punktów ze wszystkich zostanie przeskalowana do 50.
- Rozwiązania zadań muszą spełniać następujące kryteria:
  - kod musi być czytelny i zwięzły (w razie wątpliwości proszę stosować się do standardu PEP 8),
  - kod musi być przetestowany i poprawnie działać,
  - jeśli do zadania dodane są asserty, kod musi je przechodzić,
  - rozwiązanie musi zostać wysłane w terminie,
  - na następnych zajęciach student może być poproszony o przedstawienie fragmentu lub całości rozwiązania i wytłumaczenie działania kodu.

Osoby dołączające do zajęć w późniejszym terminie muszą liczyć się z faktem, iż nie mogą otrzymać punktów za zaległe zadania.

### Projekt semestralny
Do końca października należy wybrać temat projektu semestralnego. W najbliższym czasie zostanie udostępniona lista proponowanych tematów ale zdecydowanie zachęcamy do proponowania własnego tematu. Dodatkowo zachęcamy również wykorzystać ten projekt jako pretekst do wspołpracy naukowej z członkami grupy GMUM. W szczególności projekt może być wykonywany w ramach przedmiotu Projekt Indywidualny obowiązkowego dla studentów 1. roku drugiego stopnia kierunku Informatyka.

- Za projekt można otrzymać 50 punktów. Projekt będzie oceniany pod względem zgodności z tematem, pomysłowości oraz włożonej pracy.
- Szczegóły dotyczące termin oddawania projektów zostaną podane razem z proponowanymi tematami projektów.
- Do projektu należy dołączyć raport w formacie PDF, długości maksymalnie 2 stron, opisujący działanie projektu oraz sposób jego przetestowania.
- Projekt należy obronić - zostaną na to przeznaczone jedne zajęcia, a także będzie można to zrobić w trakcie konsultacji.
- Istnieje możliwość wykonywania projektu semestralnego w grupach dwuosobowych. Należy pamiętać, że wtedy wkład każdej osoby będzie oceniany osobno.


Z całego przedmiotu można otrzymać maksymalnie 100 punktów.
Skala ocen z ćwiczeń
* 0-49 pkt: 2
* 50-59 pkt: 3
* 60-69 pkt: 3,5
* 70-79 pkt: 4
* 80-89 pkt: 4,5
* 90-100 pkt: 5

#### Zwolnienie z egzaminu
W każdej grupie spośród studentów wybrane zostaną maksymalnie cztery osoby, które wykonały najlepsze projekty semestralne i obroniły je w formie prezentacji dla całej grupy najpóźniej na ostatnich ćwiczeniach. Osoby te będą zwolnione z egzaminu i automatycznie otrzymają ocenę 5.0 z całego przedmiotu.

# Środowisko pracy

Na zajęciach będziemy korzystać z języka Python w wersji 3.7 oraz zestawu konkretnych pakietów. Na własną odpowiedzialność można korzystać z innych wersji Pythona. Poprzednie wersje Pythona (w szczególności 2.x) są niezalecane!

## Lokalnie

1. Ściągnąć repozytorium przedmiotu: `git clone https://github.com/gmum/ml2020-21`  
(Można również ściągnąć zipa repozytorium "ręcznie")


2. Sciągnąć miniconde: https://conda.io/en/latest/miniconda.html (Niewymagane jeśli zainstalowana jest `Anaconda`)  
Na windowsie: uruchomić `Anaconda Prompt`


3. Stworzyć środowisko razem z wymaganymi paczkami:  
```
conda create --name ml python=3.7 numpy=1.19.1 scipy=1.5.2 matplotlib=3.1.1 scikit-learn=0.23.2 jupyter notebook
```


4. Aktywować środowisko:  
Unix/MacOS: `conda activate ml`  
Windows: w `Anaconda Prompt`: `activate ml`


5. OPCJONALNIE: Doinstalować PyTorcha: https://pytorch.org/  
 * GPU: `conda install pytorch torchvision cudatoolkit=10.2 -c pytorch`
 * CPU only: `conda install pytorch torchvision cpuonly  -c pytorch`


6. W folderze repo odpalić serwer jupytera: `jupyter notebook`


7. Sprawdzić w przeglądarce czy wszystko działa

### Test środowiska

In [1]:
import matplotlib
import numpy as np
import scipy
import sklearn
#import torch  # uncomment if necessary

## Colaboratory (opcjonalnie)
W przyszłości do notebooków mogą być potrzebne większe zasoby obliczeniowe. W tym celu będziemy korzystać z narzędzia Google Colaboratory, które udostępnia za darmo dostęp do GPU. Opcjonalnie można teraz przetestować jego działanie:

1. Wrzucić folder z repo na swojego Google Drive.

2. Otworzyć ten plik i z dostępnych aplikacji wybrać `Colaboratory`

3. Sprawdzić powyższą komórką czy wszystko działa.

# Wstęp do pakietów naukowych: NumPy

Na początek polecam zaznajomić się z podstawami NumPy, polecany tutorial na kompletny wstęp: https://numpy.org/devdocs/user/absolute_beginners.html
Dodatkowo z kolejnej części https://numpy.org/devdocs/user/basics.html warto zaznajomić się z: Data types, Array creation, Indexing, Broadcasting.

Rada ogólna: nie bać się googlania i czytania dokumentacji.

**Kolejne zajęcia będą zakładać znajomość podstaw korzystania z numpy. Dla osób, które nie potrafią samodzielnie wykonać poniższych ćwiczeń, przetworzenie materiału z powyższych poradników jest obowiązkowe.**

### Zadanie 1.
Używając funkcji [`np.random.normal`](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.random.normal.html) wylosować dwie macierze **różnych** rozmiarów, i następnie przenożyć je przez siebie macierzowo tak aby otrzymać macierz rozmiaru `9x6`.

In [2]:
A = np.random.normal(size=(9, 12))
B = np.random.normal(size=(12, 6))

C = np.matmul(A, B)

assert A.shape != B.shape
assert C.shape == (9,6)

### Zadanie 2.

Zaimplementować funkcje $\sigma$, która przyjmuje macierz numpy $X$ (**uwaga**: nie mylić z `np.matrix`!) i zwraca macierz tego samego rozmiaru z wartościami fukncji:
$$\sigma(x) = \frac{1}{1 + e^{-x}}$$
odpowiednio dla każdego $x$.

Hint: [`np.e`](https://docs.scipy.org/doc/numpy/reference/constants.html#numpy.e)

In [3]:
def sigmoid(x: np.ndarray) -> np.ndarray:
    return 1 / (1 + np.e ** (-x))

def stupid_sigmoid(x):
    y = np.zeros(x.shape)
    for i in range(x.shape[0]):
        for j in range(x.shape[1]):
            y[i, j] = 1 / (1 + np.e ** -x[i,j])     
    return y
    
X = np.random.uniform(low=-10, high=10, size=(1000, 2000))

assert sigmoid(X).max() <= 1.
assert sigmoid(X).min() >= 0.

In [4]:
%%timeit n=10
sigmoid(X)

86.5 ms ± 3.22 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


### Zadanie 3.
Unstandaryzować wartości w macierzy $X$ per kolumna, tzn. dla każdej wartości $x$ w kolumnie wykonać:

$$ f(x_{ij}) = \frac{x_{ij} - \mu_j}{\sigma_j} $$

gdzie $\mu_j$ to średnia wartość kolumny $j$, a $\sigma_j$ to odchylenie standardowe kolumny $j$.

In [8]:
X = np.random.uniform(low=-10, high=10, size=(100, 10))

X_hat = (X - X.mean(axis=0)) / X.std(axis=0)

assert np.allclose(X_hat.mean(0), 0.)
assert np.allclose(X_hat.std(0), 1.)