# Macierze

W tej części skupimy się na obiektach dwuwymiarowych - macierzach.

Dowiemy się jak:
- tworzyć 2-wymiarowe tablice
- obsługiwać atrybuty macierzy
- wskazywać oś wzdłuż której chcemy wywołać funkcję agregującą (np. wyznaczyć średnią dla poszczególnych kolumn, zamiast średnią z całej tablicy)
- obsługiwać macierze typu boolen
- pracować z brakującymi danymi


In [None]:
# Importujemy bibliotekę `numpy`
import numpy as np

Macierz to dwuwymiarowa struktura. Zawiera wiersze i kolumny. O macierzy możemy myśleć jak o arkuszu Excela. Jeżeli wektor jest odpowiednikiem listy to macierz będzie odpowiednikiem listy list.

### Tworzenie macierzy / tablicy 2d

Macierz możemy traktować jako listę list.

In [None]:
# Tworzymy macierz


Wróćmy na chwilę do wektorów


In [None]:
# Wygenerujmy wektor i zrzutujmy go na listę


Działa.

Niestety nie zadziała na macierzy.

#### Macierze

Jeżeli spróbujemy w powyższy sposób zrzutować macierz na listę, zrzutowanie zadziała płytko, tylko na pierwszym wymiarze.

In [None]:
# Próbujemy zrzutować utworzoną macierz na listę


Poprawnym sposobem zrzutowania macierzy na listę jest użycie metody obiektu `ndarray` - `tolist`

In [None]:
# Rzutowanie macierzy na listę za pomocą metody `tolist`


### Dostęp do wartości macierzy

In [None]:
# przypomnijmy jak wygląda nasza macierz


#### Dostęp do wierszy

In [None]:
# Wyświetlamy pierwszy wiersz


Powyższy sposób indeksowania znamy z list Pythonowych. Biblioteka `numpy` wspiera też inny sposób indeksowania.

In [None]:
# Wyświetlamy pierwszy wiersz w drugi sposób


In [None]:
# zmieniamy czwarty wiersz


#### Dostęp do pojedynczego elementu

In [None]:
# Wyświetlamy element z trzeciego wiersza, drugiej kolumny


In [None]:
# Drugi sposób na wyświetlenie elementu z trzeciego wiersza, drugiej kolumny


In [None]:
# Zmieńmy wartość elementu w trzecim wierszu, drugiej kolumnie


#### Dostęp do kolumny

In [None]:
# Wyświetlamy zawartość drugiej kolumny


### Exercise 1

Wyświetl pierwszą kolumną i trzeci wiersz z macierzy `my_matrix`.

In [None]:
# Import biblioteki `numpy` z aliasem `np`
import numpy as np

# Definicja macierzy `my_matrix`
my_matrix = np.array([[1, 4, 5], [10, 13, 9], [10, 8, 5]])

# Piersza kolumna
first_column = ... 

# Trzeci wiersz
third_row = ...

## Atrybuty macierzy 

#### `ndim`

ndim - wymiar macierzy (ile liczb potrzebujemy do opisania kształtu tablicy)

In [None]:
# Przypomnijmy jak wygląda macierz


In [None]:
# wymiar macierzy


In [None]:
# Generujemy wektor


In [None]:
# Wymiar wektora


#### `dtype`

dtype - typ danych macierzy (wszystkie elementy macierzy muszą być tego samego typu)

In [None]:
# typ danych macierzy `my_first_matrix`


#### `size`

size - rozmiar macierzy (liczba elementów macierzy, liczba wierszy przemnożona przez liczbę kolumn)

In [None]:
# Przypomnijmy macierz `my_first_matrix`


In [None]:
# rozmiar macierzy


#### `shape`

shape - kształt macierzy (krotka z liczbą wierszy i liczbą kolumn)

In [None]:
# Przypomnijmy macierz


In [None]:
# Kształt macierzy `my_first_matrix`


A co jeżeli zapytam o kształt wektora ?

In [None]:
# Przypomnijmy wektor


W przypadku wektora kształt zwraca tą samą informację co rozmiar (size), czyli liczbę wszystkich elementów

In [None]:
# Kształt wektora


W ogólności

![image.png](attachment:847e8d12-f394-4073-81d1-627558086a41.png)

(źródło: https://predictivehacks.com/tips-about-numpy-arrays/)

#### Reprezentowanie wektora w dwóch wymiarach

Wektor możemy reprezentować jako macierz na dwa sposoby. Jako:
- wektor kolumnowy
- wektor wierszowy

In [None]:
# Przedstawiamy wektor w postaci kolumnowej


In [None]:
# kształt wektora kolumnowego


In [None]:
# Przedstawmy wektor w postaci wierszowej


In [None]:
# kształt wektora wierszowego


### Zmiana kształtu macierzy

#### `reshape`

Do zmiany kształtu tablicy `ndarray` służy metoda `reshape`

In [None]:
# Generujemy wektor liczb od 1 do 100 (włącznie)


In [None]:
# Zmieniamy kształt wektora na macierz 10x10


In [None]:
# Uwaga! Metoda reshape również zwraca widok (a nie kopię). Tak jak szatkowanie.


In [None]:
# Czy możemy wrócić do wektora za pomocą metody `reshape`?


In [None]:
# Stwórzmy za pomocą metody reshape macierz o 20 wierszach (-1 oznacza instrukcję dla pythona - wylicz wartość tak,
# żeby tablica miała 20 wierszy


Ale nie możemy dowolnie zmieniać kształtu. Możemy zmienić kształt tablicy tylko na taki, którego liczba wszystkich elementów jest identyczna jak oryginalnej tablicy. Nie można zmienić na kształt, który będzie miał inną liczbę elementów.

In [None]:
# Próba zmiany na niedozwolony kształt rzuca wyjątek `ValueError`. 


23 i 100 są liczbami względnie pierwszymi (coprimes), bo $NWD(23, 100)=1$

#### `flatten`

flatten - spłaszczenie macierzy (sprowadzenie tablicy do wektora)

In [None]:
# Spłaszczamy macierz do wektora


### Różnica pomiędzy metodę `reshape` i `flatten`

In [None]:
# Metoda reshape tworzy widok


In [None]:
# Metoda `flatten` tworzy kopię 


In [None]:
# Modyfikujemy wektor zwrócony przez metodę flatten


In [None]:
# Jak wymusić kopię ?


#### Zadanie 2

Zmień rozmiar macierzy w taki sposób, żeby wynikowa macierz miała 2 kolumny.

In [None]:
# Import biblioteki `numpy`
import numpy as np

# Definicja macierzy `my_matrix`
my_matrix = np.array([[1, 4, 5], [10, 13, 9], [10, 13, 9], [10, 8, 5]])

# Zmiana kształtu
two_columns = ...

### Dedykowane funkcje do tworzenia macierzy

Biblioteka `numpy` wyposażona jest w kilka funkcji służących do generowania specyficznych macierzy.

#### Macierz/wektor zerowy

In [None]:
# Tworzenie macierzy zerowej


In [None]:
# Tworzenie wektora zerowego


#### Macierz/wektor jedynkowy

In [None]:
# Tworzenie macierzy jedynkowej


In [None]:
# Tworzenie wektora jedynek


#### Macierz identycznościowa

In [None]:
# Tworzenie macierzy identycznościowej


### Wskazywanie osi przy wywoływaniu funkcji agregujących

In [None]:
# Generujemy macierz


#### metoda `sum`

In [None]:
# Suma po wszystkich elementach macierzy


In [None]:
# Suma po kolumnach (tzn. wiersze znikają, wartość parametru axis oznacza wymiar, który po agregacji zniknie, tutaj wiersze) 


In [None]:
# Suma po wierszach (kolumny znikają)


Wartość `axis` wskazuje wymiar, który zniknie po agregacji.

Parametr `axis` jest dostępny we wszystkich funkcjach agregujących.

![image.png](attachment:03fc441e-e92b-4595-b85c-5197eb8dd374.png)


(źródło: https://www.javatpoint.com/numpy-sum)

**Rys. 2** Ilustracja przedstawiająca działanie funkcji sum wzdłuż poszczególnych osi.

#### Metoda `mean`

In [None]:
# Średnia po wszystkich elementach


In [None]:
# Średnia po kolumnach


In [None]:
# Średnia po wierszach


Podobnie z `max`, `min`, `argmax`, `argmin`

#### Zadanie

Znajdź wartość maksymalną oraz indeks wartości maksymalnej dla poszczególnych wierszy (znikną kolumny) macierzy `my_matrix`.

In [None]:
# Import biblioteki numpy
import numpy as np

# Definicja macierzy `my_matrix`
my_matrix = np.array([[1, 4, 5], [10, 13, 9], [10, 8, 5]])

# indeks wartości maksymalnej w poszczególnych wierszach
argmax_row = ...

# wartość maskymalna w poszczególnych wierszach
max_row = ...

### Wektory boolean i macierze

Literały typu `boolean` to `True` i `False`. Wektor boolean to wektor zawierający tylko te dwie wartości.

In [None]:
# Tworzymy wektor boolean


In [None]:
# Typ wektora boolean


In [None]:
# Zmieniamy kształt wektora boolean


Boolean matrices are usually not created manualy, they appear as an answer to some question you might have.

Ale po co nam w ogóle takie macierze?

Macierze boolean przeważnie nie są tworzone ręcznie. Najczęściej powstają jako wynik jakiegoś zapytania.

### Jak otrzymać macierz boolean?

In [None]:
# Generujemy macierz


In [None]:
# Piszemy zapytanie


In [None]:
# Piszemy inne zapytanie


A co możemy z takimi macierzami zrobić ?

O tym za chwilę.

### Metody `all` i `any`

`all` - czy wszystkie elementy macierzy boolean mają wartość `True`

Any - czy co najmniej jeden element w macierzy boolean to `True`

In [None]:
# Przypomnijmy jak wygląda nasza macierz boolean


In [None]:
# metoda `all`


In [None]:
# metoda `any`


In [None]:
# metoda `all` wzdłuż kolumn (znikają wiersze)


In [None]:
# metoda `all` wzdłuż wierszy (znikają kolumny)


In [None]:
# metoda `any` wzdłuż kolumn (znikają wiersze)


In [None]:
# metoda `any` wzdłuż wierszy (zniakają kolumny)


I jeszcze jeden temat

#### Czym jest `np.nan`?

Czasami możemy mieć do czynienia z brakującą wartością. W `numpy` takie brakujące wartości są reprezentowane przez `np.nan` (Not A Number).

In [None]:
# NaN


In [None]:
# Robimy pomiary deszczu przez trzy dni rano i wieczorem, ale trzeciego dnia przed wieczorem był silny wiatr i czyjnik został uszkodzony.


In [None]:
# Metoda `isnan`


In [None]:
# Czy w macierzy znajduje się chociaż jedna wartość `NaN`


In [None]:
# A w którym wierszu?


In [None]:
# w której kolumnie?
