# Matplotlib

Matplotlib to najpopularniejsza biblioteka pythonowa służąca generowaniu wykresów.

`"Matplotlib tries to make easy things easy and hard things possible."`

Matplotlib oferuje kilka sposobów tworzenia wykresów, jednak najczęściej spotykane jest wykorzystywanie modułu `pyplot`, który zwyczajowo importuje się pod aliasem `plt`. 

Aby tworzone wykresy pojawiały się bezpośrednio w notebooku konieczne jest wykorzystanie wyrażenia IPython magic: `%matplotlib inline`

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

Uruchomienie poniższej komórki spowoduje wygenerowanie prostego wykresu.

In [None]:
squares = [1,4,9,16,25]
plt.plot(squares)
plt.show()

Matplotlib jest w stanie poradzić sobie z wieloma rodzajami danych wejściowych jak np. listy, ndarray, kolumny DataFrame.

Polecenie `plot` jest to podstawowe narzędzie do rysowania, natomiast polecenie `show` wyświetla zdefiniowany wcześniej wykres (polecenie to jest opcjonalne w Notebooku).

Wykres składa się z kilku elementów:
* `figure` - obiekt z osiami, może zawierać wiele rysunków
* `axis` - osie danych w których dana krzywa jest osadzona
* `line` - linia na wykresie; w osiach mogą znajdować się też inne rzeczy jak poligony, punkty itp

Poniższy kod wygeneruje podobny wykres w którym jednak zmodyfikowane zostaną osie oraz linia, a także dodane zostaną labelki.

In [None]:
plt.plot(squares, linewidth=5) # zmiana grubości lini
plt.title("Kwadraty liczb", fontsize=24) # tytuł i jego rozmiar
plt.xlabel("Wartosc", fontsize=14) # opis osi x
plt.ylabel("Kwadrat", fontsize=14) # opis osi y
plt.tick_params(axis="both", labelsize=14) # zmiana domyślnych oznaczeń na osiach
plt.show()

Wykres wygląda zdecydowanie lepiej. Pozostał jednak jeszcze jeden problem - oś `x` zaczyna się od 0 a nie tak jak powinna w tym przypadku od 1. Aby temu zaradzić do polecenia `plot` można podać drugi ciąg wartości odpowiadający `x`-om.

In [None]:
input_values = [1,2,3,4,5] # wartości punktów na osi x
plt.plot(input_values, squares, linewidth=5) # plot(x,y)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

Bez problemu do wykresu można dodać również drugą serię danych. Aby tego dokonać wystarczy wywołać polecenie `plot` jeszcze raz.

In [None]:
plt.plot(input_values, squares, linewidth=5)
plt.plot(list(reversed(input_values)), squares, linewidth=5) # drugie wywołanie polecenia plot
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

> **Ćwiczenie:** Wygeneruj wykres przedstawiający funkcje sinus i cosinus na przedziale od 0 do 10. Wykorzystaj blibliotekę numpy i funckje [linspace](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.linspace.html) oraz [sin](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.sin.html) i [cos](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.cos.html)

In [None]:
import numpy as np
# miejsce na kod

`plot` to nie jedyne dostępne polecenie służące do generowania wykresów. Kolejnym użytecznym poleceniem jest `scatter` służące, jak nazwa wskazuje, tworzeniu scatter plotów.

In [None]:
plt.scatter(2,4)
plt.show()

Podobnie jak w przypadku `plot` można tu modyfikować wygląd wykresu.

In [None]:
plt.scatter(2,4, s=200)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

Jak również podawać serie danych, a nie tylko pojedyncze punkty.

In [None]:
x_values = [1,2,3,4,5]
y_values = [1,4,9,16,25]
plt.scatter(x_values,y_values, s=100)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

Podając dostatecznie dużo punktów jesteśmy w stanie przy pomocy `scatter` wygenerować wykres analogiczny do tego jaki można otrzymać przy użyciu `plot`.

In [None]:
x_val = list(range(1,1001))
y_val = [x**2 for x in x_val]
plt.scatter(x_val,y_val, s=40)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.axis([0,1100, 0,1100000])
plt.show()

Każdy punkt wygenerowany przy pomocy `scatter` składa się z "krawędzi" i "punktu właściwego". Możliwe jest modyfikowanie tych elementów. W poniższej komórce usunięte zostały krawędzie punktów a kolor samego punktu zmieniono na czerwony.

In [None]:
plt.scatter(x_val,y_val, c="r", edgecolor="none", s=40) 
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.axis([0,1100, 0,1100000])
plt.show()

Kolory można przypisywać na wiele sposobów, listę dostępnych możliwości można znaleźć [tutaj](https://matplotlib.org/api/colors_api.html). W poniższym przykładzie zastosowano mapę kolorów.

In [None]:
plt.scatter(x_val,y_val, c=y_val, cmap=plt.cm.Blues, edgecolor="none", s=40)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.axis([0,1100, 0,1100000])
plt.show()

> **Ćwiczenie:** Wygeneruj scatter plot losowych 100 punktów, których wartości x i y mieszczą się w przedziale od 0 do 1. Uzależnij kolor oraz wielkość punktów od iloczynów ich wartości. Do wygenerowania danych wykorzystaj funkcję [rand](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.random.rand.html) z biblioteki numpy.

In [None]:
# miejsce na kod

plt.scatter(x, y, s=area, c=colors, alpha=0.5) # wzór wywołania scatter

### Generowanie wykresu błądzenia losowego

Poniższy przykład ma na celu zaprezentowanie bardziej widowiskowego wykorzystania możliwości oferowanych przez `scatter`.

In [None]:
from random import choice

# utworzenie klasy RandomWalk której metoda fill_walk generuje serię kolejnych losowych kroków
class RandomWalk():
    def __init__(self, num_points=5000):
        self.num_points = num_points
        
        self.x_values = [0]
        self.y_values = [0]
    
    def fill_walk(self):
        while len(self.x_values) < self.num_points:
            x_direction = choice([1,-1])
            x_distance = choice([0,1,2,3,4])
            x_step = x_direction * x_distance
            
            y_direction = choice([1,-1])
            y_distance = choice([0,1,2,3,4])
            y_step = y_direction * y_distance
            
            if x_step == 0 and y_step == 0:
                continue
            next_x = self.x_values[-1] + x_step
            next_y = self.y_values[-1] + y_step
            
            self.x_values.append(next_x)
            self.y_values.append(next_y)

In [None]:
# utworzenie obiektu i wywołanie metody fill_walk
rw = RandomWalk()
rw.fill_walk()
# wygenerowanie wykresu
plt.scatter(rw.x_values, rw.y_values, s=15)
plt.show()

In [None]:
# uatrakcyjnienie wykresu
point_numbers = list(range(rw.num_points))
plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Blues, edgecolor="none", s=15) # dodanie mapy koloru
plt.scatter(0,0, c="green", edgecolors="none", s=100) # zaznaczenie punktu startowego
plt.scatter(rw.x_values[-1], rw.y_values[-1], c="red", edgecolors="none", s=100) # zaznaczenie punktu końcowego
plt.axes().get_xaxis().set_visible(False) # ukrycie osi
plt.axes().get_yaxis().set_visible(False)
plt.show()

In [None]:
# ostatnie szlify
rw_big = RandomWalk(50000) # wygenerowanie większej liczby punktów
rw_big.fill_walk()
point_num = list(range(rw_big.num_points))
plt.rcParams['figure.figsize'] = (11, 11) # zwiększenie rozmiaru wykresu
plt.scatter(rw_big.x_values, rw_big.y_values, c=point_num, cmap=plt.cm.Blues, edgecolor="none", s=1) # mapa koloru
plt.scatter(0,0, c="green", edgecolors="none", s=15) # punkt startowy
plt.scatter(rw_big.x_values[-1], rw_big.y_values[-1], c="red", edgecolors="none", s=15) # punkt końcowy
plt.axes().get_xaxis().set_visible(False) # ukrycie osi
plt.axes().get_yaxis().set_visible(False)
plt.show()

`hist` to kolejne użyteczne polecenie, pozwala ono na generowanie histogramów.

In [None]:
mu, sigma = 0, 20
hist_data = mu + sigma * np.random.randn(10000)
plt.hist(hist_data, bins=50, normed=True, color="g")
plt.show()

> **Ćwiczenie:** Wygeneruj histogram rozkładu jednostajnego dla 10000 punktów. Wykorzystaj funkcję [rand](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.random.rand.html). Stwórz 100 binów, oraz zmień orientację wykresu. W razie problemów kliknij [tutaj](https://matplotlib.org/devdocs/api/_as_gen/matplotlib.pyplot.hist.html).

In [None]:
# miejsce na kod


`bar` może być wykorzystany np. tam gdzie format danych nie pozwala na zastosowanie polecenia `hist`. Zdarza się tak gdy dane które mają zostać zwizualizowane są następującej postaci: etykieta - liczba wystąpień

In [None]:
b_data = [17,23,81,24,13,65]
b_label = ["czerwony","zielony","żółty","brązowy","fioletowy","niebieski"]

In [None]:
b_placeholder = list(range(len(b_data)))

plt.bar(b_placeholder,b_data) # x nie może być stringiem
plt.xticks(b_placeholder, b_label, rotation = 45) # podmienienie int na string, ustawienie kąta wyświetlania labelek
plt.tick_params(axis="both", labelsize=14)
plt.show()

> **Ćwiczenie:** Wygeneruj barplot z trzema "kolumnami" o wysokościach: 10,20,30; z labelkami: brąz, srebro, złoto. Na osi `y` mają być zaznaczone tylko 3 punkty odpowiadające wysokościom poszczególnych "kolumn", zamiast wartości liczbowych mają one wyświetlać napisy: trzeci, drugi, pierwszy.

In [None]:
# miejsce na kod


### Wiele wykresów na jednym obrazku

Matplotlib pozwala na umieszczanie na jednym obrazku więcej niż jednego wykresu, tzw. subplotów.
Poniżej zaprezentowano jak tego dokonać

In [None]:
plt.figure(1) # odwołanie się do pustej figury w której umieszczone zostaną wykresy
plt.subplot(211) # subplot(nrows,ncols,index)
plt.hist(hist_data, bins=50, normed=True, color="g")

plt.subplot(212)
plt.plot(input_values, squares, linewidth=5)
plt.plot(list(reversed(input_values)), squares, linewidth=5)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

> **Ćwiczenie:** Wygeneruj obrazek składający się z 4 różnych wykresów (wykresy mają nie zawierać oznaczeń na osiach):
* czerwony, pogrubiony X (`plot`)
* V z kropkami na krańcach (`plot`)
* mały trójkąt wewnątrz dużego trójkąta (`scatter`)
* "dwie wieże" (`hist`)

In [None]:
# miejsce na kod
