# Matplotlib

Matplotlib to najpopularniejsza biblioteka pythonowa służąca generowaniu wykresów.

`"Matplotlib tries to make easy things easy and hard things possible."`

Matplotlib oferuje kilka sposobów tworzenia wykresów, jednak najczęściej spotykane jest wykorzystywanie modułu `pyplot`, który zwyczajowo importuje się pod aliasem `plt`. 

Aby tworzone wykresy pojawiały się bezpośrednio w notebooku konieczne jest wykorzystanie wyrażenia IPython magic: `%matplotlib inline`

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

Uruchomienie poniższej komórki spowoduje wygenerowanie prostego wykresu.

In [None]:
squares = [1,4,9,16,25]
plt.plot(squares)
plt.show()

Matplotlib jest w stanie poradzić sobie z wieloma rodzajami danych wejściowych jak np. listy, ndarray, kolumny DataFrame.

Polecenie `plot` jest to podstawowe narzędzie do rysowania, natomiast polecenie `show` wyświetla zdefiniowany wcześniej wykres (polecenie to jest opcjonalne w Notebooku).

Wykres składa się z kilku elementów:
* `figure` - obiekt z osiami, może zawierać wiele rysunków
* `axis` - osie danych w których dana krzywa jest osadzona
* `line` - linia na wykresie; w osiach mogą znajdować się też inne rzeczy jak poligony, punkty itp

Poniższy kod wygeneruje podobny wykres w którym jednak zmodyfikowane zostaną osie oraz linia, a także dodane zostaną labelki.

In [None]:
plt.plot(squares, linewidth=5) # zmiana grubości lini
plt.title("Kwadraty liczb", fontsize=24) # tytuł i jego rozmiar
plt.xlabel("Wartosc", fontsize=14) # opis osi x
plt.ylabel("Kwadrat", fontsize=14) # opis osi y
plt.tick_params(axis="both", labelsize=14) # zmiana domyślnych oznaczeń na osiach
plt.show()

Wykres wygląda zdecydowanie lepiej. Pozostał jednak jeszcze jeden problem - oś `x` zaczyna się od 0 a nie tak jak powinna w tym przypadku od 1. Aby temu zaradzić do polecenia `plot` można podać drugi ciąg wartości odpowiadający `x`-om.

In [None]:
input_values = [1,2,3,4,5] # wartości punktów na osi x
plt.plot(input_values, squares, linewidth=5) # plot(x,y)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

Bez problemu do wykresu można dodać również drugą serię danych. Aby tego dokonać wystarczy wywołać polecenie `plot` jeszcze raz.

In [None]:
plt.plot(input_values, squares, linewidth=5)
plt.plot(list(reversed(input_values)), squares, linewidth=5) # drugie wywołanie polecenia plot
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

W celu kontroli zakresu wartości na osiach można wykorzystać metodę `axis` która przyjmuję listę wartości `[xmin, xmax, ymin, ymax]`

In [None]:
plt.plot(input_values, squares, linewidth=5)
plt.plot(list(reversed(input_values)), squares, linewidth=5)
plt.axis([-1, 7, -5, 30]) # rozszerzenie osi
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

In [None]:
plt.plot(input_values, squares, linewidth=5)
plt.plot(list(reversed(input_values)), squares, linewidth=5)
plt.axis([2, 4, 5, 20]) # zawężenie osi
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

Możliwe jest również formatowanie lini poprzez dodanie do wywołania `plot` stringa definiującego formatowanie o następującej strukturze `[color][marker][line]`

Przykładowe stringi:
- 'b'     niebieskie markery
- 'ro'    czerwone koła
- 'g-'    zielona linia
- '--'    linia przerywana
- 'k^:'   czarne trójkąty połączone przerywaną linią

In [None]:
plt.plot(input_values, squares, "bx--", linewidth=2, markersize=10) # format string + rozmiar markerów
plt.plot(list(reversed(input_values)), squares, "r*", markersize=10) # format string definiujący tylko markery
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

> **Ćwiczenie:** Wygeneruj wykres przedstawiający funkcje sinus i cosinus na przedziale od 0 do 10. Wykorzystaj blibliotekę numpy i funckje [linspace](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.linspace.html) oraz [sin](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.sin.html) i [cos](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.cos.html). Zmodyfikuj osie oraz domyślne linie.

`plot` to nie jedyne dostępne polecenie służące do generowania wykresów. Kolejnym użytecznym poleceniem jest `scatter` służące, jak nazwa wskazuje, tworzeniu scatter plotów.

In [None]:
plt.scatter(2,4)
plt.show()

Podobnie jak w przypadku `plot` można tu modyfikować wygląd wykresu.

In [None]:
plt.scatter(2,4, s=200)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.axis([1.5, 2.5, 3.5, 4.5])
plt.show()

Możliwe jest również podawanie serii danych, a nie tylko pojedynczych punktów.

In [None]:
x_values = [1,2,3,4,5]
y_values = [1,4,9,16,25]
plt.scatter(x_values,y_values, s=100)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

Podając dostatecznie dużo punktów jesteśmy w stanie przy pomocy `scatter` wygenerować wykres analogiczny do tego jaki można otrzymać przy użyciu `plot`.

In [None]:
x_val = list(range(1,1001))
y_val = [x**2 for x in x_val]
plt.scatter(x_val,y_val, s=40)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.axis([0,1100, 0,1100000])
plt.show()

Każdy punkt wygenerowany przy pomocy `scatter` składa się z "krawędzi" i "punktu właściwego". Możliwe jest modyfikowanie tych elementów. W poniższej komórce usunięte zostały krawędzie punktów a kolor samego punktu zmieniono na czerwony.

In [None]:
plt.scatter(x_val,y_val, c="r", edgecolor="none", s=40) 
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.axis([0,1100, 0,1100000])
plt.show()

Kolory można przypisywać na wiele sposobów, listę dostępnych możliwości można znaleźć [tutaj](https://matplotlib.org/api/colors_api.html). W poniższym przykładzie zastosowano mapę kolorów.

In [None]:
plt.scatter(x_val,y_val, c=y_val, cmap=plt.cm.Blues, edgecolor="none", s=40)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.axis([0,1100, 0,1100000])
plt.show()

> **Ćwiczenie:** Wygeneruj scatter plot losowych 100 punktów, których wartości x i y mieszczą się w przedziale od 0 do 1. Uzależnij kolor oraz wielkość punktów od iloczynów ich wartości. Do wygenerowania danych wykorzystaj funkcję [rand](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.random.rand.html) z biblioteki numpy.

================================================================================================================== 

### Generowanie wykresu błądzenia losowego

Poniższy przykład ma na celu zaprezentowanie bardziej widowiskowego wykorzystania możliwości oferowanych przez `scatter`.

In [None]:
from random import choice

# utworzenie klasy RandomWalk której metoda fill_walk generuje serię kolejnych losowych kroków
class RandomWalk():
    def __init__(self, num_points=5000):
        self.num_points = num_points
        
        self.x_values = [0]
        self.y_values = [0]
    
    def fill_walk(self):
        while len(self.x_values) < self.num_points:
            x_direction = choice([1,-1])
            x_distance = choice([0,1,2,3,4])
            x_step = x_direction * x_distance
            
            y_direction = choice([1,-1])
            y_distance = choice([0,1,2,3,4])
            y_step = y_direction * y_distance
            
            if x_step == 0 and y_step == 0:
                continue
            next_x = self.x_values[-1] + x_step
            next_y = self.y_values[-1] + y_step
            
            self.x_values.append(next_x)
            self.y_values.append(next_y)

In [None]:
# utworzenie obiektu i wywołanie metody fill_walk
rw = RandomWalk()
rw.fill_walk()
# wygenerowanie wykresu
plt.scatter(rw.x_values, rw.y_values, s=15)
plt.show()

In [None]:
# uatrakcyjnienie wykresu
point_numbers = list(range(rw.num_points))
plt.scatter(rw.x_values, rw.y_values, c=point_numbers, cmap=plt.cm.Blues, edgecolor="none", s=15) # dodanie mapy koloru
plt.scatter(0,0, c="green", edgecolors="none", s=100) # zaznaczenie punktu startowego
plt.scatter(rw.x_values[-1], rw.y_values[-1], c="red", edgecolors="none", s=100) # zaznaczenie punktu końcowego
plt.xticks([]) # ukrycie oznaczeń na osiach
plt.yticks([])
plt.show()

In [None]:
# ostatnie szlify
rw_big = RandomWalk(50000) # wygenerowanie większej liczby punktów
rw_big.fill_walk()
point_num = list(range(rw_big.num_points))

plt.rcParams['figure.figsize'] = (11, 11) # zwiększenie rozmiaru wykresu

plt.scatter(rw_big.x_values, rw_big.y_values, c=point_num, cmap=plt.cm.Blues, edgecolor="none", s=1) # mapa koloru
plt.scatter(0,0, c="green", edgecolors="none", s=15) # punkt startowy
plt.scatter(rw_big.x_values[-1], rw_big.y_values[-1], c="red", edgecolors="none", s=15) # punkt końcowy
plt.xticks([]) # ukrycie oznaczeń na osiach
plt.yticks([])
plt.show()

In [None]:
plt.rcParams['figure.figsize'] = (6, 4) # zmniejszenie rozmiaru wykresu

================================================================================================================== 

`hist` to kolejne użyteczne polecenie, pozwala ono na generowanie histogramów.

In [None]:
mu, sigma = 0, 20
hist_data = mu + sigma * np.random.randn(10000)
plt.hist(hist_data, bins=50, density=True, color="g")
plt.show()

In [None]:
mu1, sigma1 = 0, 20
mu2, sigma2 = 60, 20
hist_data1 = mu1 + sigma1 * np.random.randn(10000)
hist_data2 = mu2 + sigma2 * np.random.randn(10000)
plt.hist(hist_data1, bins=50, density=True, color="#ff9f00", alpha=0.5) # hex kolor + przenikanie
plt.hist(hist_data2, bins=50, density=True, color="#ff7fef", alpha=0.5)
plt.show()

> **Ćwiczenie:** Wygeneruj histogram rozkładu jednostajnego dla 10000 punktów. Wykorzystaj funkcję [rand](https://docs.scipy.org/doc/numpy-1.13.0/reference/generated/numpy.random.rand.html). Stwórz 100 binów, oraz zmień orientację wykresu. Użyj "niestandardowego" koloru. W razie problemów kliknij [tutaj](https://matplotlib.org/devdocs/api/_as_gen/matplotlib.pyplot.hist.html).

`bar` może być wykorzystany np. tam gdzie format danych nie pozwala na zastosowanie polecenia `hist`. Zdarza się tak gdy dane które mają zostać zwizualizowane są następującej postaci: etykieta - liczba wystąpień

In [None]:
b_data = [17,23,81,24,13,65]
b_label = ["czerwony","zielony","żółty","brązowy","fioletowy","niebieski"]

In [None]:
plt.bar(b_label,b_data)
plt.xticks(rotation = 45) # ustawienie kąta wyświetlania labelek
plt.tick_params(axis="both", labelsize=14)
plt.show()

In [None]:
x1 = [2,4,6,8,10]
x2 = [1,3,5,7,9]
y1 = [4,7,4,7,3]
y2 = [5,3,2,6,2]

plt.bar(x1, y1, label="A", color='m') # dodanie label
plt.bar(x2, y2, label="B", color='g')

plt.xticks([1.5, 3.5, 5.5, 7.5, 9.5],["c", "d", "e", "f", "g"])
plt.tick_params(axis="x", labelsize=14)

plt.legend() # pozwala na automatyczne generowanie legendy
plt.show()

In [None]:
# stacked bar
x = [1,2,3,4,5]
y1 = [4,7,4,7,3]
y2 = [5,3,2,6,2]

plt.bar(x, y1, label="A", color='m')
plt.bar(x, y2, label="B", color='g', bottom=y1)

plt.xticks([1, 2, 3, 4, 5],["c", "d", "e", "f", "g"])
plt.tick_params(axis="x", labelsize=14)

plt.legend()
plt.show()

> **Ćwiczenie:** Wygeneruj barplot z trzema "kolumnami" o wysokościach: 10,20,30; z labelkami: brąz, srebro, złoto. Na osi `y` mają być zaznaczone tylko 3 punkty odpowiadające wysokościom poszczególnych "kolumn", zamiast wartości liczbowych mają one wyświetlać napisy: trzeci, drugi, pierwszy.

`stackplot` pozwala na przedstawienie na jednym wykresie kilku serii (może być trudny do odczytania)

In [None]:
x = [1,2,3,4,5,6,7,8,9,10]

A = [17, 18, 40, 43, 44, 8, 43, 32, 39, 30]
B = [30, 22, 9, 29, 17, 12, 14, 24, 49, 35]
C = [41, 32, 27, 13, 19, 12, 22, 18, 28, 20]

plt.stackplot(x, A, B, C, colors = ['m','c','b'], labels = ["A", "B", "C"])
plt.legend()
plt.show()

Inne przydatne metody:

| metoda | opis   |
|------|------|
| axhline | dodaje horyzontalną linię |
| axvline | dodaje wertykalną linię |
| hlines | dodaje wiele horyzontalnych lini |
| vlines | dodaje wiele wertykalnych lini |
| axhspan | dodaje pogrubioną horyzontalną linię |
| axvspan | dodaje pogrubioną wertykalną linię |
| annotate | dodaje adnotację do punktu wraz z opcjonalną strzałką |
| text | dodaje tekst na wykresie |

In [None]:
plt.hist(hist_data, bins=50, density=True, color="g")
plt.axhline(0.01, color="r")
plt.axvline(color="b")
plt.show()

In [None]:
plt.hist(hist_data, bins=50, density=True, color="g")
plt.hlines(np.linspace(0, 0.02, 10), -20, 20, color="r")
plt.vlines(np.linspace(-60, 60, 10), 0.01, 0.02, color="b")
plt.show()

In [None]:
plt.hist(hist_data, bins=50, density=True, color="g")
plt.axhspan(0.01, 0.015, color="r")
plt.axvspan(-40, -20, color="b")
plt.show()

In [None]:
plt.hist(hist_data, bins=50, density=True, color="g")
plt.annotate("anotacja w lewym rogu", (-70,0.02))
plt.annotate("ciekawy punkt", (20, 0.01), (40, 0.015) ,arrowprops={'arrowstyle':'simple'})
plt.text(0, 0.005, 'TEKST', horizontalalignment='center',verticalalignment='center', fontsize=14)
plt.show()

> **Ćwiczenie:** W dowolny sposób stwórz wykresy przedstawiające flagi Polski, Japoni i Włoch.

### Wiele wykresów na jednym obrazku

Matplotlib pozwala na umieszczanie na jednym obrazku więcej niż jednego wykresu, tzw. subplotów.
Poniżej zaprezentowano jak tego dokonać

In [None]:
plt.rcParams['figure.figsize'] = (8, 8) # zwiększenie rozmiaru wykresu

plt.figure(1) # odwołanie się do pustej figury w której umieszczone zostaną wykresy
plt.subplot(211) # subplot(nrows,ncols,index)
plt.hist(hist_data, bins=50, density=True, color="g")

plt.subplot(212)
plt.plot(input_values, squares, linewidth=5)
plt.plot(list(reversed(input_values)), squares, linewidth=5)
plt.title("Kwadraty liczb", fontsize=24)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

Bardziej elastyczne podejście

In [None]:
plt.figure()
ax1 = plt.subplot2grid((3,3), (0,0), colspan=3)
ax2 = plt.subplot2grid((3,3), (1,0), colspan=2)
ax3 = plt.subplot2grid((3,3), (1, 2), rowspan=2)
ax4 = plt.subplot2grid((3,3), (2, 0))
ax5 = plt.subplot2grid((3,3), (2, 1))

ax1.text(0.5, 0.5, '1', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax1.axis([0,1,0,1])
ax2.text(0.5, 0.5, '2', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax2.axis([0,1,0,1])
ax3.text(0.5, 0.5, '3', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax3.axis([0,1,0,1])
ax4.text(0.5, 0.5, '4', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax4.axis([0,1,0,1])
ax5.text(0.5, 0.5, '5', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax5.axis([0,1,0,1])

plt.show()

In [None]:
plt.figure()
ax1 = plt.subplot2grid((3,3), (0,1))
ax2 = plt.subplot2grid((3,3), (1,0))
ax3 = plt.subplot2grid((3,3), (1,2))
ax4 = plt.subplot2grid((3,3), (2,1))

ax1.text(0.5, 0.5, '1', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax1.axis([0,1,0,1])
ax2.text(0.5, 0.5, '2', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax2.axis([0,1,0,1])
ax3.text(0.5, 0.5, '3', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax3.axis([0,1,0,1])
ax4.text(0.5, 0.5, '4', horizontalalignment='center',verticalalignment='center', fontsize=14)
ax4.axis([0,1,0,1])

plt.show()

> **Ćwiczenie:** Wygeneruj obrazek składający się z 4 różnych wykresów (wykresy mają nie zawierać oznaczeń na osiach):
* czerwony, pogrubiony X (`plot`)
* V z kropkami na krańcach (`plot`)
* mały trójkąt wewnątrz dużego trójkąta (`scatter`)
* "dwie wieże" (`hist`)

## Zadania na prawdziwych danych
Popularne wskaźniki dotyczące krajów.

Opisy wskaźników znajdują się w pliku `6b411fa3-2348-4a1e-808d-080fcf97ca1a_Definition and Source.csv`

Źródło danych:

http://databank.worldbank.org/data/indicator/NY.GDP.MKTP.CD/1ff4a498/Popular-Indicators#

In [None]:
# wczytanie i oczyszczenie danych
indicators_df = pd.read_csv("Popular Indicators/6b411fa3-2348-4a1e-808d-080fcf97ca1a_Data.csv", sep=",")
indicators_df = indicators_df.dropna(axis=0, how="any", subset=["Series Code"])
indicators_df.columns = [x[:4] if x[0] == "2" else x for x in indicators_df.columns]
year_cols = [str(x) for x in range(2000,2016)]
indicators_df[year_cols] = indicators_df[year_cols].apply(lambda x: pd.to_numeric(x, errors="coerce"))
indicators_df.head()

In [None]:
indicators_melted_df = pd.melt(indicators_df, id_vars=["Series Name", "Country Name"], value_vars=year_cols)
indicators_melted_df.columns = ["metric", "country", "year", "value"]
indicators_melted_df.head()

In [None]:
# przykład: liczba ludności na świecie
tmp = indicators_melted_df[indicators_melted_df["metric"] == "Population, total"].groupby(["year"])["value"].sum()

plt.plot(tmp, "*", markersize = 20)
plt.title("Liczba ludności na świecie", fontsize = 20)
plt.xlabel("lata", fontsize = 16)
plt.xticks(rotation = 45) # ustawienie kąta wyświetlania labelek
plt.tick_params(axis="both", labelsize=14)
plt.show()

**ZADANIA:**

1. Stwórz stackplot populacji USA i Kanady
2. Na jednym obrazku stwórz dwa barploty dla krajów których nazwy zaczynają się od A lub B: górny - `Life expectancy at birth, total (years)` per kraj w 2015 roku, dolny - `Fertility rate, total (births per woman)` per kraj w 2015 roku (odrzuć NaN)
3. Na jednym obrazku stwórz dwa wykresy liniowe: górny - `GDP per capita (current US$)` na przestrzeni lat dla dwóch najbogatszych krajów; dolny - `Life expectancy at birth, total (years)` na przestrzeni lat dla dwóch najbogatszych krajów

In [None]:
plt.rcParams['figure.figsize'] = (16, 8)

In [None]:
plt.rcParams['figure.figsize'] = (8, 8)

## Nie tylko matplotlib

**Nowy zbiór danych**

Jeden z najpopularniejszych zbiorów danych: *Iris*

https://archive.ics.uci.edu/ml/datasets/iris

In [None]:
iris = pd.read_csv("iris.data", header=None)
iris.columns = ["sepal_length", "sepal_width", "petal_length", "petal_width", "class"]
iris.head()

### Pandas

Pandas udostępnia interfejs do wizualizowania danych z wykorzystaniem matplotlib

In [None]:
iris.hist("sepal_length")
plt.show()

In [None]:
iris.hist("sepal_length", "class")
plt.show()

In [None]:
iris.plot.scatter("sepal_length", "sepal_width")
plt.show()

In [None]:
iris.plot.scatter(x='sepal_length', y='sepal_width', c='petal_length', s=iris["petal_width"]*100)
plt.show()

In [None]:
iris.plot.box()
plt.show()

In [None]:
iris.boxplot(by="class")
plt.show()

### Seaborn

Seaborn oferuje API zbudowane na podstawie matplotliba. Dodaje zestawy ustawień styli i kolorów pozwalające na generowanie atrakcyjnych wykresów oraz wygodne funkcje ułatwiające generowanie często spotykanych wykresów.

In [None]:
import seaborn as sns

**Przykłady:**

In [None]:
sns.pairplot(iris, hue='class', height=2.5)
plt.show()

In [None]:
sns.regplot(x='sepal_length', y='petal_width', 
            data=iris, ci=0, scatter_kws=dict(edgecolor='r',lw=2, facecolor='w', s=50),
            line_kws=dict(color='g'))
plt.show()

In [None]:
sns.scatterplot(x='sepal_length', y='petal_width', hue="class", data=iris)
plt.show()

In [None]:
sns.boxplot(x='class', y='petal_width', data=iris)
plt.show()

In [None]:
sns.distplot(iris["petal_width"])
plt.show()

In [None]:
sns.kdeplot(iris.petal_width[iris["class"]=='Iris-setosa'], label='Iris-setosa', shade=True)
sns.kdeplot(iris.petal_width[iris["class"]=='Iris-versicolor'], label='Iris-versicolor', shade=True)
sns.kdeplot(iris.petal_width[iris["class"]=='Iris-virginica'], label='Iris-virginica', shade=True)
plt.show()

**Łączenie z poleceniami z matplotlib**

In [None]:
sns.regplot(x='sepal_length', y='petal_width', 
            data=iris, ci=0, scatter_kws=dict(edgecolor='r',lw=2, facecolor='w', s=50),
            line_kws=dict(color='g'))
plt.annotate("regresja liniowa", (5.5, 0.95), (6.5, 0.5) ,arrowprops={'arrowstyle':'simple'}, fontsize=14)
plt.text(4.3, 2.7, "regresja + scatterplot", fontsize=18)
plt.hlines([2.6, 2.9], 4.2, 6.3, color="b")
plt.vlines([4.2, 6.3], 2.6, 2.9, color="b")
plt.show()

In [None]:
sns.regplot(x='sepal_length', y='petal_width', 
            data=iris, ci=0, scatter_kws=dict(edgecolor='r',lw=2, facecolor='w', s=50),
            line_kws=dict(color='g'))
plt.plot([4.5, 7.5], [2.5, 0.5], "b*--", markersize=20)
plt.show()

In [None]:
plt.figure()
ax1 = plt.subplot2grid((2,2), (0,0))
ax2 = plt.subplot2grid((2,2), (0,1))
ax3 = plt.subplot2grid((2,2), (1,0))
ax4 = plt.subplot2grid((2,2), (1,1))

sns.boxplot(x='class', y='petal_width', data=iris, ax=ax1)
sns.scatterplot(x='sepal_length', y='petal_width', hue="class", data=iris, ax=ax2)
sns.regplot(x='sepal_length', y='petal_width', 
            data=iris, ci=0, scatter_kws=dict(edgecolor='r',lw=2, facecolor='w', s=50),
            line_kws=dict(color='g'), ax=ax3)
sns.regplot(x='sepal_length', y='petal_width', 
            data=iris, ci=0, scatter_kws=dict(edgecolor='r',lw=2, facecolor='w', s=50),
            line_kws=dict(color='g'), ax=ax4)
ax4.plot([4.5, 7.5], [2.5, 0.5], "b*--", markersize=20)

plt.show()

**Zmiana stylu wykresów**

In [None]:
# zmiana domyślnego stylu matplotlib na domyślny styl seaborn
sns.set()

In [None]:
plt.figure(1)
plt.subplot(211)
plt.hist(hist_data, bins=50, density=True, color="g")

plt.subplot(212)
plt.plot(input_values, squares, linewidth=5)
plt.plot(list(reversed(input_values)), squares, linewidth=5)
plt.xlabel("Wartosc", fontsize=14)
plt.ylabel("Kwadrat", fontsize=14)
plt.tick_params(axis="both", labelsize=14)
plt.show()

In [None]:
iris.hist("sepal_length", "class")
plt.show()

In [None]:
# dostępne style
plt.style.available

In [None]:
# ustawienie wybranego
plt.style.use('ggplot')

In [None]:
iris.hist("sepal_length", "class")
plt.show()

# Zadanie końcowe/domowe

Zwizualizuj zbiór `flag.data`. Utwórz 10-15 możliwe zróżnicowanych, estetycznych i interesujących wykresów.

In [None]:
col_names = ["name", "landmass", "zone", "area", "population", "language", "religion", "bars", "stripes",
             "colours", "red",  "green", "blue", "gold", "white", "black", "orange", "mainhue", "circles",
             "crosses", "saltires", "quarters", "sunstars", "crescent", "triangle", "icon", "animate",
             "text", "topleft", "botright"]

flag_df = pd.read_csv("flag.data", sep=",", header=None)
flag_df.columns = col_names
flag_df.head()