# lab 10. Wprowadzenie do biblioteki plotly.

## 1. Plotly express

Poznawanie biblioteki plotly warto rozpocząć od poznania plotly express, którego użyciew wymaga zazwyczaj niewiele kodu a podobnie jak w przypadku Seaborn, wiele domyślnych ustawień powoduje, że otrzymujemy atrakcyjne i wartościowe wykresy. Aby biblioteka plotly działała poprawnie z wykorzystanie Jupyter notebook w oknie przeglądarki (wewnatrz Pycharm nie jest to wymagane), należy uruchomić tryb offline dla plotly. Przykład poniżej.

### 1.1 Wykresy prezentujące strukturę danych (w dokumentacji plotly w kategorii 'Part-of-whole').

**Wykres typu pie**

* Dokumentacja: https://plotly.com/python/pie-charts/

In [1]:
import plotly.express as px
import pandas as pd
from plotly.offline import init_notebook_mode

# inicjalizacja trybu offline dla plotly
init_notebook_mode(connected=True)

df = px.data.gapminder().query("year == 2007").query("continent == 'Europe'")
df.loc[df['pop'] < 2.e6, 'country'] = 'Other countries' # Represent only large countries
fig = px.pie(df, values='pop', names='country', title='Population of European continent')
fig.show()

Wykres, który uzyskaliśmy powyżej, jest wykresem interaktywnym, gdzie, w tym przypadku, możemy włączać lub wyłączać poszczególne serie danych poprzez klikanie w ich nazwy w legendzie.

In [2]:
# kolejny przykład z użyciem znanego nam już zbioru danych
df = pd.read_csv('./data/zamowienia.csv', sep=';')
# konwersja kolumny z datą
df['Data zamowienia'] = pd.to_datetime(df['Data zamowienia'])
fig = px.pie(df, values='Utarg', names='Sprzedawca')
fig.show()

**Wykres typu treemap**
* Dokumentacja: https://plotly.com/python/treemaps/

Poniższy wykres również jest wykresem interaktywnym. Przetestuj klikając w wybrane elementy struktury.

In [3]:
fig = px.treemap(df, path=[px.Constant("Sprzedaż"), 'Kraj', 'Sprzedawca'], values='Utarg', )
fig.update_traces(root_color="lightgrey")
fig.update_layout(margin = dict(t=50, l=25, r=25, b=25))
fig.show()

# z poniższego komunikatu wynika, że autorzy biblioteki plotly też będą musieli dokonać zmian w kodzie
# ze względu na zmiany w zależnej bibliotece pandas


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.


The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.



### 1.2 Histogramy

* Dokumentacja: https://plotly.com/python/histograms/

In [4]:
import numpy as np

# wartość bins ustalana może być automatycznie
fig = px.histogram(df, x='Utarg')

# lub arbitralnie na określoną ilość
fig2 = px.histogram(df, x='Utarg', nbins=10)

# lub w postaci z góry zdefiniowanych przedziałów (tu trzeba znać już rozkład danych, żeby nic nie zostało ucięte)
# poniżej w przedziałach co 2000
bins = range(0, int(max(df.Utarg))+2000, 2000)
ilosc, bins = np.histogram(df.Utarg, bins=bins)
# wartość każdego bina to średnia z przedziału
bins = 0.5 * (bins[:-1] + bins[1:])
fig3 = px.bar(x=bins, y=ilosc, labels={'x':'Utarg', 'y':'ilość'})
fig3.update_layout(bargap=0.2)

# wyświetlamy wszystkie wykresy
fig.show(), fig2.show(), fig3.show()


(None, None, None)

### 1.3 Mapa ciepła

**Dokumentacja:** https://plotly.com/python/2D-Histogram/

In [5]:
fig = px.density_heatmap(df, x="Utarg", y="Sprzedawca", text_auto=True)
fig.show()