# Wizualizacja danych

### Najpopularniejsze biblioteki w języku python do budowania interaktywnych wykresów


### Plotly
[[Github]](https://github.com/plotly/plotly.py) [[Dokumentacja]](https://plotly.com/python/) [[Przykłady]](https://plotly.com/python/plotly-express/)

### Bokeh
[[Github]](https://github.com/bokeh/bokeh) [[Dokumentacja]](https://bokeh.org/) [[Przykłady]](https://mybinder.org/v2/gh/bokeh/bokeh-notebooks/master?filepath=tutorial%2F00%20-%20Introduction%20and%20Setup.ipynb)

### Altair
[[Github]](https://github.com/altair-viz/altair) [[Dokumentacja]](https://altair-viz.github.io/) [[Przykłady]](https://altair-viz.github.io/gallery/)




### Plotly



Do zaprezentowania możliwości plotly wykorzystamy zbiór danych `stocks` udostępniony przez twórców biblioteki. Zbiór zawiera kurs zamknięcia 6 spółek z branży tech (GOOG, AAPL, AMZN, FB, NFLX, MSFT) z lat 2018-2019. Kursy są  w odniesieniu do kursu z 1.01.2018 roku. Dostęp do zbioru uzyskujemy za pomocą modułu `plotly.data`.

```python
import plotly

data = plotly.data.stocks()
```

Przejdźmy teraz do przygotowania wykresu pokazujące kurs zamknięcia w czasie dla spółki AAPL. Wykorzystamy do tego interfejs `plotly.graph_objects` w tym celu importujemy moduł `plotly.graph_objs`

```python 
import plotly.graph_objs as go
```

Następnie tworzymy obiekt `go.Figure()`

```python 
fig = go.Figure()
```

Wykres liniowy dodajemy za pomocą metody `add_scatter`

```python
fig.add_scatter(
    x=data["date"],
    y=data["AAPL"],
)
```

Wyświetlenie wykresu jest podobnie jak z wykorzystaniem biblioteki `matplotlib` przy pomocy metody `show` na obiekcie `fig`


In [None]:
import plotly
import plotly.graph_objs as go

data = plotly.data.stocks()

fig = go.Figure()

fig.add_scatter(
    x=data["date"],
    y=data["AAPL"],
)
fig.show()

Tytuły osi oraz tytuł wykresu możemy uzupełnić za pomocą metody `update_layout`. 

```python
fig.update_layout(
    yaxis_title="Close Price Ratio",
    xaxis_title="Date",
    title="AAPL Close Stock Price Ratio 2018-2019"
)
```

In [None]:
fig = go.Figure()

fig.add_scatter(
    x=data["date"],
    y=data["AAPL"],
)
fig.update_layout(
    yaxis_title="Close Price Ratio",
    xaxis_title="Date",
    title="AAPL Close Stock Price Ratio 2018-2019"
)

### Interfejs plotly.express

Plotly Express jest rekomendowanym przez twórców interfejsem do zarządzania plotly. W porówaniu do `plotly.graph_objs` jest wyższą funkcją abstrakcji i obudowuje większość funkcjonalności. Może być wykorzystany do większości zastosowań.

Przygotujmy teraz ten wcześniejszy wykres za pomocą interfejsu `plotly.express`. Wykres liniowy jest definiowany za pomoca metody `plotly.express.line`.

```python
import plotly.express as px


fig = px.line(data_frame=data, x="date", y="AAPL")
fig.show()
```

In [None]:
import plotly.express as px


fig = px.line(data_frame=data, x="date", y="AAPL")
fig.show()

Tytuły osi są w tutaj uzupełniane automatycznie, ale w dalszym ciągu nie odpowiadają poprzedniemu wykresowi. Tutaj również metadane modyfikujemy za pomocą metody `update_layout`.

In [None]:
fig = px.line(data_frame=data, x="date", y="AAPL")
fig.update_layout(
    xaxis_title="Date",
    yaxis_title="Close Price Ratio",
    hovermode="x",
    title="AAPL Close Stock Price Ratio 2018-2019"
)
fig.show()

Plotly.express wspiera również generowanie kilku osi danych. W tym przypadku najpierw musimy przemapować zbiór danych. Do tego zastosujemy metodę `melt` z obieku Pandas.DataFrame

In [None]:
df = data.melt(id_vars=["date"], var_name="stock", value_name="close price ratio")
fig = px.line(data_frame=df, x="date", y="close price ratio", color="stock")
fig.update_layout(
    xaxis_title="Date",
    yaxis_title="Close Price Ratio",
    title="Close stock price ratio 2018-2019 of tech corporations"
)
fig.show()

Plotly domyślnie podświetla najbliższy punkt na wykresie, co w przypadku wykresów z wieloma osiami Y nie do końca jest dobrym rozwiązaniem. Modyfikujemy to za pomocą metody `update_traces` i `update_layout`

```python
fig.update_traces(mode="markers+lines", hovertemplate=None)
fig.update_layout(hovermode="x")
```

In [None]:
fig = px.line(data_frame=df, x="date", y="close price ratio", color="stock")
fig.update_traces(mode="markers+lines", hovertemplate=None)
fig.update_layout(
    xaxis_title="Date",
    yaxis_title="Close Price Ratio",
    title="Close stock price ratio 2018-2019 of tech corporations",
    hovermode="x"
)
fig.show()


Obecny tryb wyświetlania powoduje, że wartość jest wyświetlana w zależności od pozycji na osi y. Możemy zmienić to zachowanie i wyświetlać wszystko w obrębie jednego obiektu. Wystarczy zmienić parametr `hovermode` na `x unified`

In [None]:
fig = px.line(data_frame=df, x="date", y="close price ratio", color="stock")
fig.update_traces(mode="markers+lines", hovertemplate=None)
fig.update_layout(
    xaxis_title="Date",
    yaxis_title="Close Price Ratio",
    title="Close stock price ratio 2018-2019 of tech corporations",
    hovermode="x unified"
)
fig.show()

Następną rzeczą przydatną w analizowaniu serii czasowych jest dodanie suwaka, za pomocą którego w szybkie sposób możemy zmieniać zakresy dat.


In [None]:
fig = px.line(data_frame=df, x="date", y="close price ratio", color="stock")
fig.update_traces(mode="markers+lines", hovertemplate=None)
fig.update_layout(
    xaxis_title="Date",
    yaxis_title="Close Price Ratio",
    title="Close stock price ratio 2018-2019 of tech corporations",
    hovermode="x unified"
)
fig.update_xaxes(rangeslider_visible=True)
fig.show()

Jeżeli mamy zakresy dat które chcemy sprawdzić za każdym razem, zamiast ciągłego przesuwania suwaka możemy dodać przyciski, które będą zmieniać zakresy.

W tym celu definiujemy słownik z przyciskami. Aby stworzyć przycisk musimy zdefiniować kilka parametrów:
- step (krok)
- count (liczba)
- label (etykieta)
- stepmode (typ kroku): backward (ostatni zakres ze zbioru danych) czyli np. 15 listopad - 15 grudzień, todate (ostatni zakres wyrównany względem kalendarza) - 1 grudzień - 31 grudzień.

Słownik jest przekazywany jako argument `rangeselector` do metody `update_axes` obiektu `fig`.

In [None]:
fig = px.line(data_frame=df, x="date", y="close price ratio", color="stock")
fig.update_traces(mode="lines", hovertemplate=None)
fig.update_layout(
    xaxis_title="Date",
    yaxis_title="Close Price Ratio",
    title="Close stock price ratio 2018-2019 of tech corporations",
    hovermode="x unified"
)
fig.update_xaxes(
    rangeslider_visible=True,
    rangeselector=dict(
        buttons=list([
            dict(count=1, label="1m", step="month", stepmode="todate"),
            dict(count=6, label="6m", step="month", stepmode="backward"),
            dict(count=1, label="1y", step="year", stepmode="backward"),
            dict(step="all")
        ])
    )
)
fig.show()