In [None]:
import matplotlib
import numpy as np
import pandas as pd
import plotly.express as px
import plotly.graph_objs as go

from IPython.display import Image
from matplotlib import pyplot as plt

In [None]:
import os
IMG_FOLDER = '../img'

os.makedirs(IMG_FOLDER, exist_ok=True)

# Simple function

- Сгенерируйте данные для функции $y = x^3$. Возьмите числа от 0 до 99.
- Отобразите данные на графике. Обозначьте кажду точку в виде красного "+"
- Подпишите оси
- Дайте название графику

## Simple Matplotlib plot

In [None]:
n_points = 100

data = np.arange(n_points) ** 3

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task0_1.png'))

*Решение*

In [None]:
x = np.arange(100)
y = x ** 3

fig, ax = plt.subplots()

ax.plot(x, y, 'r+');

ax.set_title("$y = x^3$ graph")

ax.set_ylabel("y")
ax.set_xlabel("x")

ax.grid(True)

*Вариант 2:*

In [None]:
x = np.arange(100)
y = x ** 3

plt.figure(figsize=(8, 6))
plt.scatter(x, y, color='red', marker='+')

plt.title("$y = x^3$ graph")

plt.ylabel("y")
plt.xlabel("x")

plt.grid(True)

plt.show()

## Plot two lines

Представьте что вы сделали модель и предсказали еще 10 точек для вашего графика выше. Вы имеете точные значения и оценки на их вероятные верхние и нижние границы.

Постройте график, где сначала красным цветом будут показываться ваши "тренировочные" данные, а дальше желтым -- "предсказания". Светло-желтым закрасьте области между верхней и нижней границей для каждой точки, подпишите ее как CI в графике

In [None]:
preds_size = 10

preds = np.arange(len(data), len(data) + preds_size) ** 3

all_data = np.concatenate((data, preds))
stds = np.array([np.std(all_data[i - 50: i]) for i in range(len(data), len(data) + preds_size)])

l_bounds = preds - stds
h_bounds = preds + stds

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task0_2.png'))

*Решение*

In [None]:
fig, ax = plt.subplots(figsize=(10, 5))

train_range = np.arange(len(data))
preds_range = np.arange(len(data), len(data) + preds_size)

ax.plot(train_range, data, color='red', label='"train"')
ax.plot(preds_range, preds, '--y', label='"prediction"')

ax.fill_between(preds_range, l_bounds, h_bounds, alpha=0.1, color='yellow', label='CI')

ax.legend()
ax.grid(True)
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_title('Graph for function $y = x^3$')

# plt.set_ticklabel_format(style='plain')

## Using Plotly

**Давайте теперь сделаем интерактивный график в plotly**

https://plotly.com/python/marker-style/#using-a-custom-marker

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task0_1_plotly.png'))

*Решение*

In [None]:
plotly_fig = go.Figure(
    data=go.Scatter(
        x=np.arange(len(data)), y=data, name='"train"'
    ),
)

plotly_fig.update_traces(
    marker={
        'color': 'red',
        'symbol':'x'
    },
    mode='markers'
)

plotly_fig.update_layout(
    # title=r'$\text{Graph for function } y = x^3$',
    title_x=0.5,
    xaxis_title="x",
    yaxis_title="y",
)

plotly_fig.show()

**Добавим "предикты" с интервалами по аналогии с matplotlib**

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task0_2_plotly.png'))

*Решение*

In [None]:
plotly_fig.add_trace(
    go.Scatter(
        x=preds_range,
        y=preds,
        name='"prediction"',
        mode='lines',
        line=dict(color='green', width=2, dash='dash')
    )
)


# add filled area

plotly_fig.add_trace(
    go.Scatter(
        x=preds_range,
        y=l_bounds,
        mode='lines',
        line_color='rgba(0,0,0,0)',
        showlegend=False,
    )
)

plotly_fig.add_trace(
    go.Scatter(
        x=preds_range,
        y=h_bounds,
        fill='tonexty',
        mode='lines',
        line_color='rgba(0,0,0,0)',
        fillcolor='rgba(0, 255, 0, 0.2)',
        name='CI'
    )
)

# Figure for artificial data. Subplots. Line plot. Scatter plot

In [None]:
np.random.seed(42)

df = pd.DataFrame(data={'column_a':np.random.randint(0, 100, 30),
                        'column_b':np.random.randint(0, 100, 30),
                        'column_c':np.random.randint(0, 100, 30)})
df.head()

Постройте два графика в одной большой фигуре. 
Назовите фигуру "Task 1", используйте шрифт размера 20.

- Пошарьте ось x между графиками. Назовите ее "index".

- На первом графике:
    - нарисуйте две линии по данным "column_a", и "column_b";
    - сделайте "легенду" в верхней части графика, обозначьте оранжевым цветом данные из колонки a, синим -- данные из колонки b;
    - дайте название оси y: value;
    - назовите график "Line plots for column_a, column_b"

- На втором графике:
    - покажите зелеными точками данные из третьей колонки;
    - сделайте легенду в правом нижнем углу
    - назовите график "Scatter plot for column_c";

- Сохраните получившийся график в формат .png с названием 'task1_1.png' 


https://matplotlib.org/stable/tutorials/colors/colors.html

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task1.png'))

*Решение*

In [None]:
fig, ax = plt.subplots(2, 1, figsize=(15, 10), sharex=True)

ax[0].plot(df['column_a'], label='a', color='orange')
ax[0].plot(df['column_b'], label='b', color=(0, 0, 1))
ax[0].grid()
ax[0].legend(loc=9)
ax[0].set_title('Line plots for column_a, column_b')
ax[0].set_ylabel('value')


ax[1].scatter(df.index, df['column_c'], label='c', color='g')
ax[1].set_title('Scatter plot for column_c')
ax[1].legend(loc=4)
ax[1].set_xlabel('index')
ax[1].set_ylabel('value')


fig.suptitle('Task 1', fontsize=20)
fig.tight_layout()
fig.show()

    Для цветов я люблю использовать такую штуку. Заранее назначить набор цветов в глобальную переменную, и "ходить" по ним в графиках. Вот так:
    
```Python
from itertools import cycle

COLORS = cycle(['b','g','r','c','m','y'])  # have different colors in complex plots across the notebook
...
ax.plot(..., color=next(COLORS))
...

```

## Bar plot

Для датафрейма выше постройте bar plots отдельно для данных из колонок a, b, c. Подпишите значения в каждом "столбике" (`ax.bar_label` может помочь)

PS для однотипных операций используйте циклы

In [None]:
from itertools import cycle
COLORS = cycle(['b', 'g', 'r', 'c', 'm', 'y'])

### Using Matplotlib

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task2_1.png'))

*Решение*

In [None]:
fig, ax = plt.subplots(df.shape[1], 1, figsize=(15, 15), sharex=True)

for i, column_name in enumerate(df.columns):
    axis = ax[i]
    axis.bar(df.index, df[column_name], label=column_name, color=next(COLORS))
    axis.legend(loc=9)
    axis.set_title(f'bar plot for {column_name}')
    axis.bar_label(axis.containers[0], label_type='edge', padding=2, fontsize=8)
    axis.set_ylabel('value')
    axis.set_xlabel('index')
    axis.grid()

fig.suptitle('Task 2.1', fontsize=20)
fig.show()

**Также можно использовать df.plot от pandas**

In [None]:
fig, ax = plt.subplots(df.shape[1], 1, figsize=(20, 15), sharex=True)

for i, column_name in zip(range(3), df.columns):
    df[column_name].plot(kind='bar',
                         title=f'bar plot for {column_name}',
                         xlabel='index',
                         ylabel='value',
                         legend=True,
                         grid=True,
                         ax=ax[i],
                         color=next(COLORS))
    ax[i].bar_label(ax[i].containers[0], label_type='edge', padding=1, fontsize=8)

fig.suptitle('Task 2.1', fontsize=14)
fig.show()

### Using Plotly

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task2_1_plotly_1.png'))

*Решение*

In [None]:
plotly_fig = px.bar(df, x=df.index, y='column_a', barmode='group', title='Bar plot for column_a')
plotly_fig.show()

**Попробуем отобразить все колонки сразу**

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task2_1_plotly_2.png'))

*Решение*

In [None]:
plotly_fig = px.bar(df, x=df.index, y=df.columns, barmode='group', title='Bar plot for all columns')
plotly_fig.show()

## Stacked Bar Plot

### Using Matplotlib

**Выделение разных частей в колонках**

Сделайте bar plot по всем колонкам (суммы) и цветами укажите "вклад" каждой колонки

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task2_2.png'))

*Решение*

In [None]:
fig, axis = plt.subplots(1, 1, figsize=(15, 10), sharex=True)

cumulative = None
for column_name in df.columns:
    axis.bar(df.index, df[column_name], label=column_name, color=next(COLORS), bottom=cumulative)
    if cumulative is None:
        cumulative = df[column_name].copy()
    else:
        cumulative += df[column_name].copy()
    
axis.legend(loc=9)
axis.set_title(f'bar plot for all columns')
axis.bar_label(axis.containers[-1], label_type='edge', padding=2, fontsize=8)

axis.set_ylabel('value')
axis.set_xlabel('index')
axis.grid()

fig.suptitle('Task 2.2', fontsize=20)
fig.show()

Убедимся, что наши значение похожи на правду

In [None]:
df.sum(1).values

### Using Plotly

#### Convert Matplotlib graph to Plotly

Давайте попробуем написать небольшой "маппер" из графика выше с использованием matplotlib в plotly!

In [None]:
axis

In [None]:
# dir(axis)

In [None]:
axis.get_children()

https://matplotlib.org/stable/api/_as_gen/matplotlib.patches.Rectangle.html

Основной интересный для нас объект в bar plot -- это прямоугольник. Надо понять, какие параметры могут его задавать в plotly. Скорее всего это координаты: x, y, ширина

Попробуем сначала сконвертить один такой rectangle object в plotly

In [None]:
rectangle = axis.get_children()[0]

In [None]:
x = rectangle.get_x()

In [None]:
width = rectangle.get_width()

In [None]:
h = rectangle.get_height()

In [None]:
plotly_figure = go.Figure(
    go.Bar(x=[x], y=[h], width=[width]),
    layout=go.Layout(barmode="group")
)

In [None]:
plotly_figure.show()

Вроде похоже на правду. Теперь надо проапдейтить фигуру другими столбиками. Нас интересуют только объекты типа Rectange

In [None]:
plotly_figure.data

In [None]:
plotly_figure.data[0]['width']

Нашли наш Bar Plot в объекте фигуры. Теперь нужно добавить новые данные в списки с координатами по оси абсцисс, высотами и широтами

In [None]:
xs = []
widths = []
heights = []

for rect in axis.get_children():
    if isinstance(rect, matplotlib.patches.Rectangle):
        xs.append(rect.get_x())
        widths.append(rect.get_width())
        heights.append(rect.get_height())

In [None]:
plotly_figure.data[0]['width'] = widths
plotly_figure.data[0]['x'] = xs
plotly_figure.data[0]['y'] = heights

In [None]:
plotly_figure.show()

Хорошо. Но пока не хватает цвета и легенды

In [None]:
rectangle.get_facecolor()

Цвет задается с помощью комбинации rgba(Red, Green, Blue, Alpha). Нужно скастить этот tuple в строку нужного формата. Например, так 

In [None]:
tup = rectangle.get_facecolor()
f"rgb({','.join((np.array(tup[:3]) * 255).astype('int').astype('str'))})"

Этот цвет можно дописать в цикл выше. В фигуре за цвет отвечает параметр 'marker_color', как в самом первом примере на plotly, который мы разбирали

In [None]:
colors = []

for rect in axis.get_children():
    if isinstance(rect, matplotlib.patches.Rectangle):
        colors.append(
            f"rgb({','.join((np.array(rect.get_facecolor()[:3]) * 255).astype('int').astype('str'))})"
        )

plotly_figure.data[0]['marker_color'] = colors

plotly_figure.show()

Добавим подписи для осей

In [None]:
plotly_figure.update_layout(
    title=axis.get_title(),
    title_x=0.5,
    xaxis_title=axis.get_xlabel(),
    yaxis_title=axis.get_ylabel(),
)

Можно еще подумать о том, как добавить красивую легенду с названиями колонок

#### Plotly express

*Пример*

In [None]:
Image(filename=os.path.join(IMG_FOLDER,'task2_2_plotly.png'))

*Решение*

In [None]:
plotly_fig = px.bar(df, x=df.index, y=df.columns, title='Bar plot for all columns, combined')
plotly_fig.show()

# Exploring Kaggle Dataset with Seaborn

Для практики покрутите [датасет](https://www.kaggle.com/datasets/thec03u5/fifa-18-demo-player-dataset), основанный на данных из игры FIFA 18

Скачать данные с сайта можно в веб-интерфейсе после регистрации. Также у Kaggle есть [интерфейс](https://github.com/Kaggle/kaggle-api) для работы с командной строкой.

Хорошо написанный тутор с визуализацией данных выше: 

- [Часть 1](https://www.kaggle.com/code/residentmario/faceting-with-seaborn)
- [Часть 2](https://www.kaggle.com/code/residentmario/multivariate-plotting/notebook) 