## Модуль plotly 3. Домашнее задание

### Цель задания

В этом задании вы закрепите и самостоятельно отработаете знания и навыки работы с Plotly, полученные в пройденном модуле.

### Советы и рекомендации

Вам может помочь:
- знание того, что plotly.express.scatter() и прочие подобные методы возвращают объект класса Figure, с атрибутами которого вы уже умеете работать;
- документация [по layout.xaxis](https://plotly.com/python/reference/layout/xaxis/), например, какие-то из параметров dtick, tick0, tickmode, tickvals, ticktext.

### Что оценивается 

1. Наличие всех требуемых графиков и прогнозов.
2. Соответствие графиков требованиям, указанным в соответствующих пунктах.
3. Точность прогноза.
4. Обоснование применения сторонних алгоритмов или методов, не рассмотренных в модуле, если такие использованы. Их использование должно повышать точность прогнозирования в сравнении с базовым прогнозированием с помощью линейного тренда. В таком случае нужно выбрать метрики качества регрессии самостоятельно и обосновать их.
5. Правильность ответов в свободной форме в пункте 7.

### Как отправить задание на проверку

Результатом работы должен быть Jupyter Notebook с кодом, построенными графиками и комментариями к пунктам 4 (если вы используете методы или алгоритмы, которые мы не изучали в этом модуле), 6, 7 и 8.

Результатом выполнения пункта 8 должны быть как сами прогнозы, так и все дополнительные материалы и объяснения построения прогнозов.

Итоговый файл с расширением .ipynb загрузите в личный кабинет и отправьте на проверку.



0. Загрузите датасет из практического задания после первого урока hw_sales.csv.

In [136]:
import numpy as np
import pandas as pd

data_f = pd.read_csv('./hw_sales.csv')
data_f.tail()

Unnamed: 0,quarter number,sales amount,item
0,0,129.904198,pen
1,1,137.40185,pen
2,2,141.382504,pen
3,3,161.056964,pen
4,4,167.257382,pen
5,5,164.33013,pen
6,6,168.1933,pen
7,7,159.825423,pen
8,8,173.136683,pen
9,9,176.926805,pen


In [113]:
data_all = data_f.groupby('quarter number')['sales amount'].sum()


1. Постройте ряд для суммарного количества проданных ручек и карандашей (можно создать новый объект с данными или преобразовать существующий, добавив в него суммарные продажи).

In [112]:
import plotly.graph_objects as go


fig = go.Figure(data=[
    go.Scatter(x=data_all.index, y=data_all.values, name='sales amount', mode='markers+lines'),
])
fig.show()

2. Постройте график суммарного количества продаж вместе с линейным трендом.

In [129]:
from sklearn.linear_model import LinearRegression

df_log=pd.DataFrame({'X':data_all.index,
                     'Y': np.log(data_all.values)})
df_log.set_index('X', inplace = True)

reg = LinearRegression().fit(np.vstack(df_log.index), df_log['Y'])
df_log['bestfit'] = reg.predict(np.vstack(df_log.index))

df_new=pd.DataFrame({'X':data_all.index,
                     'Y':np.exp(data_all.values),
                     'trend':np.exp(df_log['bestfit'])})

df_new.set_index('X', inplace=True)

fig = go.Figure(data=[
    go.Scatter(x=data_all.index, y=data_all.values, name='sales amount', mode='markers+lines'),
    go.Scatter(name='line of trend', x=df_new.index, y=df_new['trend'], mode='lines')
])
fig.show()

3. Настройте график так, чтобы все оси были подписаны (ось X — quarter number, ось Y — sales amount), а по оси X были значения от 1 до 20. Для получения результата можно как настраивать сам график, так и модифицировать датасет.

In [128]:
fig = go.Figure(data=[
    go.Scatter(x=data_all.index, y=data_all.values, name='sales amount', mode='markers+lines'),
    go.Scatter(name='line of trend', x=df_new.index, y=df_new['trend'], mode='lines')
],
)
fig.update_layout(
    xaxis_title="quarter number",
    yaxis_title="sales amount",

)
fig.update_layout(xaxis_range=[1,20])
fig.show()


In [123]:
data_f_pen = data_f[data_f['item'] == 'pen']
data_f_pencil = data_f[data_f['item'] == 'pencil']
data_f_pen = data_f_pen.groupby('quarter number')['sales amount'].sum()
data_f_pencil = data_f_pencil.groupby('quarter number')['sales amount'].sum()


5. Добавьте на этот же график столбчатые диаграммы продаж ручек и карандашей.


In [131]:
fig = go.Figure(data=[
    go.Scatter(x=data_all.index, y=data_all.values, name='sales amount', mode='markers+lines'),
    go.Scatter(name='line of trend', x=df_new.index, y=df_new['trend'], mode='lines'),
    go.Bar(x=data_f_pen.index,y=data_f_pen.values,name='pen'),
    go.Bar(x=data_f_pencil.index,y=data_f_pencil.values,name='pencil'),
    
],
)
fig.update_layout(
    xaxis_title="quarter number",
    yaxis_title="sales amount",

)
fig.update_layout(xaxis_range=[1,20])
fig.show()




6. Проконтролируйте наличие легенды к столбчатым диаграммам для ручек и карандашей, а также для точек суммарных продаж. Если каких-то из них нет, то поправьте. Посмотрите значение \<figure_variable_name>.data: что там не так и что нужно поправить?


In [127]:
fig = go.Figure(data=[
    go.Scatter(x=data_all.index, y=data_all.values, name='sales amount', mode='markers+lines'),
    go.Scatter(name='line of trend', x=df_new.index, y=df_new['trend'], mode='lines'),
    go.Bar(x=data_f_pen.index,y=data_f_pen.values,name='pen'),
    go.Bar(x=data_f_pencil.index,y=data_f_pencil.values,name='pencil'),
    
],
)
fig.update_layout(
    xaxis_title="quarter number",
    yaxis_title="sales amount",

)
fig.update_layout(xaxis_range=[1,20])
fig.show()






fig.data

(Scatter({
     'mode': 'markers+lines',
     'name': 'sales amount',
     'x': array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
                 18, 19]),
     'y': array([326.61006063, 336.7690073 , 364.02154782, 403.97614243, 404.23388126,
                 400.69527318, 390.15549426, 392.95489779, 395.92852204, 416.16787781,
                 416.437991  , 431.70414841, 443.69757433, 437.06543638, 432.06747994,
                 425.89515158, 430.02349179, 471.87223621, 491.9325728 , 503.70728235])
 }),
 Scatter({
     'mode': 'lines',
     'name': 'line of trend',
     'x': array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
                 18, 19]),
     'y': array([352.62588839, 358.58627022, 364.64739948, 370.81097909, 377.07874074,
                 383.45244542, 389.93388387, 396.52487708, 403.22727685, 410.04296626,
                 416.97386024, 424.02190606, 431.18908394, 438.47740753, 445.88892455,
                 453

7. Проанализируйте изменения соотношения количества проданных ручек и карандашей. Что с ним происходит со временем? Какая тенденция? Напишите ответ в свободной форме и обоснуйте его с помощью графиков и комментариев к ним.

Можно сказать что тенденция по покупке ручек и карандашей положительная. По графику можно сказать что обьем ручек превышает обьем карандашей. Со временем кол-во проданных ручек и карандашей растет. Если есть небольшие просадки по продажам у ручек, в тоже время есть просадки и у карандашей.

8. (по желанию) Спрогнозируйте количество проданных ручек и карандашей на кварталы 21, 22, 23 и 24 так, чтобы сумма их прогнозов была равна ранее построенному прогнозу суммарного количества продаж (если для прогноза используется график, его нужно нарисовать, но настраивать его оси и прочий внешний вид необязательно).