# A1.ipynb — Первый график Plotly

Построим наш первый график. Мы воспользуемся набором данных [Airline Passengers Dataset](https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv) из книги [**Introduction to Time Series Forecasting With Python**](https://machinelearningmastery.com/introduction-to-time-series-forecasting-with-python/). В этом наборе данных представлена информация о ежемесячном объёме перевезённых пассажиров за период с 1948 по 1960 год.

In [None]:
# Проверяем версию библиотеки Plotly
!conda list | grep plotly

/bin/bash: conda: command not found


Импортируем необходимые библиотеки, в этом уроке нам дополнительно к Plotly потребуется и библиотека Numpy, и Pandas.

In [None]:
# Импортируем необходимые библиотеки
import plotly.graph_objects as go
import numpy as np
import pandas as pd
#  Следующие библиотеки необходимы вам чтобы скачать dataset
import io
import requests

В первую очередь необходимо прочитать наш датасет и сделать необходимые преобразования. Используя библиотеку requests, скачаем этот набор данных https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv и загрузим его в dataframe pandas с именем data, используя команду чтения csv-файла.

In [None]:
# Читаем данные из датасета - https://github.com/jbrownlee/Datasets/blob/master/airline-passengers.csv
url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv"
s = requests.get(url).content
data = pd.read_csv(io.StringIO(s.decode('utf-8')))

Посмотрим на данные, всегда стоит это делать для первичного осмотра, чтобы узнать, кто есть кто. Посмотрим на семпл, у меня он такой.

In [None]:
data.sample(5)

Unnamed: 0,Month,Passengers
81,1955-10,274
0,1949-01,112
118,1958-11,310
123,1959-04,396
121,1959-02,342


Видим, что в первом столбце представлен месяц, за который произведены измерения, а во втором столбце — количество перевезённых пассажиров. При этом месяц представлен вместе с годом, c 1948-го по 1960-й. Номер месяца от года отделяется символом тире. Переведём колонку Month к типу datetime.

In [None]:
# Выполним преобразования, чтобы сделать наш датасет более удобным к использованию
data['Month'] = pd.to_datetime(data['Month'])

Теперь наша цель — представить данные в графическом виде с использованием библиотеки Plotly. По оси абсцисс будем откладывать год и месяц измерений, а по оси ординат — количество перевезённых пассажиров в данном году и месяце. Будет удобно, если мы выделим данные отдельно для оси x и отдельно для оси y.

In [None]:
# Подготовливаем данные для визуализации
x_month = data['Month']
y_pass = data['Passengers']

Для построения графика нам необходимо:
- создать объект Figure из библиотеки Plotly;
- для добавления одного графика на рисунок мы будем использовать метод add_trace, в который передадим данные нашего графика;
- а для того, чтобы график отрисовался, мы воспользуемся командой paper.show().

In [None]:
# Создаём объект paper
paper = go.Figure()
# Добавляем на него наш первый график
paper.add_trace(
    go.Scatter(
        x = x_month,
        y = y_pass,
    )
)
# Визуализируем
paper.show()

А что, если бы мы хотели визуализировать не график, а столбчатые диаграммы? Тогда вместо объекта Scatter мы будем использовать объект Bar.

In [None]:
# Создаём объект paper
paper = go.Figure()
# Добавляем на него наш первый график
paper.add_trace(
    go.Bar(
        x = x_month,
        y = y_pass,
    )
)
# Визуализируем
paper.show()