In [None]:
import pandas as pd

import matplotlib.pyplot as plt

Для этого урока используются данные о качестве воздуха (наличие оксида озота в атмосфере). 

<img src="https://openaq.org/assets/graphics/meta/default-meta-image.png" height="300px" width="500px">

[Источник данных](https://openaq.org), для получения используется модуль [py-openaq](http://dhhagan.github.io/py-openaq/index.html).

Набор данных `air_quality_no2.csv` содержит значения оксида озота ($NO_2$) для измерительных станций `FR04014`, `BETR801` и `London Westminster` соответственно в Париже, Антверпене и Лондоне.

В России сведения не собирают, см. [карту](https://openaq.org/#/map?_k=6k578s)

In [None]:
url = "./data/air_quality_no2.csv"

In [None]:
air_quality = pd.read_csv(url,
                          index_col=0, 
                          parse_dates=True)
air_quality.head()

Использование параметров `index_col` и `parse_dates` функции `read_csv` для определения первого (0-го) столбца в качестве индекса `DataFrame` и преобразование значений индекса в объекты типа [`Timestamp`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Timestamp.html#pandas.Timestamp) соотвественно.

<img src="https://pandas.pydata.org/docs/_images/04_plot_overview.svg" >

Я хочу быстро получить визуальное представление данных:

In [None]:
air_quality.plot();

По умолчанию создается один линейный график для каждого из столбцов таблицы с числовыми данными.

Я хочу построить график только для столбцов с данными из Парижа:

In [None]:
air_quality["station_paris"].plot();

Чтобы построить график для конкретного столбца таблицы, используйте методы выбора данных подмножеств в сочетании с методом [`plot()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.html#pandas.DataFrame.plot). 

`plot()` работает для `Series` и `DataFrame`.

Я хочу визуально сопоставить значения $NO_2$ в Лондоне и Парижа.

In [None]:
# https://matplotlib.org/3.2.1/api/_as_gen/matplotlib.pyplot.scatter.html

air_quality.plot.scatter(x="station_london",
                         y="station_paris",
                         alpha=0.5); 

Помимо линейного графика по умолчанию при использовании функции `plot` существует ряд альтернатив. 

Давайте используем стандартный Python, чтобы получить обзор доступных методов для построения графика:

In [None]:
[method_name for method_name in dir(air_quality.plot) if not method_name.startswith("_")]

В `jupyter notebook` используйте кнопку `TAB`, чтобы получить обзор доступных методов, например `air_quality.plot.+ TAB`.

Пример [`DataFrame.plot.box()`](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.box.html#pandas.DataFrame.plot.box):

In [None]:
air_quality.plot.box();

Для ознакомления с графиками, отличными от линейного, см. [Раздел руководства пользователя о поддерживаемых стилях графиков](https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html#visualization-other).

Я хочу, чтобы каждый из столбцов отображался в отдельном графике:

In [None]:
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)

Отдельные подграфики для каждого из столбцов данных поддерживаются аргументом `subplots` функции `plot`.

Некоторые дополнительные параметры форматирования описаны в разделе [руководства пользователя по форматированию графиков](https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html#visualization-formatting).

Я хочу дополнительно настроить, расширить или сохранить полученный график:

In [None]:
fig, axs = plt.subplots(figsize=(12, 4)); 
air_quality.plot.area(ax=axs); 
axs.set_ylabel("NO$_2$ concentration"); 
fig.savefig("no2_concentrations.png")  

Каждый из графических объектов, созданных `pandas`, является объектом [`matplotlib`](https://matplotlib.org/). Поскольку `Matplotlib` предоставляет множество опций для настройки графиков, прямая связь между `pandas` и `Matplotlib` позволяет использовать всю мощь `matplotlib` для графика. 