# Пакет `matplotlib`

---

**Источники:**

[Matplotlib](https://ru.wikipedia.org/wiki/Matplotlib)

[2. Я новичок. Можно попроще?](https://pyprog.pro/mpl/mpl_types_of_graphs.html)

[Типы графиков в matplotlib / plt 3](https://pythonru.com/biblioteki/tipy-grafikov-v-matplotlib-plt3)

[50 оттенков matplotlib — The Master Plots (с полным кодом на Python)](https://habr.com/ru/post/468295/)

[Data Visualization using Python for Machine Learning and Data science](https://towardsdatascience.com/data-visualization-for-machine-learning-and-data-science-a45178970be7)

[User's Guide](https://matplotlib.org/stable/users/index.html)

[Usage Guide](https://matplotlib.org/stable/tutorials/introductory/usage.html)

[Matplotlib: Научная графика в Python](https://pythonworld.ru/novosti-mira-python/scientific-graphics-in-python.html)

[Plotting A Spectrogram Using Python And Matplotlib](https://pythontic.com/visualization/signals/spectrogram)

---

## Подготовка окружения

In [None]:
# ВНИМАНИЕ: необходимо удостовериться, что виртуальная среда выбрана правильно!

!pip -V

In [None]:
# !conda install matplotlib numpy scipy -y

In [None]:
import matplotlib
import matplotlib.pyplot as plt

matplotlib.__version__

In [None]:
import numpy as np

np.__version__

## Обзор пакета `matplotlib`

`Matplotlib` — библиотека на языке программирования `Python` для визуализации данных двумерной (`2D`) графикой (`3D` графика также поддерживается). 

`Matplotlib` является гибким, легко конфигурируемым пакетом, который вместе с `NumPy`, `SciPy` и `IPython` предоставляет возможности, подобные `MATLAB`. 

Пакет поддерживает многие виды графиков и диаграмм:
- Графики (line plot)
- Диаграммы разброса (scatter plot)
- Столбчатые диаграммы (bar chart)
- Гистограммы (histogram)
- Круговые диаграммы (pie chart)
- Ствол-лист диаграммы (stem plot)
- Контурные графики (contour plot)
- Поля градиентов (quiver)
- Спектральные диаграммы (spectrogram)

### Графики (line plot)

**Линейный график или просто график** (line chart/ine plot/line graph/curve chart) - это тип графиков, на которой информация отображается в виде серии точек данных, называемых "маркерами", соединенных отрезками прямых линий.

Это основной тип графиков, распространенный во многих областях.

Линейный график часто используется для визуализации тенденции данных за интервалы времени (временного ряда), поэтому линия часто проводится в хронологическом порядке. В этих случаях они известны как run chart.

В экспериментальных науках данные, собранные в ходе экспериментов, часто визуализируются в виде графика.

[matplotlib.lines.Line2D](https://matplotlib.org/stable/api/_as_gen/matplotlib.lines.Line2D.html#matplotlib.lines.Line2D)

In [None]:
x = np.linspace(0, 5, 10)
plt.plot(x, x, 
         label='linear',
         linestyle='--',
         color='green',
         linewidth=4, 
         markersize=15,
         marker='*', 
         markerfacecolor='red',
         markeredgecolor='blue',
         markeredgewidth=1.5
        )

### Диаграммы разброса (scatter plot)

**Диаграмма рассеяния (также точечная диаграмма, англ. scatter plot)** — математическая диаграмма, изображающая значения двух переменных в виде точек на декартовой плоскости.

Могут использоваться и полярные координаты, особенно в случаях, когда одна из переменных представляет собой физическое направление или имеет циклический характер.

На **диаграмме рассеяния** каждому наблюдению (или элементарной единице набора данных) соответствует точка, координаты которой равны значениям двух каких-то параметров этого наблюдения.

Если предполагается, что один из параметров зависит от другого, то обычно значения независимого параметра откладывается по горизонтальной оси, а значения зависимого — по вертикальной.

**Диаграммы рассеяния** используются для демонстрации наличия или отсутствия корреляции (=связи) между двумя переменными.

[matplotlib.pyplot.scatter](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html#matplotlib.pyplot.scatter)

In [None]:
N = 50
x = np.random.rand(N)
y = np.random.rand(N)
colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2  # 0 to 15 point radii
plt.scatter(x, y, 
            s=area, 
            c=colors, 
            alpha=0.5,
            linewidths=2,
            edgecolors=(0.1, 0.9, 0.5),
            marker='P'
           )

### Столбчатые диаграммы (bar chart)

**Столбчатая диаграмма** — диаграмма, представленная прямоугольными зонами (столбцами), высоты или длины которых пропорциональны величинам, которые они отображают.

Прямоугольные зоны могут быть расположены вертикально или горизонтально.

**Столбчатая диаграмма** отображает сравнение нескольких дискретных категорий. Одна её ось показывает сравниваемые категории, другая — измеримую величину. Иногда столбчатые диаграммы отображают несколько величин для каждой сравниваемой категории.

[matplotlib.pyplot.bar](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.bar.html#matplotlib.pyplot.bar)

In [None]:
langs = ['C', 'C++', 'Java', 'Python', 'PHP']
langs_ticks = ['Cool', 'Cool++', 'Java!!!', 'PythonSSS', 'PHP?']

students = [23,17,35,29,12]
plt.bar(langs, students, 
        color='m', 
        width=0.5,
        edgecolor='#2ca02c',
        linewidth=5,
        tick_label=langs_ticks,
        alpha=0.7,
        hatch="O",
        linestyle=":"
       )

### Гистограммы (histogram)

[matplotlib.pyplot.hist](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.hist.html)

In [None]:
N_points = 100000
n_bins = 10

# Generate a normal distribution, center at x=0
x = np.random.randn(N_points)

plt.hist(x, 
         bins=n_bins, 
         orientation='horizontal',
         color='c', 
         edgecolor='#2ca02c',
         linewidth=5,
         alpha=0.7,
         hatch="|",
         linestyle=":"
        )

### Круговые диаграммы (pie chart)

[matplotlib.pyplot.pie](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.pie.html)

In [None]:
labels = 'Frogs', 'Cats', 'Dogs', 'Birds'
sizes = [15, 30, 45, 10]
explode = (0, 0.1, 0, 0)
colors = ['green', 'orange', 'blue', 'yellow']

fig1, ax1 = plt.subplots()
plt.pie(sizes, 
        explode=explode, 
        labels=labels, 
        autopct='%1.1f%%',
        shadow=True, 
        startangle=90,
        colors=colors,
        radius=2,
        textprops={'fontsize': 20}
       )

### Ствол-лист диаграммы (stem plot)

[matplotlib.pyplot.stem](https://matplotlib.org/3.3.4/api/_as_gen/matplotlib.pyplot.stem.html)

In [None]:
x = np.linspace(0.1, 2 * np.pi, 41)
y = np.exp(np.sin(x))

plt.stem(x, y,
         linefmt="m-.",
         markerfmt="g^",
         basefmt='y:',
         bottom=1.1
        )

### Контурные графики (contour plot)

[matplotlib.pyplot.contour](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.contour.html)

In [None]:
x = np.arange(1, 10)
y = x.reshape(-1, 1)
h = x * y

display(h)

plt.contourf(h, 
             levels=[10, 30, 50],
             extend='both',
             cmap=plt.get_cmap('Spectral'),
             alpha=0.5
            )

### *Поля градиентов / Колчан (quiver)

В математике **колчан** — это ориентированный граф, в котором допускаются циклы и множественные стрелки между двумя вершинами, то есть мультиграф.

Они обычно используются в теории представлений: представление `V` колчана назначает векторное пространство `V(x)` каждой вершине `x` колчана и линейное отображение `V(a)` каждой стрелке `a`.

[matplotlib.pyplot.quiver](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.quiver.html)

[numpy.meshgrid](https://numpy.org/doc/stable/reference/generated/numpy.meshgrid.html#numpy.meshgrid)

In [None]:
X, Y = np.meshgrid(np.arange(0, 2 * np.pi, .2), np.arange(0, 2 * np.pi, .2))
U = np.cos(X)
# V = np.sin(Y)

plt.quiver(X, Y, U, # V, 
           pivot="tip",
           cmap=plt.get_cmap('viridis'),
           units='x',
           scale=1 / 0.15
          )

### *Спектральные диаграммы / Спектрограмма (spectrogram)

**Спектрогра́мма (соногра́мма)** — изображение, показывающее зависимость спектральной плотности мощности сигнала от времени.

**Спектрограммы** применяются для идентификации речи, анализа звуков животных, в различных областях музыки, радио- и гидролокации, обработке речи, сейсмологии и в других областях.

Наиболее распространенным представлением **спектрограммы** является двумерная диаграмма:
- на горизонтальной оси представлено время
- по вертикальной оси — частота
- третье измерение с указанием амплитуды на определенной частоте в конкретный момент времени представлено интенсивностью или цветом каждой точки изображения.


[matplotlib.pyplot.specgram](https://matplotlib.org/3.3.4/api/_as_gen/matplotlib.pyplot.specgram.html)

In [None]:
from scipy.io import wavfile

wav_path = "./../../data/pcm1608m.wav"
sample_rate, data = wavfile.read(wav_path)

sample_rate, data

In [None]:
plt.plot(data)

In [None]:
spectrum, freqs, t, im  = plt.specgram(data, 
                                       Fs=sample_rate,
                                       mode='psd',
                                       cmap=plt.get_cmap('winter')
                                      )

In [None]:
spectrum, freqs, t, im  = plt.specgram(data, 
                                       Fs=sample_rate,
                                       mode='phase',
                                       cmap=plt.get_cmap('seismic')
                                      )

In [None]:
spectrum, freqs, t, im  = plt.specgram(data, 
                                       Fs=sample_rate,
                                       mode='angle',
                                       cmap=plt.get_cmap('bwr')
                                      )

## Основные элементы фигуры (Parts of a Figure)


### Цвет

[matplotlib.colors](https://matplotlib.org/stable/api/colors_api.html?highlight=colors#module-matplotlib.colors)

### Стили линий

[Linestyles](https://matplotlib.org/stable/gallery/lines_bars_and_markers/linestyles.html?highlight=linestyle)

### Иерархическая структура рисунка в matplotlib

## Объектно-ориентированный интерфейс и интерфейс pyplot

Существуют несколько основных способов использования `Matplotlib`:
- Положиться на `pyplot` для автоматического создания фигур (`figures`) и осей (`axes`), и управления ими, а также использовать функции `pyplot` для построения графиков ("**`pyplot`-стиль**").
- Явно создать фигуры (`figures`) и оси (`axes`), и вызывать их методы ("**объектно-ориентированный (ОО) стиль**").
- *Подход для случая, когда `Matplotlib` встраивается в приложение с графическим интерфейсом (GUI), которое полностью отбрасывает вариант с `pyplot` даже для создания фигур.


В документации и примерах `Matplotlib` используются как **ОО-стиль**, так и **`pyplot`-стиль** (которые одинаково эффективны), и можно свободно использовать любой из них (однако, *желательно выбрать один из них и придерживаться его, а не смешивать их*).

В общем, рекомендуется использовать **`pyplot`-стиль при интерактивном построением графиков (например, в записной книжке `Jupyter`)** и предпочесть **объектно-ориентированный стиль для неинтерактивного построения графиков (в функциях и скриптах, которые предназначены для повторного использования как часть более крупного проекта)**. 

### `Pyplot`-стиль(pyplot-style)

In [None]:
x = np.linspace(0, 2, 100)

plt.plot(x, x, label='linear')  # Plot some data on the (implicit) axes.
plt.plot(x, x**2, label='quadratic')  # etc.
plt.plot(x, x**3, label='cubic')
plt.xlabel('x label')
plt.ylabel('y label')
plt.title("Simple Plot")
plt.legend()

### ОО-стиль (OO-style)

In [None]:
x = np.linspace(0, 2, 100)

# Note that even in the OO-style, we use `.pyplot.figure` to create the figure.
fig, ax = plt.subplots()  # Create a figure and an axes.
ax.plot(x, x, label='linear')  # Plot some data on the axes.
ax.plot(x, x**2, label='quadratic')  # Plot more data on the axes...
ax.plot(x, x**3, label='cubic')  # ... and some more.
ax.set_xlabel('x label')  # Add an x-label to the axes.
ax.set_ylabel('y label')  # Add a y-label to the axes.
ax.set_title("Simple Plot")  # Add a title to the axes.
ax.legend()  # Add a legend.

Обычно приходится строить одни и те же графики снова и снова, но с разными наборами данных, что приводит к необходимости писать специализированные функции для построения графиков.

Рекомендуемая (официальная документация) сигнатура функции выглядит примерно так:

In [None]:
def my_plotter(ax, data1, data2, param_dict):
    """
    A helper function to make a graph

    Parameters
    ----------
    ax : Axes
        The axes to draw to

    data1 : array
       The x data

    data2 : array
       The y data

    param_dict : dict
       Dictionary of kwargs to pass to ax.plot

    Returns
    -------
    out : list
        list of artists added
    """
    out = ax.plot(data1, data2, **param_dict)
    return out

In [None]:
data1, data2, data3, data4 = np.random.randn(4, 100)
fig, ax = plt.subplots(1, 1)
my_plotter(ax, data1, data2, {'marker': 'x'})

или если нужно 2 графика:

In [None]:
fig, (ax1, ax2) = plt.subplots(1, 2)
my_plotter(ax1, data1, data2, {'marker': 'x'})
my_plotter(ax2, data3, data4, {'marker': 'o'})

Для этих простых примеров этот стиль кажется излишним, однако, как только графики становятся немного более сложными, это окупается.

## 3D-графики

## Рекомендации по использованию различных типов графиков