Анализ данных — это процесс извлечения информации из больших объемов данных, который помогает выявлять закономерности и тренды. Важным этапом является визуализация данных, позволяющая представить информацию в графиках и диаграммах, что делает её более доступной и понятной. Библиотека Bokeh для Python является мощным инструментом для создания интерактивных визуализаций без необходимости глубоких знаний в веб-разработке. Она предлагает широкий спектр графиков и настраиваемых параметров, позволяя адаптировать визуализации под конкретные нужды. Bokeh также поддерживает создание комплексных решений и дашбордов, объединяя несколько графиков и диаграмм, что делает анализ данных более информативным.
Для начала установим Bokeh

In [None]:
pip install bokeh

Линейные графики — это популярный инструмент для визуализации данных, который помогает отображать зависимость между двумя непрерывными переменными. Они позволяют легко выявлять тренды, паттерны и изменения в данных. В следующем шаге будет представлен процесс создания простого линейного графика с использованием библиотеки Bokeh, начиная с импорта необходимых модулей.

In [8]:
from bokeh.plotting import figure, output_file, show

Здесь мы импортируем figure для создания графической фигуры, output_file для указания имени файла для сохранения графика и show для отображения графика в браузере. Далее, мы можем создать фигуру и добавить на нее данные:

Создание графической фигуры:

In [None]:
p = figure(title='Пример линейного графика', x_axis_label='X-ось', y_axis_label='Y-ось')

Данные для графика:

In [None]:
x = [-3, -2, -1, 0, 1]
y = [9, 4, 1, 5, 3]

Добавление линии на график:

In [None]:
p.line(x, y, legend_label='Линия', line_width=2)

Отображение графика:

In [None]:
output_file('линейный_график.html')
show(p)

Теперь соберём весь код вместе:

In [None]:
from bokeh.plotting import figure, output_file, show
# Создание графической фигуры
p = figure(title='Пример линейного графика', x_axis_label='X-ось', y_axis_label='Y-ось')

# Данные для графика
x = [1, 2, 3, 4, 5]
y = [6, 7, 2, 4, 5]

# Добавление линии на график
p.line(x, y, legend_label='Линия', line_width=2)

# Отображение графика
output_file('линейный_график.html')
show(p)

Чтобы сделать график более информативным и читаемым, важно правильно настроить оси, метки и заголовки. Bokeh предоставляет обширный набор инструментов для настройки всех этих аспектов:

In [None]:
# Настройка осей и меток
p.xaxis.axis_label = 'Время'
p.yaxis.axis_label = 'Значение'

# Настройка заголовка
p.title.text = 'Пример линейного графика с настроенными осями и заголовком'
p.title.text_font_size = '16pt'

Здесь мы задаем метки для осей x и y с помощью axis_label, а также настраиваем заголовок с помощью title.text и title.text_font_size.

Чтобы сделать ваши графики более наглядными и разнообразными, вы можете использовать различные стили линий и маркеров. Bokeh предоставляет множество опций для настройки внешнего вида ваших графиков.

In [None]:
from bokeh.plotting import figure, output_file, show
# Создание графической фигуры
p = figure(title='Пример графика с разными стилями линий и маркеров')

# Данные для графика
x = [-5, -3, -2, -1, 6]
y1 = [5, 4, 3, 2, 1]
y2 = [8, 7, 6, 5, 3]

# Добавление линий с разными стилями
p.line(x, y1, legend_label='Линия 1', line_color='blue', line_width=2)
p.line(x, y2, legend_label='Линия 2', line_color='red', line_dash='dashed', line_width=2)

# Добавление маркеров
p.circle(x, y1, legend_label='Маркеры 1', fill_color='white', size=8)
p.square(x, y2, legend_label='Маркеры 2', fill_color='black', size=8)

# Отображение графика
output_file('стили_графика.html')
show(p)

Создание столбчатых диаграмм для анализа категориальных данных

Столбчатые диаграммы – это прекрасный инструмент для визуализации категориальных данных, таких как категории продуктов, регионы, временные периоды и многое другое. Они позволяют наглядно сравнивать значения разных категорий, что делает их незаменимыми для анализа и сравнения данных.

Чтобы создать столбчатую диаграмму с использованием Bokeh, мы можем использовать функцию vbar. Давайте рассмотрим пример:

In [None]:
from bokeh.plotting import figure, output_file, show

# Создание графической фигуры
p = figure(x_range=['A', 'B', 'C', 'D'], title='Пример столбчатой диаграммы', x_axis_label='Категории', y_axis_label='Значения')

# Данные для диаграммы
categories = ['A', 'B', 'C', 'D']
values = [10, 25, 15, 30]

# Добавление столбцов
p.vbar(x=categories, top=values, width=0.5, color='blue')

# Отображение графика
output_file('столбчатая_диаграмма.html')
show(p)

Здесь мы создаем графическую фигуру p и используем функцию vbar для добавления столбцов на диаграмму. Мы указываем значения для каждой категории с помощью аргумента top, а также задаем ширину столбцов и цвет.

Использование круговых диаграмм для отображения долей и процентных соотношений
Круговые диаграммы предоставляют нам способ визуализации долей и процентных соотношений между различными категориями. Они позволяют наглядно увидеть, какая доля от общего целого приходится на каждую категорию.

Для создания круговой диаграммы в Bokeh, нам нужно использовать метод wedge. Рассмотрим пример создания круговой диаграммы:

In [None]:
from math import pi
from bokeh.plotting import figure, output_file, show
from bokeh.transform import cumsum
import pandas as pd

# Данные
data = pd.Series([0.25, 0.15, 0.3, 0.2], index=['A', 'B', 'C', 'D'])

# Преобразование данных для круговой диаграммы
data = data.reset_index(name='value').rename(columns={'index': 'category'})
data['angle'] = data['value']/data['value'].sum() * 2*pi
data['color'] = ['#66c2a5', '#fc8d62', '#8da0cb', '#e78ac3']

# Создание графической фигуры
p = figure(plot_height=350, title='Круговая диаграмма', toolbar_location=None,
           tools="hover", tooltips="@category: @value", x_range=(-0.5, 1.0))

# Добавление круговой диаграммы
p.wedge(x=0, y=1, radius=0.4,
        start_angle=cumsum('angle', include_zero=True), end_angle=cumsum('angle'),
        line_color="white", fill_color='color', legend_field='category', source=data)

# Отображение графика
output_file('круговая_диаграмма.html')
show(p)

В данном примере мы используем библиотеку pandas для удобной работы с данными. Мы задаем доли для каждой категории и преобразуем данные в формат, понятный для круговой диаграммы. Затем мы создаем графическую фигуру, используя метод wedge для добавления круговой диаграммы.

Гистограммы – это графический способ представления распределения данных по различным интервалам. Они помогают нам понять, как данные распределены по значению и выявить наличие аномалий или особенностей в данных.

Для создания гистограммы в Bokeh, мы используем метод quad, который позволяет нам рисовать прямоугольники, представляющие интервалы данных. Рассмотрим пример создания гистограммы:

In [None]:
from math import pi
from bokeh.plotting import figure, output_file, show
from bokeh.transform import cumsum
import pandas as pd

# Данные
data = pd.Series([0.25, 0.15, 0.3, 0.2], index=['A', 'B', 'C', 'D'])

# Преобразование данных для круговой диаграммы
data = data.reset_index(name='value').rename(columns={'index': 'category'})
data['angle'] = data['value']/data['value'].sum() * 2*pi
data['color'] = ['#66c2a5', '#fc8d62', '#8da0cb', '#e78ac3']

# Создание графической фигуры
p = figure(height=350, title='Круговая диаграмма', toolbar_location=None,
           tools="hover", tooltips="@category: @value", x_range=(-1, 1))

# Добавление круговой диаграммы
p.annular_wedge(x=0, y=1, inner_radius=0.3, outer_radius=0.7,
                start_angle=cumsum('angle', include_zero=True), end_angle=cumsum('angle'),
                line_color="white", fill_color='color', legend_field='category', source=data)

# Отображение графика
output_file('круговая_диаграмма.html')
show(p)

Работа с географическими данными
Для добавления географических элементов на карту, мы можем использовать специальные функции и инструменты Bokeh:

In [None]:
from bokeh.plotting import figure, output_file, show
from bokeh.tile_providers import get_provider
# Данные
latitudes = [40.71, 34.05, 51.51]
longitudes = [-74.01, -118.24, -0.13]
# Создание графической фигуры с тайловым фоном
tile_provider = get_provider('CARTODBPOSITRON')
p = figure(x_range=(-2000000, 6000000), y_range=(-1000000, 7000000),
x_axis_type='mercator', y_axis_type='mercator', title='Маркеры на карте')
p.add_tile(tile_provider)
# Добавление маркеров на карту
p.circle(x=longitudes, y=latitudes, size=10, color='red')
# Отображение карты с маркерами
output_file('карта_с_маркерами.html')
show(p)

Заключение
Bokeh может стать незаменимой вещью для людей, жаждущих визуализировать свои данные в виде диаграмм, графиков, гистограмм и т.д.
Данная очень простая библиотека очень поможет нам в создании высококачественных графических решений, углубляющих наше понимание данных.