# Конфигурация графика

Altair предоставляется различные способы изменения внешнего вида графика. Мы не будем рассматривать все возможные вариант, но рассмотрим какие настройки, в принципе, существуют.

В общем случае, внешний вид графика определяется следующими составляющими (в порядке возрастания приоритета).

1. **Настройка верхнего уровня**. На верхнем уровне настройки графиков Altair, можно определить настройки конфигурации, применимые к каждой панели и слою графика.

2. **Настройки локального уровня**. Настройки верхнего уровня могут быть локально переопределены

3. **Значения кодирования**. Если значения кодирования заданы, они имеют высший приоритет и переопределяют остальные настройки.

Рассмотрим пример.

In [1]:
import altair as alt

In [2]:
import numpy as np
import pandas as pd
np.random.seed(42)

data = pd.DataFrame(np.random.randn(100, 2), columns=['x', 'y'])

In [3]:
data

Unnamed: 0,x,y
0,0.496714,-0.138264
1,0.647689,1.523030
2,-0.234153,-0.234137
3,1.579213,0.767435
4,-0.469474,0.542560
...,...,...
95,-0.446515,0.856399
96,0.214094,-1.245739
97,0.173181,0.385317
98,-0.883857,0.153725


## Пример 1: Настройка свойств маркеров

Предположим, что мы хотим определить цвет маркеров в диаграмме рассеяния. Рассмотрим все три варианта для этого. Используем набор данных с нормально распределёнными точками:

In [4]:
alt.Chart(data).mark_point().encode(
    x='x:Q',
    y='y:Q'
)

### Настройки верхнего уровня

На верхнем уровне у Altair есть метод ``configure_mark()``, который позволяет настроить множество различных параметров меток, а также свойство ``configure_point()`` которое определяет свойства именно точек.

Ниже приведены возможные варианты настроек из документации:

In [5]:
alt.Chart.configure_point?

Эти настройки высокого уровня могут быть интерпретированы как тема графика, они используются как настройки по умолчанию для визуальных отображений всех элементов графика.
Используем ``configure_point`` для задания некоторых свойств точек:

In [9]:
alt.Chart(data).mark_point().encode(
    x='x:Q',
    y='y:Q'
).configure_point(
    size=150,
    color='red',
    filled=True
)

## Локальные настройки маркеров

В фукнции ``mark_point()`` можно передать локальные настройки, которые перепишут настройки верхнего уровня.
Аргументы у этой функции те же, что и для ``configure_mark``.

In [10]:
alt.Chart(data).mark_point(color='green', filled=False).encode(
    x='x:Q',
    y='y:Q'
).configure_point(
    size=200,
    color='red',
    filled=True
)

Обратите внимание, что настройки "color" и "fill" переписаны локальными, а "size" остался прежним.

## Настройки кодирования

И, наконец, высочайший приоритет настроек у кодирования. Зададим цвет равный "steelblue":

In [13]:
alt.Chart(data).mark_point(color='green', filled=False).encode(
    x='x:Q',
    y='y:Q',
    color=alt.value('steelblue')
).configure_point(
    size=200,
    color='red',
    filled=True
)

## Пример 2: Подписи к осям и заголовки

Подписи к осям и заголовок графика устанавливаются автоматически на основе исходных данных, но иногда мы хотим поменять их.
Например, визуализируем гистограмму данных из примера выше:

In [14]:
alt.Chart(data).mark_bar().encode(
    x=alt.X('x', bin=True),
    y=alt.Y('count()')
)

Можно вручную задать подписи осей с использованием аргумента ``title``:

In [15]:
alt.Chart(data).mark_bar().encode(
    x=alt.X('x', bin=True, title='binned x values'),
    y=alt.Y('count()', title='counts in x')
)

Аналогично, можно задать свойство ``title`` для всего графика:

In [16]:
alt.Chart(data).mark_bar().encode(
    x=alt.X('x', bin=True, title='binned x values'),
    y=alt.Y('count()', title='counts in x')
).properties(
    title='A histogram'
)

## Пример 3: Свойства осей

Для задания свойств осей (в том числе линий сетки), можно использовать аргумент ``axis``.

In [17]:
alt.Chart(data).mark_bar().encode(
    x=alt.X('x', bin=True, axis=alt.Axis(labelAngle=45)),
    y=alt.Y('count()', axis=alt.Axis(labels=False, ticks=False, title=None))
)

Некоторые из этих значений могут быть заданы и на верхнем уровне настрок, если есть необходимость применить их к графику в целом, например:

In [18]:
alt.Chart(data).mark_bar().encode(
    x=alt.X('x', bin=True),
    y=alt.Y('count()', axis=alt.Axis(labels=False, ticks=False, title=None))
).configure_axisX(
    labelAngle=45
)

## Пример 4: Параметры шкалы и пределы осей

Каждое кодирование также содержит параметр ``scale``, который позволяет задать такие параметры как пределы осей и другие свойства шкалы.

In [19]:
alt.Chart(data).mark_point().encode(
    x=alt.X('x:Q', scale=alt.Scale(domain=[-5, 5])),
    y=alt.Y('y:Q', scale=alt.Scale(domain=[-5, 5])),
)

Заметим, что если уменьшить масштаб до размеров, меньших чем реальные пределы значений, по умолчанию данные выйдут за пределы шкалы:

In [20]:
alt.Chart(data).mark_point().encode(
    x=alt.X('x:Q', scale=alt.Scale(domain=[-3, 1])),
    y=alt.Y('y:Q', scale=alt.Scale(domain=[-3, 1])),
)

Иногда полезно не скрывать такие данные, чтобы не упустить случайно точки данных.

Если вы всё же хотите ограничить визуализируемые данные пределами шкалы, можно задать параметр ``clip``:

In [22]:
alt.Chart(data).mark_point(clip=True).encode(
    x=alt.X('x:Q', scale=alt.Scale(domain=[-3, 1])),
    y=alt.Y('y:Q', scale=alt.Scale(domain=[-3, 1])),
)

Вместо этого можно использовать параметр "clamp", чтобы ограничить данные шкалой, сохраняя их видимыми даже за пределами шкалы:

In [21]:
alt.Chart(data).mark_point().encode(
    x=alt.X('x:Q', scale=alt.Scale(domain=[-3, 1], clamp=True)),
    y=alt.Y('y:Q', scale=alt.Scale(domain=[-3, 1], clamp=True)),
).interactive()

## Пример 5: Цветовые шкалы

Иногда полезно вручную задать цветовую шкалу

In [23]:
from vega_datasets import data
weather = data.seattle_weather()
weather.head()

Unnamed: 0,date,precipitation,temp_max,temp_min,wind,weather
0,2012-01-01,0.0,12.8,5.0,4.7,drizzle
1,2012-01-02,10.9,10.6,2.8,4.5,rain
2,2012-01-03,0.8,11.7,7.2,2.3,rain
3,2012-01-04,20.3,12.2,5.6,4.7,rain
4,2012-01-05,1.3,8.9,2.8,6.1,rain


In [24]:
alt.Chart(weather).mark_point().encode(
    x='date:T',
    y='temp_max:Q',
    color='weather:N'
)

  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


Можно изменить цветовую схему, используя свойство шкалы, либо используя одну из [именованных цветовых схем Vega](https://vega.github.io/vega/docs/schemes/#reference):

In [27]:
alt.Chart(weather).mark_point().encode(
    x='date:T',
    y='temp_max:Q',
    color=alt.Color('weather:N', scale=alt.Scale(scheme="dark2"))
)

  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


Либо можно создать свою цветовую шкалу, задав цветовой домен и пределы:

In [28]:
colorscale = alt.Scale(domain=['sun', 'fog', 'drizzle', 'rain', 'snow'],
                       range=['goldenrod', 'gray', 'lightblue', 'steelblue', 'midnightblue'])

alt.Chart(weather).mark_point().encode(
    x='date:T',
    y='temp_max:Q',
    color=alt.Color('weather:N', scale=colorscale)
)

  col = df[col_name].apply(to_list_if_array, convert_dtype=False)


## Упражнение: Настройка графиков

Возьмите понравившиеся графики из предыдущего блокнота и настройте для них:

- метки,
- заголовок графика и подписи осей,
- пределы осей x и y.

In [29]:
population = data.population()

In [47]:
alt.Chart(population).mark_bar().encode(
    x=alt.X('year:O', title='Год'),
    y=alt.Y('sum(people):Q', title='Кол-во человек'),
    color=alt.Color('men_women:N', title='', scale=alt.Scale(domain=['Men', 'Women'], range=['skyblue', 'pink']))
).transform_calculate(
    men_women='datum.sex == 1 ? "Men" : "Women"'
).configure_axisX(
    labelAngle=45
)


In [59]:
weather

Unnamed: 0,date,precipitation,temp_max,temp_min,wind,weather
0,2012-01-01,0.0,12.8,5.0,4.7,drizzle
1,2012-01-02,10.9,10.6,2.8,4.5,rain
2,2012-01-03,0.8,11.7,7.2,2.3,rain
3,2012-01-04,20.3,12.2,5.6,4.7,rain
4,2012-01-05,1.3,8.9,2.8,6.1,rain
...,...,...,...,...,...,...
1456,2015-12-27,8.6,4.4,1.7,2.9,fog
1457,2015-12-28,1.5,5.0,1.7,1.3,fog
1458,2015-12-29,0.0,7.2,0.6,2.6,fog
1459,2015-12-30,0.0,5.6,-1.0,3.4,sun


Задам дипазон по дате с 2012-01-01 по 2014-01-01, а так же в данном случае еще нужен параметр clip

In [68]:
alt.Chart(weather).mark_rule(clip=True).encode(
    x=alt.X('date:T', title='Дата', scale=alt.Scale(domain=['2012-01-01', '2014-01-01'])),
    y=alt.Y('temp_min:Q', title='Температура'),
    y2='temp_max:Q',
    color=alt.Color('weather:N', title='Погода')
)

  col = df[col_name].apply(to_list_if_array, convert_dtype=False)
