# Altair 소개

[Altair](https://altair-viz.github.io/)는 Python에서 사용할 수 있는 선언형 통계 시각화 라이브러리입니다. Altair는 빠르게 다양한 통계적 시각화를 그릴 수 있는 강력하고 간결한 문법을 사용합니다. 

*선언형* 라이브러리란, *데이터*, *시각 기호 (Graphical Mark)*, *인코딩 채널 (Encoding Channel)* 등에 대해 *무엇을* 시각화 하고 싶은지에 대한 고수준 표현을 할 수 있다는 것을 의미합니다. 이는 다시 말하면, 반복문과 그리기 함수등을 통해 *어떻게* 시각화를 작성할 것인지 적지 않아도 데이터 필드 및 인코딩 채널 (예를 들어 x축, y축, 색깔 등) 간의 연결등을 선언할 수 있다는 것입니다. 나머지 시각화의 세부 사항은 자동으로 채워 집니다. 이런 선언형 시각화 아이디어를 바탕으로 간결한 문법을 사용하여 다양한 시각화를 쉽게 그릴 수 있습니다. 

In [None]:
!pip install altair pandas vega-datasets

## 라이러리 불러오기

In [None]:
import pandas as pd
import altair as alt
from vega_datasets import data

## 데이터

In [None]:
cars = data.cars()             
cars.head() 

### 날씨 데이터

In [None]:
df = pd.DataFrame({
    'city': ['Seattle', 'Seattle', 'Seattle', 'New York', 'New York', 'New York', 'Chicago', 'Chicago', 'Chicago'],
    'month': ['Apr', 'Aug', 'Dec', 'Apr', 'Aug', 'Dec', 'Apr', 'Aug', 'Dec'],
    'precip': [2.68, 0.87, 5.31, 3.94, 4.13, 3.58, 3.62, 3.98, 2.56]
})

df

## 차트 객체

In [None]:
chart = alt.Chart(df)

## 시각화 기호 (Mark)와 인코딩 (Encodings)

In [None]:
alt.Chart(df).mark_point()

데이터를 encoding할 위치로 `x`, `y`, `color`, `shape` 등 다양한 위치를 지정할 수 있습니다

In [None]:
alt.Chart(df).mark_point().encode(
    alt.X('precip'),
    alt.Y('city')
)

데이터의 종류를 명시적으로 지정할 수도 있습니다. (Q, N, O, T)

In [None]:
alt.Chart(df).mark_point().encode(
    alt.X('precip:N'),
    alt.Y('city:N')
)

## 데이터 변환: 집계 함수

평균(`average`), 개수(`count`), 최소(`min`), 최대(`max`) 등 다양한 집계 함수를 사용하여 데이터를 변환할 수 있습니다. 

In [None]:
alt.Chart(df).mark_point().encode(
    x='average(precip)',
    y='city'
)

## 시각화 기호 바꿔보기

In [None]:
alt.Chart(df).mark_bar().encode(
    x='average(precip)',
    y='city'
)

In [None]:
alt.Chart(df).mark_bar().encode(
    x='city',
    y='average(precip)'
)

## 다중 뷰 시각화

여러 시각화를 중첩하거나 병치하여 사용할 수 있습니다.

중첩은 `+`, 수평 병치는 `|`, 수직 병치는 `&` 기호를 사용합니다.

In [None]:
alt.Chart(cars).mark_line().encode(
    alt.X('Year'),
    alt.Y('average(Miles_per_Gallon)')
)

In [None]:
line = alt.Chart(cars).mark_line().encode(
    alt.X('Year'),
    alt.Y('average(Miles_per_Gallon)')
)

point = alt.Chart(cars).mark_circle().encode(
    alt.X('Year'),
    alt.Y('average(Miles_per_Gallon)')
)

line + point

In [None]:
mpg = alt.Chart(cars).mark_line().encode(
    alt.X('Year'),
    alt.Y('average(Miles_per_Gallon)')
)

mpg + mpg.mark_circle()

In [None]:
hp = alt.Chart(cars).mark_line().encode(
    alt.X('Year'),
    alt.Y('average(Horsepower)')
)

(mpg + mpg.mark_circle()) | (hp + hp.mark_circle())

## 상호작용

In [None]:
alt.Chart(cars).mark_point().encode(
    x='Horsepower',
    y='Miles_per_Gallon',
    color='Origin',
).interactive()

In [None]:
alt.Chart(cars).mark_point().encode(
    x='Horsepower',
    y='Miles_per_Gallon',
    color='Origin',
    tooltip=['Name', 'Origin']
).interactive()