# Overview
* Vega-Altair는 declarative한, statistical visualization library in python.
* vega, vega-lite(js)에 기반을 한다.
  * vega에 의존성이 있기 때문에, 한글 인코딩 문제에서 자유롭고, 웹에 띄우기도 쉽다.
* declaring links between data columns and visual encoding channels, such as the x-axis, y-axis and color.
  * 다른 plot details는 handle automatically.

---

### 1. Data
* tidy-style dataset
* use pandas dataframes

In [1]:
import pandas as pd
data = pd.DataFrame({'a': list('CCCDDDEEE'),
                     'b': [2, 7, 4, 1, 2, 6, 8, 4, 7]})


### 2. Chart Object
* The fundamental object in Altair is the Chart, which takes a dataframe as a single argument

In [2]:
import altair as alt
chart = alt.Chart(data)

* mark_point로 점으로 시각화 가능
* but 위치에 대한 정보가 없기 때문에 한 점으로 표현

In [3]:
alt.Chart(data).mark_point()

* x축에 대한 위치 정보를 부여하면 다음과 같이 표현됨.

In [4]:
alt.Chart(data).mark_point().encode(
    x='a',
)

* key-value mapping between encoding channels (such as x, y, color, shape, size, etc.) to columns in the dataset, accessed by column name.
* df의 column에 따라 데이터 속성이 infer되는 듯.

In [5]:
alt.Chart(data).mark_point().encode(
    x='a',
    y='b'
)

### 3. Data Transformation: Aggregation
* To allow for more flexibility in how data are visualized, Altair has a built-in syntax for aggregation of data.

In [6]:
alt.Chart(data).mark_point().encode(
    x='a',
    y='average(b)'
)

* explicit하게 groupby하지 않고 altair의 built-in syntax를 활용하면, 좀 더 유연하게 시각화할 수 있다.

In [7]:
alt.Chart(data).mark_bar().encode(
    x='a',
    y='average(b)'
)

In [8]:
# vega 형태의 데이터로 export
chart = alt.Chart(data).mark_bar().encode(
    x='a',
    y='average(b)'
)

print(chart.to_json())

{
  "$schema": "https://vega.github.io/schema/vega-lite/v5.8.0.json",
  "config": {
    "view": {
      "continuousHeight": 300,
      "continuousWidth": 300
    }
  },
  "data": {
    "name": "data-347f1284ea3247c0f55cb966abbdd2d8"
  },
  "datasets": {
    "data-347f1284ea3247c0f55cb966abbdd2d8": [
      {
        "a": "C",
        "b": 2
      },
      {
        "a": "C",
        "b": 7
      },
      {
        "a": "C",
        "b": 4
      },
      {
        "a": "D",
        "b": 1
      },
      {
        "a": "D",
        "b": 2
      },
      {
        "a": "D",
        "b": 6
      },
      {
        "a": "E",
        "b": 8
      },
      {
        "a": "E",
        "b": 4
      },
      {
        "a": "E",
        "b": 7
      }
    ]
  },
  "encoding": {
    "x": {
      "field": "a",
      "type": "nominal"
    },
    "y": {
      "aggregate": "average",
      "field": "b",
      "type": "quantitative"
    }
  },
  "mark": {
    "type": "bar"
  }
}


* vega expression이 실제 json으로 다음과 같이 표현됨.

In [9]:
y = alt.Y('average(b):Q')
print(y.to_json())

{
  "aggregate": "average",
  "field": "b",
  "type": "quantitative"
}


In [10]:
y = alt.Y(field='b', type='quantitative', aggregate='average')
print(y.to_json())

{
  "aggregate": "average",
  "field": "b",
  "type": "quantitative"
}


### Custom Viz

In [11]:
alt.Chart(data).mark_bar(color='firebrick').encode(
    alt.Y('a').title('category'),
    alt.X('average(b)').title('avg(b) by category')
)