# Gráficos básicos

Información importante:
* Documentación oficial de Altair: [altair-viz.github.io](https://altair-viz.github.io/index.html)
* Repositorio en GitHub: [tacosdedatos/cf-dataviz-efectiva-2024](https://github.com/tacosdedatos/cf-dataviz-efectiva-2024)

* La manera de codificar (encoding) datos en Altair
* Objetos en Altair
  - Ejes o _axes_
  - Escalas o _scales_
  - Marcas gráficas o _marks_
* Configuraciones
  - de elementos
  - de gráficos

In [4]:
import altair as alt
import pandas as pd 
from vega_datasets import data as vega_data
data = vega_data.gapminder()

In [6]:
data.head()

Unnamed: 0,year,country,cluster,pop,life_expect,fertility
0,1955,Afghanistan,0,8891209,30.332,7.7
1,1960,Afghanistan,0,9829450,31.997,7.7
2,1965,Afghanistan,0,10997885,34.02,7.7
3,1970,Afghanistan,0,12430623,36.088,7.7
4,1975,Afghanistan,0,14132019,38.438,7.7


In [16]:
data['year_datetime'] = pd.to_datetime(data['year'], format='%Y')

In [17]:
data.head()

Unnamed: 0,year,country,cluster,pop,life_expect,fertility,year_datetime
0,1955,Afghanistan,0,8891209,30.332,7.7,1955-01-01
1,1960,Afghanistan,0,9829450,31.997,7.7,1960-01-01
2,1965,Afghanistan,0,10997885,34.02,7.7,1965-01-01
3,1970,Afghanistan,0,12430623,36.088,7.7,1970-01-01
4,1975,Afghanistan,0,14132019,38.438,7.7,1975-01-01


Cuantitativo (Q): Representa valores numéricos que pueden ser medidos y ordenados. Por ejemplo, valores como temperatura, ingresos o edad.

Nominal (N): Representa valores categóricos discretos que no tienen un orden inherente. Por ejemplo, valores como género, ciudad o tipo de producto.

Ordinal (O): Representa valores categóricos discretos que tienen un orden inherente. Por ejemplo, valores como clasificación de calidad (alto, medio, bajo) o niveles de educación (primaria, secundaria, universitaria).

Temporal (T): Representa valores de fecha y hora. Por ejemplo, fechas, horas o marcas de tiempo.

## Barras

In [35]:
filtro_pais = data['country'] == 'Argentina'

In [36]:
data_filtrada = data[filtro_pais]

In [48]:
data_filtrada

Unnamed: 0,year,country,cluster,pop,life_expect,fertility,year_datetime
11,1955,Argentina,3,18927821,64.399,3.1265,1955-01-01
12,1960,Argentina,3,20616009,65.142,3.0895,1960-01-01
13,1965,Argentina,3,22283100,65.634,3.049,1965-01-01
14,1970,Argentina,3,23962313,67.065,3.1455,1970-01-01
15,1975,Argentina,3,26081880,68.481,3.44,1975-01-01
16,1980,Argentina,3,28369799,69.942,3.15,1980-01-01
17,1985,Argentina,3,30675059,70.774,3.053,1985-01-01
18,1990,Argentina,3,33022202,71.868,2.9,1990-01-01
19,1995,Argentina,3,35311049,73.275,2.63,1995-01-01
20,2000,Argentina,3,37497728,74.34,2.35,2000-01-01


In [38]:
# Multiples records por año
data[data['year'] == 1955]

Unnamed: 0,year,country,cluster,pop,life_expect,fertility,year_datetime
0,1955,Afghanistan,0,8891209,30.332,7.7000,1955-01-01
11,1955,Argentina,3,18927821,64.399,3.1265,1955-01-01
22,1955,Aruba,3,53865,64.381,5.1500,1955-01-01
33,1955,Australia,4,9277087,70.330,3.4060,1955-01-01
44,1955,Austria,1,6946885,67.480,2.5200,1955-01-01
...,...,...,...,...,...,...,...
638,1955,Switzerland,1,4980000,70.560,2.3400,1955-01-01
649,1955,Turkey,1,24144571,48.079,6.6000,1955-01-01
660,1955,United Kingdom,1,50946000,70.420,2.4900,1955-01-01
671,1955,United States,3,165931000,69.490,3.7060,1955-01-01


In [52]:
barras = alt.Chart(data_filtrada).mark_bar().encode(
    x = 'year:O',
    y = 'pop',
)

In [69]:
linea = alt.Chart(data_filtrada).mark_line(stroke='#c7c7c7').encode(
    x = 'year:O',
    y = 'life_expect',
)

In [76]:
alt.vconcat(barras, linea)

In [77]:
alt.layer(barras, linea).resolve_scale(y='independent')

In [None]:
alt.Chart(data_filtrada).mark_bar().encode(
    x = 'year:O',
    y = 'pop',
)

## Barras+

In [116]:
pais_seleccionado = 'Argentina'

In [117]:
filtro_pais_2 = data['country'] == pais_seleccionado

In [118]:
datos_por_pais = data[filtro_pais_2]

In [119]:
alt.Chart(datos_por_pais).mark_bar().encode(
    x = alt.X('year:O', axis = alt.Axis(title='', labelAngle=0)),
    y = alt.Y('pop', axis = alt.Axis(title = '')),
).properties(
    title=f'Población de {pais_seleccionado}',
    width=800
)

In [122]:
def crear_grafico(pais = 'Argentina'):
    filtro_pais_2 = data['country'] == pais
    datos_por_pais = data[filtro_pais_2]
    grafico_final = alt.Chart(datos_por_pais).mark_bar().encode(
        x = alt.X('year:O', axis = alt.Axis(title='', labelAngle=0)),
        y = alt.Y('pop', axis = alt.Axis(title = '')),
    ).properties(
        title=f'Población de {pais}',
        width=800
    )
    return grafico_final

In [123]:
crear_grafico('Mexico')

In [124]:
crear_grafico('Canada')