# Guía de Altair

In [1]:
import pandas as pd
import numpy as np
import altair as alt
import warnings
warnings.filterwarnings('ignore')

Sintaxis básica:
- Ejemplo básico: Cargar datos e inicializar `Chart`.
- Agregar Mark: `mark_point()` para un scatter plot.
- Encoding: Uso de `encode` para asignar ejes `x` y `y`

In [2]:
import altair as alt
from vega_datasets import data

source = data.cars()
chart = alt.Chart(source).mark_point().encode(
    x='Horsepower',
    y='Miles_per_Gallon'
)
chart

In [None]:
cars = data.cars()
cars.head()

NameError: name 'cars' is not defined

In [None]:
cars = data.cars()

# make the chart
alt.Chart(cars).mark_point().encode(
    x='Horsepower',
    y='Miles_per_Gallon',
    color='Origin',
).interactive()

Tipos de mark:
- `mark_bar`: Gráficos de barras.
- `mark_line`: Gráficos de líneas.
- `mark_area`: Gráficos de área.
- `mark_circle`, `mark_square`, `mark_point`: Gráficos de dispersión.

## Guía de los Marks

### Ejemplo 1. Gráfico de Barras
Podemos crear un gráfico de barras que muestre el número promedio de caballos de fuerza (`Horsepower`) por año (`Year`)

In [None]:
cars = data.cars()

bar_chart = alt.Chart(cars).mark_bar().encode(
    x='Year:T',
    y='mean(Horsepower):Q',
    tooltip=['Year:T', 'mean(Horsepower):Q']
).properties(
    title='Promedio de Caballos de Fuerza por Año'
)
bar_chart

### Ejemplo 2: Gráfico de Líneas (`mark_line`)
Para observar la tendencia de la economía de combustible (`Miles_per_Gallon`) a lo largo de los años, podemos crear un gráfico de líneas.

In [None]:
line_chart = alt.Chart(cars).mark_line().encode(
    x='Year:T',
    y='mean(Miles_per_Gallon):Q',
    tooltip=['Year:T', 'mean(Miles_per_Gallon):Q']
).properties(
    title='Tendencia del Consumo de Combustible (MPG) a lo largo de los años'
)
line_chart

### Ejemplo 3: `mark_area`
En este ejemplo, usaremos `mark_area` para mostrar la distribución de `Horsepower` para cada `Origin`

In [None]:
# Gráfico de área - Distribución de Potencia por Origen
area_chart = alt.Chart(cars).mark_area(opacity=0.5).encode(
    x=alt.X('Horsepower', bin=alt.Bin(maxbins=30), title='Potencia'),
    y=alt.Y('count()', stack=None, title='Conteo de Autos'),
    color='Origin'
).properties(
    title='Distribución de Potencia por Origen'
)
area_chart.interactive()


### Ejemplo 4: `mark_circle`
Usaremos `mark_circle` para mostrar la relación entre `Horsepower` y `Miles_per_Gallon`, con el tamaño de cada círculo representando el peso (`Weight_in_lbs`) de los autos

In [None]:
# Gráfico de círculos - Relación entre Potencia y Millas por Galón
circle_chart = alt.Chart(cars).mark_circle().encode(
    x=alt.X('Horsepower', title='Potencia'),
    y=alt.Y('Miles_per_Gallon', title='Millas por Galón'),
    size=alt.Size('Weight_in_lbs', title='Peso (lbs)'),
    color='Origin'
).properties(
    title='Relación entre Potencia y Eficiencia de Combustible'
)
circle_chart.interactive()


### Ejemplo 5: `mark_square`
Finalmente, usaremos `mark_square` para visualizar el peso promedio de los autos (`Weight_in_lbs`) según el `Origin` y el año de fabricación (`Year`).

In [None]:
# Gráfico de cuadrados - Peso promedio de los autos por Origen y Año
square_chart = alt.Chart(cars).mark_square().encode(
    x=alt.X('Year:T', title='Año'),
    y=alt.Y('Origin', title='Origen'),
    color=alt.Color('mean(Weight_in_lbs)', scale=alt.Scale(scheme='greens'), title='Peso Promedio (lbs)'),
    size=alt.Size('mean(Weight_in_lbs)', title='Peso Promedio (lbs)')
).properties(
    title='Peso Promedio de los Autos por Origen y Año'
)
square_chart

## Ejemplo de Interactividad

**Herramientas Interactivas:**
- `selection_interval`: Permite seleccionar un rango en el gráfico.
- `selection_single`: Permite seleccionar un punto específico
<br>

**Ejemplo de Interactividad:**
+ Mostrar cómo se utiliza un `selection_interval` para permitir el zoom en un gráfico.

In [None]:
# Crear selección de intervalo
interval = alt.selection_interval()

# Gráfico de dispersión con selección de intervalo
scatter_chart = alt.Chart(cars).mark_circle().encode(
    x=alt.X('Horsepower', title='Potencia'),
    y=alt.Y('Miles_per_Gallon', title='Millas por Galón'),
    color=alt.condition(interval, 'Origin', alt.value('lightgray')),
    tooltip=['Name', 'Horsepower', 'Miles_per_Gallon', 'Origin']
).add_selection(
    interval
).properties(
    title='Relación entre Potencia y Eficiencia de Combustible con Selección de Intervalo'
)

scatter_chart

In [None]:
# Crear selección simple
single = alt.selection_single(fields=['Origin'], bind='legend')

# Gráfico de dispersión con selección simple
scatter_chart_single = alt.Chart(cars).mark_circle().encode(
    x=alt.X('Horsepower', title='Potencia'),
    y=alt.Y('Miles_per_Gallon', title='Millas por Galón'),
    color=alt.condition(single, 'Origin', alt.value('lightgray')),
    tooltip=['Name', 'Horsepower', 'Miles_per_Gallon', 'Origin']
).add_selection(
    single
).properties(
    title='Relación entre Potencia y Eficiencia de Combustible con Selección de Origen'
)

# Tabla de detalles de autos filtrados por el origen seleccionado
table = alt.Chart(cars).mark_text(align='left', dx=5).encode(
    y=alt.Y('row_number:O', axis=None),  # Crear una fila sin el eje y visible
    text='Name:N',
    color=alt.condition(single, 'Origin', alt.value('lightgray'))
).transform_window(
    row_number='rank()'
).transform_filter(
    single
).properties(
    width=300,
    title='Autos del Origen Seleccionado'
)

# Visualizar ambos gráficos juntos
scatter_chart_single #| table


## Especificación de detalles gráficos

In [None]:
chart = alt.Chart(source).mark_bar().encode(
    x='Cylinders',
    y='mean(Miles_per_Gallon)',
    color='Cylinders:O'
)
chart

In [None]:
source = data.cars()
chart = alt.Chart(source).mark_bar().encode(
    x='Cylinders:O',
    y='mean_mpg:Q'
).transform_aggregate(
    mean_mpg='mean(Miles_per_Gallon)',
    groupby=['Cylinders']
).properties(
    title='Promedio de Millas por Galón por Número de Cilindros'
)

chart

## Gráfico Interactivo de Tendencias de Ventas

**Objetivo del Ejemplo:** Crear un gráfico de líneas interactivo que muestre tendencias de ventas en diferentes regiones.

1. Se generan datos de forma aleatoria

In [None]:
data = pd.DataFrame({
    'date': pd.date_range(start='2023-01-01', periods=100, freq='W'),
    'sales': np.random.randint(100, 1000, 100),
    'region': np.random.choice(['North', 'South', 'East', 'West'], 100)
})

2. Crear selección interactiva:

In [None]:
selection = alt.selection_interval(encodings=['x'])

3. Crear vista de contexto (gráfico superior para selección de rango):

In [None]:
context_chart = alt.Chart(data).mark_line().encode(
    x='date:T',
    y='sales:Q',
    color='region:N'
).properties(
    width=600,
    height=100
).add_selection(
    selection  # Agrega la selección al gráfico de contexto
)

4. Crear vista principal filtrada (gráfico inferior que responde a la selección):

In [None]:
detail_chart = alt.Chart(data).mark_line().encode(
    x='date:T',
    y='sales:Q',
    color='region:N'
).transform_filter(
    selection  # Filtra los datos según el rango seleccionado
).properties(
    width=600,
    height=300
)

5. interactive_chart = context_chart & detail_chart  # Muestra ambos gráficos en una sola visualización


In [None]:
interactive_chart = context_chart & detail_chart  # Muestra ambos gráficos en una sola visualización

6. Mostrar el gráfico interactivo

In [None]:
interactive_chart