# Tableau-alike

Do you remember?
![Sales splitted by Category Graph](https://github.com/Data-Viz-Labs/python-programmatic-dataviz-with-bokeh/blob/main/assets/salesCatSplitted.png?raw=true)


In [None]:
!pip freeze | grep -e bokeh -e pandas -e openpyxl

bokeh==3.6.2
geopandas==1.0.1
openpyxl==3.1.5
pandas==2.2.2
pandas-datareader==0.10.0
pandas-gbq==0.26.1
pandas-stubs==2.2.2.240909
sklearn-pandas==2.2.0


In [None]:
# Instalamos las dependencias necesarias
!pip install bokeh pandas openpyxl



In [25]:
# Importamos las bibliotecas necesarias
import pandas as pd
from bokeh.plotting import figure, show
from bokeh.io import output_notebook
from bokeh.models import ColumnDataSource, Label, Legend
from bokeh.models import NumeralTickFormatter
from bokeh.palettes import Spectral6
from bokeh.transform import dodge



In [None]:
# Configuramos Bokeh para mostrar en el notebook
output_notebook()

✋✋✋✋✋✋✋✋✋✋✋✋✋✋✋✋

BEFORE RUN THE NEXT CELL, please upload the dataset to files section or update the path

✋✋✋✋✋✋✋✋✋✋✋✋✋✋✋✋

In [None]:
# Leemos el archivo Excel (RECUERDA CARGARLO EN EL FILESYSTEM DE COLLAB)
df = pd.read_excel('/content/Sample - Superstore.xls')

# Preparamos los datos agrupados por año y categoría
df['Year'] = pd.DatetimeIndex(df['Order Date']).year
sales_by_category = df.pivot_table(
    values='Sales',
    index='Year',
    columns='Category',
    aggfunc='sum'
).reset_index()

In [45]:
# Creamos tres figuras separadas, una para cada categoría
figures = []
categories = ['Furniture', 'Office Supplies', 'Technology']

for category in categories:
    p = figure(
        height=250,
        width=800,
        title=category,
        x_axis_label='Año' if category == 'Technology' else None,
        y_axis_label='Sales',
        y_range=(0, 350000),  # Aumentamos el límite superior
    )

    # Configuración del eje X para mostrar solo años enteros
    p.xaxis.ticker = sales_by_category['Year'].unique()  # Solo años existentes
    p.xaxis.major_label_orientation = 0  # Horizontal

    # Configuración del eje Y para formato 100K, 200K, etc.
    p.yaxis.formatter = NumeralTickFormatter(format="0,0")  # Formato con comas
    p.yaxis.major_label_overrides = {
        100000: '100K',
        100000: '150K',
        200000: '200K',
        250000: '250K',
        300000: '300K',
        350000: '350K'
    }

    source = ColumnDataSource(sales_by_category)

    # Dibujamos la línea
    p.line(
        x='Year',
        y=category,
        line_width=2,
        color='#1f77b4',
        source=source
    )

    # Añadimos los puntos
    p.scatter(
        x='Year',
        y=category,
        size=8,
        color='#1f77b4',
        source=source
    )

    # Añadimos las etiquetas de valores usando Labels
    for i, row in sales_by_category.iterrows():
        label = Label(
            x=row['Year'],
            y=row[category],
            text=f"{int(row[category]):,}",
            text_align='center',
            text_baseline='bottom',
            y_offset=10
        )
        p.add_layout(label)

    # Configuración adicional
    p.grid.grid_line_color = 'lightgray'
    p.xgrid.grid_line_color = None
    p.x_range.range_padding = 0.1

    figures.append(p)

# Mostramos los tres gráficos en una columna
show(column(figures[0], figures[1], figures[2]))

## An now... try one of these:
![Challenge](https://github.com/Data-Viz-Labs/python-programmatic-dataviz-with-bokeh/blob/main/assets/challenge.png?raw=true)
