# Interactive Visualization Lab - Superstore Dataset

Completa el siguiente conjunto de ejercicios para consolidar tus conocimientos sobre la visualización interactiva utilizando Plotly.

## 0. Leer los datos.

In [None]:
import pandas as pd
from plotly.offline import iplot

In [None]:
df = pd.read_excel('data/Sample - Superstore.xlsx')
df.head()

In [None]:
df.info()

In [None]:
df.describe()

## 1. Crea un gráfico de barras interactivo que muestre las ventas totales por Estado en 2014.

In [None]:
serie_1 = df[df['Order Date'].dt.year == 2014].groupby('State')['Sales'].sum().sort_values(ascending=False)
serie_1

In [None]:
import plotly.graph_objs as go

In [None]:
trace1 = {
    'x': serie_1.index,
    'y': serie_1.values,
    'type' : 'bar'
}

data = [trace1]

layout = {
    'xaxis': {"title":"States"},
    'title': "Total sales in 2014"
}

fig = go.Figure(data = data, layout = layout)
fig.update_xaxes(tickangle=30)

iplot(fig)

## 2. Crea un gráfico de líneas interactivo que muestre las ventas y los beneficios en 2014.

In [None]:
df_2 = df[df['Order Date'].dt.year == 2014][['Order Date', 'Sales', 'Profit']].groupby('Order Date').sum()
df_2.head()

In [None]:
trace1 = go.Scatter(x = df_2.index, y = df_2['Sales'], mode = "lines", name = "Sales")

trace2 = go.Scatter(x = df_2.index, y = df_2['Profit'], mode = "lines", name = "Profit")

data = [trace1, trace2]

layout = dict(title = 'Sales and Profit in 2014',
                xaxis = dict(title='Order Date'))

fig = dict(data=data, layout=layout)

iplot(fig)

## 3. Crea un conjunto de 3 histogramas interactivos que muestren las distribuciones de cantidad por pedido para los siguientes estados: California, Nueva York y Texas.

In [None]:
df_cal = df[df['State'] == "California"]
df_ny = df[df['State'] == "New York"]
df_tx = df[df['State'] == "Texas"]

In [None]:
trace1 = go.Histogram(x=df_cal['Quantity'], name= "California") # Grafica 1

trace2 = go.Histogram(x=df_ny['Quantity'], name= "New York", xaxis="x2") # Grafica 2

trace3 = go.Histogram(x=df_tx['Quantity'], name= "Texas" , xaxis="x3") # Grafica 3

data = [trace1, trace2, trace3]

layout = go.Layout(xaxis=dict(domain=[0, 0.3]), xaxis2 =dict(domain=[0.35, 0.65]), xaxis3 = dict(domain=[0.7, 1]), title = "Quantity per order in this 3 States")

fig = go.Figure(data = data, layout = layout)
iplot(fig)

## 4. Crea un gráfico de barras apiladas interactivo que muestre los ingresos por estado (barras) para cada una de las categorías de productos para California, Nueva York y Texas.

In [None]:
df_4 = df[df['State'].isin(['California','New York', 'Texas'])].groupby(['State','Category'], as_index=False)[['Sales']].sum()
df_4.head()

In [None]:
import plotly.express as px

fig = px.bar(df_4, x="Category", y = "Sales", color="State")

fig.show()

## 5. Crea un gráfico de líneas interactivo que muestre la venta por día para California.

In [None]:
df_5 = df[df['State'] == "California"].groupby('Order Date')[['Sales']].sum()
df_5.head()

In [None]:
fig = go.Figure()

fig.add_trace(go.Scatter(x = df_5.index, y = df_5['Sales'], mode = 'lines'))

fig.show()