In [2]:
import psycopg2
import numpy as np
import pandas as pd
from sqlalchemy import create_engine
import plotly.express as px
import plotly.graph_objects as go
import warnings
from sqlite3 import connect
warnings.filterwarnings("ignore")

# Lendo os dados do sql

In [3]:
query_join = '''SELECT 
                dim_loja.dim_loj_nome, dim_loja.dim_loj_estado,              
                dim_produto.dim_pro_nome, dim_produto.dim_pro_categoria, dim_produto.dim_pro_familia,
                dim_tempo.dim_tem_dia, dim_tempo.dim_tem_mes, dim_tempo.dim_tem_ano,
                fat_vendas.fat_ven_quantidade, fat_vendas.fat_ven_faturamento
                FROM fat_vendas JOIN dim_loja
                ON fat_vendas.dim_loj_id = dim_loja.dim_loj_id
                JOIN dim_produto
                ON fat_vendas.dim_pro_id = dim_produto.dim_pro_id
                JOIN dim_tempo
                ON fat_vendas.dim_tem_id = dim_tempo.dim_tem_id
                '''

### Opção 1 (No computador com postgres e banco já criados)

### Acessandp o postgres direto no pandas com engine do sqlalchemy

In [4]:
if 'google.colab' in str(get_ipython()):
  print('Running on CoLab')
else:
  print('Not running on CoLab')
  alchemyEngine = create_engine('postgresql+psycopg2://postgres:postgres@127.0.0.1:5433/test', pool_recycle=3600)
  dbConnection = alchemyEngine.connect();
  df = pd.read_sql(query_join, dbConnection)
  df.head(5)

Not running on CoLab


### Opção 2 - Sem postgres, com arquivo create.sql (Recomendado para Colab)

### Lendo o arquivo .sql diretamente (sem postgres)

In [5]:
create_sql = '''
DROP TABLE IF EXISTS DIM_TEMPO;

CREATE TABLE DIM_TEMPO (
DIM_TEM_ID INTEGER PRIMARY KEY,
DIM_TEM_DIA INTEGER,
DIM_TEM_MES INTEGER,
DIM_TEM_ANO INTEGER
);

INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (1,15,1,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (2,15,2,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (3,15,3,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (4,15,4,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO)  VALUES (5,15,5,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (6,15,6,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (7,15,7,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (8,15,8,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (9,15,9,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (10,15,10,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (11,15,11,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (12,15,12,1999);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (13,15,1,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (15,15,2,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (16,15,3,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (17,15,4,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (18,15,5,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (19,15,6,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (20,15,7,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (21,15,8,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (22,15,9,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (23,15,10,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (24,15,11,2000);
INSERT INTO DIM_TEMPO (DIM_TEM_ID,DIM_TEM_DIA,DIM_TEM_MES,DIM_TEM_ANO) VALUES (25,15,12,2000);

DROP TABLE IF EXISTS DIM_PRODUTO;

CREATE TABLE DIM_PRODUTO (
DIM_PRO_ID INTEGER PRIMARY KEY,
DIM_PRO_NOME VARCHAR(10),
DIM_PRO_CATEGORIA CHAR(04),
DIM_PRO_FAMILIA CHAR(04)
);

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA) VALUES (1,'P1','CAT1','F1');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)  VALUES (2,'P2','CAT1','F1');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)  VALUES (3,'P3','CAT1','F1');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)  VALUES (4,'P1','CAT2','F1');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA) VALUES (5,'P2','CAT2','F1');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)  VALUES (6,'P3','CAT2','F1');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)  VALUES (7,'P1','CAT1','F2');


INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)   VALUES (8,'P2','CAT1','F2');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA) VALUES (9,'P3','CAT1','F2');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)  VALUES (10,'P1','CAT2','F2');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)  VALUES (11,'P2','CAT2','F2');

INSERT INTO DIM_PRODUTO (DIM_PRO_ID,DIM_PRO_NOME,DIM_PRO_CATEGORIA,DIM_PRO_FAMILIA)  VALUES (12,'P3','CAT2','F2');

DROP TABLE IF EXISTS DIM_LOJA;

CREATE TABLE DIM_LOJA (
DIM_LOJ_ID INTEGER PRIMARY KEY,
DIM_LOJ_NOME VARCHAR(10),
DIM_LOJ_ESTADO CHAR(02)
);

INSERT INTO DIM_LOJA (DIM_LOJ_ID,DIM_LOJ_NOME,DIM_LOJ_ESTADO) VALUES (1,'LOJA1','BA');

INSERT INTO DIM_LOJA (DIM_LOJ_ID,DIM_LOJ_NOME,DIM_LOJ_ESTADO)  VALUES (2,'LOJA2','BA');

INSERT INTO DIM_LOJA (DIM_LOJ_ID,DIM_LOJ_NOME,DIM_LOJ_ESTADO)  VALUES (3,'LOJA3','PB');

DROP TABLE IF EXISTS FAT_VENDAS;

CREATE TABLE FAT_VENDAS (
DIM_TEM_ID INTEGER ,
DIM_LOJ_ID INTEGER,
DIM_PRO_ID INTEGER,
FAT_VEN_QUANTIDADE NUMERIC(18,2),
FAT_VEN_FATURAMENTO NUMERIC(18,2),
PRIMARY KEY (DIM_TEM_ID,DIM_LOJ_ID,DIM_PRO_ID),
FOREIGN KEY (DIM_TEM_ID) REFERENCES DIM_TEMPO(DIM_TEM_ID),
FOREIGN KEY (DIM_PRO_ID) REFERENCES DIM_PRODUTO(DIM_PRO_ID),
FOREIGN KEY (DIM_LOJ_ID) REFERENCES DIM_LOJA(DIM_LOJ_ID)
);

INSERT INTO FAT_VENDAS  VALUES (1,1,1,10,20);
INSERT INTO FAT_VENDAS  VALUES (1,1,2,30,40);
INSERT INTO FAT_VENDAS  VALUES (1,1,3,10,20);
INSERT INTO FAT_VENDAS  VALUES (2,1,1,10,20);
INSERT INTO FAT_VENDAS  VALUES (2,1,2,30,40);
INSERT INTO FAT_VENDAS  VALUES (2,1,4,10,20);

INSERT INTO FAT_VENDAS  VALUES (1,2,2,30,40);
INSERT INTO FAT_VENDAS  VALUES (1,2,3,10,20);
INSERT INTO FAT_VENDAS  VALUES (2,2,1,10,20);
INSERT INTO FAT_VENDAS  VALUES (2,2,2,30,40);
INSERT INTO FAT_VENDAS  VALUES (2,2,4,10,20);

INSERT INTO FAT_VENDAS  VALUES (1,3,2,30,40);
INSERT INTO FAT_VENDAS  VALUES (1,3,3,10,20);
INSERT INTO FAT_VENDAS  VALUES (2,3,1,10,20);
INSERT INTO FAT_VENDAS  VALUES (2,3,2,30,40);
INSERT INTO FAT_VENDAS  VALUES (2,3,4,10,20);

INSERT INTO FAT_VENDAS  VALUES (13,1,1,10,25);
INSERT INTO FAT_VENDAS  VALUES (13,1,2,30,46);
INSERT INTO FAT_VENDAS  VALUES (13,1,3,10,27);
INSERT INTO FAT_VENDAS  VALUES (15,1,1,10,22);
INSERT INTO FAT_VENDAS  VALUES (15,1,2,30,49);
INSERT INTO FAT_VENDAS  VALUES (15,1,3,10,29);

INSERT INTO FAT_VENDAS  VALUES (13,2,2,30,47);
INSERT INTO FAT_VENDAS  VALUES (13,2,3,10,24);
INSERT INTO FAT_VENDAS  VALUES (15,2,1,10,24);
INSERT INTO FAT_VENDAS  VALUES (15,2,2,30,46);
INSERT INTO FAT_VENDAS  VALUES (15,2,3,10,24);

INSERT INTO FAT_VENDAS  VALUES (13,3,2,30,47);
INSERT INTO FAT_VENDAS  VALUES (13,3,3,10,25);
INSERT INTO FAT_VENDAS  VALUES (15,3,1,10,25);
INSERT INTO FAT_VENDAS  VALUES (15,3,2,30,45);
INSERT INTO FAT_VENDAS  VALUES (15,3,3,10,25);

INSERT INTO FAT_VENDAS  VALUES (16,3,3,10,25);
INSERT INTO FAT_VENDAS  VALUES (16,3,1,10,25);
INSERT INTO FAT_VENDAS  VALUES (16,3,2,30,45);
'''

In [6]:
# Se você colocou o arquivo no mesmo diretório do notebook, descomente a linha abaixo:
# sql_file_list = open('create.sql', 'r').read().split(';')  

# Caso contrário, lendo diretamente da string do arquivo .sql:
sql_file_list = create_sql.split(';')

conn = connect(':memory:')
for sql_statment in sql_file_list:
    cur = conn.cursor()
    cur.execute(sql_statment)
conn.commit()

In [7]:
cursor = conn.cursor()
cursor.execute(query_join) 
rows = cursor.fetchall()

In [8]:
df = pd.DataFrame(columns=['dim_loj_nome', 'dim_loj_estado', 'dim_pro_nome', 'dim_pro_categoria', 'dim_pro_familia',
                   'dim_tem_dia', 'dim_tem_mes', 'dim_tem_ano', 
                   'fat_ven_quantidade', 'fat_ven_faturamento'])

for r in rows:
    df = df.append(pd.DataFrame([r], columns=df.columns.to_list()), ignore_index = True)

df.head()

Unnamed: 0,dim_loj_nome,dim_loj_estado,dim_pro_nome,dim_pro_categoria,dim_pro_familia,dim_tem_dia,dim_tem_mes,dim_tem_ano,fat_ven_quantidade,fat_ven_faturamento
0,LOJA1,BA,P1,CAT1,F1,15,1,1999,10,20
1,LOJA1,BA,P2,CAT1,F1,15,1,1999,30,40
2,LOJA1,BA,P3,CAT1,F1,15,1,1999,10,20
3,LOJA1,BA,P1,CAT1,F1,15,2,1999,10,20
4,LOJA1,BA,P2,CAT1,F1,15,2,1999,30,40


## Tabela de Faturamento por data e Loja

In [9]:
loja1 = df.query('dim_loj_nome == "LOJA1" and dim_pro_categoria == "CAT1"')\
          .sort_values(by=['dim_tem_ano', 'dim_tem_mes', 'dim_tem_dia'])\
          .groupby(['dim_tem_ano', 'dim_tem_mes', 'dim_tem_dia'])\
          ['fat_ven_faturamento'].sum()
loja2 = df.query('dim_loj_nome == "LOJA2" and dim_pro_categoria == "CAT1"')\
          .sort_values(by=['dim_tem_ano', 'dim_tem_mes', 'dim_tem_dia'])\
          .groupby(['dim_tem_ano', 'dim_tem_mes', 'dim_tem_dia'])\
          ['fat_ven_faturamento'].sum()
loja3 = df.query('dim_loj_nome == "LOJA3" and dim_pro_categoria == "CAT1"')\
          .sort_values(by=['dim_tem_ano', 'dim_tem_mes', 'dim_tem_dia'])\
          .groupby(['dim_tem_ano', 'dim_tem_mes', 'dim_tem_dia'])\
          ['fat_ven_faturamento'].sum()

In [10]:
data_table1 = np.vstack([loja1.to_numpy(), loja2.to_numpy()])
data_table1 = np.hstack([data_table1,data_table1.sum(axis=1).reshape(2, 1)])
data_table1 = np.vstack([data_table1,data_table1.sum(axis=0)])

In [11]:
tb = pd.DataFrame(columns=["Nome da Loja"] + [str(i).strip('()') for i in loja1.keys()] + ["Total"])
tb = tb.append(pd.DataFrame([['Loja1'] + data_table1[0].tolist()], columns=tb.columns.to_list()), ignore_index = True)
tb = tb.append(pd.DataFrame([['Loja2'] + data_table1[1].tolist()], columns=tb.columns.to_list()), ignore_index = True)
tb = tb.append(pd.DataFrame([['Total'] + data_table1[2].tolist()], columns=tb.columns.to_list()), ignore_index = True)
tb.head()

Unnamed: 0,Nome da Loja,"1999, 1, 15","1999, 2, 15","2000, 1, 15","2000, 2, 15",Total
0,Loja1,80,60,98,100,338
1,Loja2,60,60,71,94,285
2,Total,140,120,169,194,623


In [12]:
fig = go.Figure(data=[go.Table(header=dict(values=list(tb.columns)),
                               cells=dict(values=[tb['Nome da Loja'], tb['1999, 1, 15'], tb['1999, 2, 15'], 
                               tb['2000, 1, 15'], tb['2000, 2, 15'], tb['Total']])) ])
fig.show()

## Tabela de Faturamento por Categoria

In [13]:
loja1_cat1 = df.query('dim_loj_nome == "LOJA1" and dim_pro_categoria == "CAT1" and dim_loj_estado == "BA" and dim_tem_ano == 1999')['fat_ven_faturamento'].sum()
loja1_cat2 = df.query('dim_loj_nome == "LOJA1" and dim_pro_categoria == "CAT2" and dim_loj_estado == "BA" and dim_tem_ano == 1999')['fat_ven_faturamento'].sum()
loja2_cat1 = df.query('dim_loj_nome == "LOJA2" and dim_pro_categoria == "CAT1" and dim_loj_estado == "BA" and dim_tem_ano == 1999')['fat_ven_faturamento'].sum()
loja2_cat2 = df.query('dim_loj_nome == "LOJA2" and dim_pro_categoria == "CAT2" and dim_loj_estado == "BA" and dim_tem_ano == 1999')['fat_ven_faturamento'].sum()

In [14]:
tb2 = pd.DataFrame(columns=["Nome da Loja", "CAT1", "CAT2"])
tb2 = tb2.append(pd.DataFrame([["Loja1", loja1_cat1, loja1_cat2]], columns=tb2.columns.to_list()), ignore_index = True)
tb2 = tb2.append(pd.DataFrame([["Loja2", loja2_cat1, loja2_cat2]], columns=tb2.columns.to_list()), ignore_index = True)
tb2 = tb2.append(pd.DataFrame([["Total", loja1_cat1 + loja2_cat1, loja1_cat2 + loja2_cat2]], columns=tb2.columns.to_list()), ignore_index = True)
tb2.head()

Unnamed: 0,Nome da Loja,CAT1,CAT2
0,Loja1,140,20
1,Loja2,120,20
2,Total,260,40


In [15]:
fig = go.Figure(data=[go.Table(header=dict(values=list(tb2.columns)),
                               cells=dict(values=[tb2['Nome da Loja'], 
                                                  tb2['CAT1'], tb2['CAT2']])) ])
fig.update_layout(title_text='Faturamento Total - BA 1999', title_x=0.5)
fig.show()

## Tabela Faturamento YoY %

In [16]:
BA_1999 = df.query('dim_loj_estado == "BA" and dim_tem_ano == 1999')['fat_ven_faturamento'].sum()
BA_2000 = df.query('dim_loj_estado == "BA" and dim_tem_ano == 2000')['fat_ven_faturamento'].sum()
PB_1999 = df.query('dim_loj_estado == "PB" and dim_tem_ano == 1999')['fat_ven_faturamento'].sum()
PB_2000 = df.query('dim_loj_estado == "PB" and dim_tem_ano == 2000')['fat_ven_faturamento'].sum()

pc_BA = 100*(BA_2000 - BA_1999) / BA_1999
pc_PB = 100*(PB_2000 - PB_1999) / PB_1999

In [17]:
tb3 = pd.DataFrame(columns=["Estado", "1999", "2000", "Total"])
tb3 = tb3.append(pd.DataFrame([["BA", BA_1999, BA_2000, BA_1999 + BA_2000]], columns=tb3.columns.to_list()), ignore_index = True)
tb3 = tb3.append(pd.DataFrame([["PB", PB_1999, PB_2000, PB_1999 + PB_2000]], columns=tb3.columns.to_list()), ignore_index = True)
tb3.head()

Unnamed: 0,Estado,1999,2000,Total
0,BA,300,363,663
1,PB,140,262,402


In [18]:
fig = go.Figure(data=[go.Table(header=dict(values=list(tb3.columns)),
                               cells=dict(values=[tb3['Estado'], tb3['1999'], tb3['2000'], tb3['Total']])) ])
fig.show()

In [19]:
tb4 = pd.DataFrame(columns=["Estado", "Faturamento YoY%"])
tb4 = tb4.append(pd.DataFrame([["BA", pc_BA]], columns=tb4.columns.to_list()), ignore_index = True)
tb4 = tb4.append(pd.DataFrame([["PB", pc_PB]], columns=tb4.columns.to_list()), ignore_index = True)
tb4.head()

Unnamed: 0,Estado,Faturamento YoY%
0,BA,21.0
1,PB,87.142857


In [20]:
fig = go.Figure(data=[go.Table(header=dict(values=list(tb4.columns)),
                               cells=dict(values=[tb4['Estado'], tb4['Faturamento YoY%']])) ])
fig.show()

## Gráfico Faturamento Mensal por Loja

* Eixo x: tempo
* Eixo y: faturamento agregado por loja

In [28]:
fig = px.line(x=[str(i).strip('()') for i in loja1.keys()], y=[loja1.values, loja2.values], 
        labels={'x': 'Data', 'value': 'Faturamento'}, title="Faturamento por Mensal por Loja da Bahia para a Categoria 01")
fig.show()

## Gráfico Faturamento Estado por Ano

* Eixo x: tempo (ano)
* Eixo y: faturamento agregado por estado

In [23]:
estado_BA = df.query('dim_loj_estado == "BA"').groupby(['dim_tem_ano'])['fat_ven_faturamento'].sum()
estado_PB = df.query('dim_loj_estado == "PB"').groupby(['dim_tem_ano'])['fat_ven_faturamento'].sum()

In [24]:
px.line(y=[estado_BA.values, estado_PB.values], x=[str(i).strip('()') for i in estado_BA.keys()],
        labels={'x': 'Ano', 'value': 'Faturamento'}, title="Faturamento estado por Ano")