## Análise de dados com Python

In [1]:
import pandas as pd

#### Carregamento dos dados


In [3]:
dados = pd.read_excel("vendas.xlsx")

#### Análise exploratoria

In [None]:
# Mostrar as primeiras 5 linhas
dados.head()

In [None]:
# Mostrar as ultimas 5 linhas
dados.tail()

In [None]:
# Verificando a quantidade de linhas e colunas
dados.shape

In [None]:
# Verificando os tipos de dados
dados.info()

In [None]:
# Selecionar uma coluna
dados.loja

#### Gerando estatísticas

In [None]:
dados.preco.describe()

#### Análises

In [None]:
# Total de vendas por loja
dados.loja.value_counts()

In [None]:
# Total de vendas por cidade
dados.cidade.value_counts()

In [None]:
# Total de vendas por forma de pagamento
dados.forma_pagamento.value_counts()

#### Agrupamento de dados

In [None]:
# Faturamento por loja
dados.groupby("loja").preco.sum()

In [None]:
# Faturamento por estado e cidade
dados.groupby(["estado","cidade"]).preco.sum().to_frame()

In [None]:
# Salvando em um arquivo excel
dados.groupby(["estado","cidade"]).preco.sum().to_excel("faturamento-estado-cidade.xlsx")

#### Visualização de dados

In [None]:
!pip install plotly_express

In [20]:
import plotly_express as px

In [30]:
grafico = px.histogram(dados, x="cidade", y="preco", title="Vendas por loja", text_auto=True, color="forma_pagamento") 

In [31]:
grafico.write_html("grafico.html")

#### Lista

In [32]:
colunas = ["loja", "cidade", "estado", "tamanho"]

#### Estrutura de repetição

In [None]:
for coluna in colunas:
    grafico = px.histogram(dados,
                            x= coluna,
                            y= "preco",
                            title= f"Faturamento por {coluna}",
                            text_auto= True,
                            color= "forma_pagamento") 
    grafico.show()
    grafico.write_html(f"grafico-{coluna}.html")