# Projeto de Análise de Dados - Automação  ETL e Envio de Relatórios


## Descrição do Projeto
O objetivo deste projeto é agilizar e tornar mais eficiente a análise das vendas em shoppings. Utilizando a automação 
com Python, o processo de Extração, Transformação e Carregamento (ETL) dos dados será realizado de forma automática.
Os dados serão importados de planilhas do Excel, e serão feitos testes para garantir a leitura adequada dos dados.
Em seguida, serão criadas tabelas derivadas a partir dos dados extraídos, utilizando recursos da biblioteca Pandas. 
Será utilizada também a biblioteca específica pywin32 para acessar o Outlook e gerar e-mails formatados com informações
relevantes em formato de tabela.

### Blibliotecas
A primeira linha de código importa as bibliotecas pandas e win32com.client, utilizadas para manipulação de dados e envio de e-mails,respectivamente.

In [2]:
import pandas as pd
import win32com.client as win32



### 1.Importar a base de Dados
Essa linha de código utiliza a função de leitura da biblioteca Pandas para importar os dados do arquivo Excel. Os dados são armazenados em um objeto DataFrame chamado tabela_vendas.

In [3]:
tabela_vendas = pd.read_excel('Vendas.xlsx')


### 2.Vizualizar a base de Dados (teste)
 
Essas linhas de código configuram a exibição das colunas do DataFrame e imprimem a tabela de dados importada, permitindo uma visualização completa dos dados. Esse processo também serve como teste para verificar se a leitura dos dados foi realizada com sucesso.

In [4]:
pd.set_option('display.max_columns',None)
print(tabela_vendas)


        Código Venda       Data                     ID Loja           Produto  \
0                  1 2019-01-01          Iguatemi Esplanada    Sapato Estampa   
1                  1 2019-01-01          Iguatemi Esplanada          Camiseta   
2                  1 2019-01-01          Iguatemi Esplanada     Sapato Xadrez   
3                  2 2019-01-02              Norte Shopping           Relógio   
4                  2 2019-01-02              Norte Shopping      Chinelo Liso   
...              ...        ...                         ...               ...   
100994         69996 2019-12-26  Center Shopping Uberlândia    Short Listrado   
100995         69996 2019-12-26  Center Shopping Uberlândia           Mochila   
100996         69996 2019-12-26  Center Shopping Uberlândia  Pulseira Estampa   
100997         69997 2019-12-26           Ribeirão Shopping   Camisa Listrado   
100998         69997 2019-12-26           Ribeirão Shopping       Short Linho   

        Quantidade  Valor U

### 3.Faturamento por Loja 
Nessa etapa, é criada a tabela "faturamento" a partir dos dados da tabela "tabela_vendas". Os campos selecionados são agrupados por loja, somando os valores do campo "valor final". Os resultados são ordenados em ordem decrescente, exibindo ID da loja  e valor final (loja com o maior faturamento é exibida primeiro, seguida pelas lojas com faturamento decrescente.)


In [5]:

faturamento = tabela_vendas[["ID Loja","Valor Final"]]\
.groupby('ID Loja')\
.sum()\
.sort_values(by ='Valor Final' ,ascending =False)
print(faturamento)


                                  Valor Final
ID Loja                                      
Iguatemi Campinas                     1762419
Shopping Vila Velha                   1731167
Bourbon Shopping SP                   1726110
Rio Mar Recife                        1722766
Shopping SP Market                    1721763
Palladium Shopping Curitiba           1721120
Norte Shopping                        1711968
Ribeirão Shopping                     1707122
Iguatemi Esplanada                    1699681
Rio Mar Shopping Fortaleza            1698430
Shopping Center Leste Aricanduva      1682870
Novo Shopping Ribeirão Preto          1678225
Shopping Iguatemi Fortaleza           1674824
Center Shopping Uberlândia            1668921
Shopping União de Osasco              1663770
Shopping Barra                        1653103
Passei das Águas Shopping             1649014
Shopping Eldorado                     1648111
Salvador Shopping                     1646739
Shopping Center Interlagos        

### 4.Quantidade de Produtos vendido por Loja
Nesse caso, a etapa é semelhante à anterior de "3. Faturamento por Loja". Aqui, será criada uma tabela denominada "quantidade" a partir dos dados da tabela "tabela_vendas". Os campos selecionados são "ID Loja" e "Quantidade"(semelhante a nome da tabela). Os dados também são agrupados por loja e a quantidade de produtos vendidos é calculada. Os resultados são ordenados em ordem decrescente, exibindo o ID da loja e a quantidade de produtos vendidos.

In [6]:
quantidade = tabela_vendas[['ID Loja','Quantidade']]\
.groupby('ID Loja')\
.sum()\
.sort_values(by= 'Quantidade', ascending = False)
print(quantidade)

                                  Quantidade
ID Loja                                     
Shopping Vila Velha                     9224
Palladium Shopping Curitiba             9091
Norte Shopping                          9014
Shopping Center Leste Aricanduva        8938
Rio Mar Shopping Fortaleza              8937
Iguatemi Campinas                       8935
Shopping SP Market                      8927
Rio Mar Recife                          8863
Bourbon Shopping SP                     8863
Ribeirão Shopping                       8825
Novo Shopping Ribeirão Preto            8751
Shopping União de Osasco                8730
Shopping Ibirapuera                     8723
Shopping Eldorado                       8719
Salvador Shopping                       8698
Shopping Center Interlagos              8675
Shopping Barra                          8638
Shopping Iguatemi Fortaleza             8629
Center Shopping Uberlândia              8627
Passei das Águas Shopping               8618
Shopping R

### 5.Ticket médio por produto em cada loja

Nessa etapa, é calculado o ticket médio por produto em cada loja. O faturamento total de cada loja, obtido na etapa anterior, é dividido pela quantidade de produtos vendidos. Os resultados são organizados em uma tabela chamada "ticket_medio" e exibidos na tela, mostrando o valor médio gasto por produto em cada loja

##### Obeservções:
1. A função .to_frame() é utilizado nesse contexto para transformar a expressão em um DataFrame, permitindo que você renomeie as colunas e realize outras operações específicas do DataFrame posteriormente, se necessário.


2. Na linha ticket_medio = ticket_medio.rename(columns= {0:'Ticket Médio'}) executa um comando para renomear a tabela de 0 para Ticket Médio .

3. Repare que dentro do comando print foi utilizada uma função para ordenar a tabela do maior para o menor valor do ticket médio. Essa função possibilita a organização da tabela, garantindo que as lojas sejam exibidas em ordem decrescente de ticket médio.

In [14]:
ticket_medio = (faturamento ['Valor Final'] / quantidade['Quantidade'])\
.to_frame()
ticket_medio = ticket_medio.rename(columns= {0:'Ticket Médio'})

print(ticket_medio.sort_values(by='Ticket Médio', ascending = False))

                                  Ticket Médio
ID Loja                                       
Iguatemi Esplanada                  198.098019
Iguatemi Campinas                   197.248909
Bourbon Shopping SP                 194.754598
Parque Dom Pedro Shopping           194.519552
Rio Mar Recife                      194.377299
Shopping Iguatemi Fortaleza         194.092479
Shopping Midway Mall                193.814404
Center Shopping Uberlândia          193.453228
Ribeirão Shopping                   193.441586
Shopping SP Market                  192.871401
Novo Shopping Ribeirão Preto        191.775226
Shopping Barra                      191.375666
Passei das Águas Shopping           191.345324
Shopping União de Osasco            190.580756
Rio Mar Shopping Fortaleza          190.044758
Norte Shopping                      189.923231
Shopping Recife                     189.357767
Salvador Shopping                   189.323868
Palladium Shopping Curitiba         189.321307
Shopping Cent

### 6.Enviar email com relatório

Nessa parte do código, a biblioteca win32com.client é utilizada para se comunicar com o Outlook. Um novo email é criado e configurado com informações importantes, como destinatário, assunto e corpo. O corpo do email é formatado em HTML e contém um relatório em formato de planilhas. As informações do relatório, como faturamento, quantidade de vendas e ticket médio por loja, serão apresentadas em tabelas dentro do corpo do email. Por fim, o email é enviado usando o método .Send(), garantindo o envio do relatório em formato de planilhas para os destinatários especificados.

In [8]:
outlook = win32.Dispatch('outlook.application')
email= outlook.CreateItem(0)
email.To='exemplo1@gmail.com;seuEmail3@gmail.com;exemplo2@gmail.com'
email.Subject= 'Relatorio de Vendas por Loja'
email.HTMLBody= f'''
<p>Prezados</p>
<p>Segue o Relatório venda por cada loja.</p>
<p>Faturamento :</p>
{faturamento.to_html(formatters={'Valor Final':'R${:,.2f}'.format})}
<p>Quantidade de Venda:</p>
{quantidade.to_html()}
<p>Ticket médio :</p>
{ticket_medio.to_html(formatters={'Ticket Médio':'R${:,.2f}'.format})}
<p> Qualquer Duvida estou a disposição</p>
<p> Att: Adriano Contesini</p>


'''
email.Send()
print('Email enviado')

Email enviado
