# **Aprimoramento da Qualidade das Entregas com Python e Power BI**
#### Bruno Faleiros - Estudante de Análise e Desenvolvimento de Sistemas 
#### Email - brunofaleiros97@gmail.com
#### Linkedin - https://www.linkedin.com/in/brunofaleiros/


# **Objetivo**

O projeto se concentra na análise e limpeza desses dados, com o uso da linguagem de programação Python, destacando a
biblioteca Pandas para manipulação e análise dos dados, e o Power BI para a visualização dos resultados. O foco principal do projeto é identificar a melhor rota de entrega nas regiões da Vila Ema, Vila Prudente e Vila Santa Clara, localizadas na zona leste de São Paulo.

API utilizada: https://viacep.com.br/

# **Pacotes utilizados neste Notebook** 

1. **Pandas:** biblioteca para manipulação de dados tabulares 
2. **Requests:** biblioteca para fazer requisições HTTP

# **Verificando a versão Python** 

In [1]:
from platform import python_version
print(f"Versão da Linguagem Python:{python_version()}")

Versão da Linguagem Python:3.11.5


In [2]:
# Importando o pacote requests 
import requests 

In [3]:
# Importando a biblioteca requests, que será utilizada para fazer a requisição HTTP
import requests

# Escolhendo a região
uf = "SP" 
cidade = "São Paulo"
endereco = "Vila Ema"

# Construindo o URL da API do ViaCEP com base nas informações de UF, cidade e endereço
link = f"https://viacep.com.br/ws/{uf}/{cidade}/{endereco}/json/"

# Realizando uma requisição HTTP GET para o URL da API do ViaCEP
requisicao = requests.get(link)

# Imprimindo a resposta da requisição HTTP (status code e outras informações)
print(requisicao)

# Convertendo a resposta da requisição para formato JSON 
requisicao_json = requisicao.json()

# Imprimindo as informações obtidas da API no formato JSON
print(requisicao_json)


<Response [200]>
[{'cep': '03281-000', 'logradouro': 'Avenida Vila Ema', 'complemento': 'de 1387 a 3701 - lado ímpar', 'bairro': 'Vila Ema', 'localidade': 'São Paulo', 'uf': 'SP', 'ibge': '3550308', 'gia': '1004', 'ddd': '11', 'siafi': '7107'}, {'cep': '03281-904', 'logradouro': 'Avenida Vila Ema', 'complemento': '3883', 'bairro': 'Vila Ema', 'localidade': 'São Paulo', 'uf': 'SP', 'ibge': '3550308', 'gia': '1004', 'ddd': '11', 'siafi': '7107'}, {'cep': '03275-905', 'logradouro': 'Avenida Vila Ema', 'complemento': '2718', 'bairro': 'Vila Ema', 'localidade': 'São Paulo', 'uf': 'SP', 'ibge': '3550308', 'gia': '1004', 'ddd': '11', 'siafi': '7107'}, {'cep': '03156-000', 'logradouro': 'Avenida Vila Ema', 'complemento': 'até 1384 - lado par', 'bairro': 'Vila Prudente', 'localidade': 'São Paulo', 'uf': 'SP', 'ibge': '3550308', 'gia': '1004', 'ddd': '11', 'siafi': '7107'}, {'cep': '03281-001', 'logradouro': 'Avenida Vila Ema', 'complemento': 'de 3703 ao fim - lado ímpar', 'bairro': 'Vila Ema', 

In [4]:
# Importando o pacote pandas
import pandas as pd

# Convertendo o arquivo JSON para o formato Pandas DataFrame
df = pd.DataFrame(requisicao_json)

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,localidade,uf,ibge,gia,ddd,siafi
0,03281-000,Avenida Vila Ema,de 1387 a 3701 - lado ímpar,Vila Ema,São Paulo,SP,3550308,1004,11,7107
1,03281-904,Avenida Vila Ema,3883,Vila Ema,São Paulo,SP,3550308,1004,11,7107
2,03275-905,Avenida Vila Ema,2718,Vila Ema,São Paulo,SP,3550308,1004,11,7107
3,03156-000,Avenida Vila Ema,até 1384 - lado par,Vila Prudente,São Paulo,SP,3550308,1004,11,7107
4,03281-001,Avenida Vila Ema,de 3703 ao fim - lado ímpar,Vila Ema,São Paulo,SP,3550308,1004,11,7107


In [5]:
display(df)

Unnamed: 0,cep,logradouro,complemento,bairro,localidade,uf,ibge,gia,ddd,siafi
0,03281-000,Avenida Vila Ema,de 1387 a 3701 - lado ímpar,Vila Ema,São Paulo,SP,3550308,1004,11,7107
1,03281-904,Avenida Vila Ema,3883,Vila Ema,São Paulo,SP,3550308,1004,11,7107
2,03275-905,Avenida Vila Ema,2718,Vila Ema,São Paulo,SP,3550308,1004,11,7107
3,03156-000,Avenida Vila Ema,até 1384 - lado par,Vila Prudente,São Paulo,SP,3550308,1004,11,7107
4,03281-001,Avenida Vila Ema,de 3703 ao fim - lado ímpar,Vila Ema,São Paulo,SP,3550308,1004,11,7107
5,03282-907,Avenida Vila Ema,3054,Vila Ema,São Paulo,SP,3550308,1004,11,7107
6,03257-906,Avenida Vila Ema,119,Vila Ema,São Paulo,SP,3550308,1004,11,7107
7,03156-001,Avenida Vila Ema,até 1385 - lado ímpar,Vila Prudente,São Paulo,SP,3550308,1004,11,7107
8,03282-000,Avenida Vila Ema,de 1386 a 3700 - lado par,Vila Ema,São Paulo,SP,3550308,1004,11,7107
9,03281-903,Avenida Vila Ema,3881,Vila Ema,São Paulo,SP,3550308,1004,11,7107


### Insight

- Os números das colunas ibge, gia, ddd e siafi se repetem. Para simplificar essa análise, optarei por excluí-los

In [6]:
# Remove as colunas 'ibge', 'gia', 'ddd' e 'siafi' do DataFrame 
df = df.drop(columns=['ibge', 'gia', 'ddd', 'siafi'])

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,localidade,uf
0,03281-000,Avenida Vila Ema,de 1387 a 3701 - lado ímpar,Vila Ema,São Paulo,SP
1,03281-904,Avenida Vila Ema,3883,Vila Ema,São Paulo,SP
2,03275-905,Avenida Vila Ema,2718,Vila Ema,São Paulo,SP
3,03156-000,Avenida Vila Ema,até 1384 - lado par,Vila Prudente,São Paulo,SP
4,03281-001,Avenida Vila Ema,de 3703 ao fim - lado ímpar,Vila Ema,São Paulo,SP


In [7]:
# Informações do conjunto de dados
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 16 entries, 0 to 15
Data columns (total 6 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   cep          16 non-null     object
 1   logradouro   16 non-null     object
 2   complemento  16 non-null     object
 3   bairro       16 non-null     object
 4   localidade   16 non-null     object
 5   uf           16 non-null     object
dtypes: object(6)
memory usage: 900.0+ bytes


## Tratando os dados

In [8]:
# Removendo o caractere '-' da coluna 'cep'
df['cep'] = df['cep'].str.replace('-', '')

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,localidade,uf
0,3281000,Avenida Vila Ema,de 1387 a 3701 - lado ímpar,Vila Ema,São Paulo,SP
1,3281904,Avenida Vila Ema,3883,Vila Ema,São Paulo,SP
2,3275905,Avenida Vila Ema,2718,Vila Ema,São Paulo,SP
3,3156000,Avenida Vila Ema,até 1384 - lado par,Vila Prudente,São Paulo,SP
4,3281001,Avenida Vila Ema,de 3703 ao fim - lado ímpar,Vila Ema,São Paulo,SP


In [9]:
# Substituição do texto 'Avenida' por 'Av. ' na coluna 'logradouro'
df['logradouro'] = df['logradouro'].str.replace('Avenida', 'Av. ').str.upper()

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,localidade,uf
0,3281000,AV. VILA EMA,de 1387 a 3701 - lado ímpar,Vila Ema,São Paulo,SP
1,3281904,AV. VILA EMA,3883,Vila Ema,São Paulo,SP
2,3275905,AV. VILA EMA,2718,Vila Ema,São Paulo,SP
3,3156000,AV. VILA EMA,até 1384 - lado par,Vila Prudente,São Paulo,SP
4,3281001,AV. VILA EMA,de 3703 ao fim - lado ímpar,Vila Ema,São Paulo,SP


In [10]:
# Mantendo apenas os números na coluna 'complemento'
df['complemento'] = df['complemento'].str.extract(r'(\d+)', expand=False)

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,localidade,uf
0,3281000,AV. VILA EMA,1387,Vila Ema,São Paulo,SP
1,3281904,AV. VILA EMA,3883,Vila Ema,São Paulo,SP
2,3275905,AV. VILA EMA,2718,Vila Ema,São Paulo,SP
3,3156000,AV. VILA EMA,1384,Vila Prudente,São Paulo,SP
4,3281001,AV. VILA EMA,3703,Vila Ema,São Paulo,SP


In [11]:
# Converter todos os valores da coluna 'bairro' para maiúsculas e atribuir à mesma coluna
df['bairro'] = df['bairro'].str.upper()

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,localidade,uf
0,3281000,AV. VILA EMA,1387,VILA EMA,São Paulo,SP
1,3281904,AV. VILA EMA,3883,VILA EMA,São Paulo,SP
2,3275905,AV. VILA EMA,2718,VILA EMA,São Paulo,SP
3,3156000,AV. VILA EMA,1384,VILA PRUDENTE,São Paulo,SP
4,3281001,AV. VILA EMA,3703,VILA EMA,São Paulo,SP


In [12]:
# Mapeando os valores originais para os valores codificados
label_encoding = {
    'VILA EMA': 1,
    'VILA PRUDENTE': 0,
    'VILA SANTA CLARA': 2
}

# Aplicando o label encoding à coluna 'bairro'
df['codigo_bairro'] = df['bairro'].map(label_encoding)

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,localidade,uf,codigo_bairro
0,3281000,AV. VILA EMA,1387,VILA EMA,São Paulo,SP,1
1,3281904,AV. VILA EMA,3883,VILA EMA,São Paulo,SP,1
2,3275905,AV. VILA EMA,2718,VILA EMA,São Paulo,SP,1
3,3156000,AV. VILA EMA,1384,VILA PRUDENTE,São Paulo,SP,0
4,3281001,AV. VILA EMA,3703,VILA EMA,São Paulo,SP,1


In [13]:
# Definindo a nova ordem das colunas no DataFrame
nova_ordem_colunas = ["cep", "logradouro", "complemento", "bairro", "codigo_bairro", 
                      "localidade", "uf"]

# Reorganiza as colunas do DataFrame df de acordo com a ordem especificada em nova_ordem_colunas
df = df[nova_ordem_colunas]

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,codigo_bairro,localidade,uf
0,3281000,AV. VILA EMA,1387,VILA EMA,1,São Paulo,SP
1,3281904,AV. VILA EMA,3883,VILA EMA,1,São Paulo,SP
2,3275905,AV. VILA EMA,2718,VILA EMA,1,São Paulo,SP
3,3156000,AV. VILA EMA,1384,VILA PRUDENTE,0,São Paulo,SP
4,3281001,AV. VILA EMA,3703,VILA EMA,1,São Paulo,SP


In [14]:
# Substituindo 'São Paulo' por 'SAO PAULO' na coluna 'localidade'
df['localidade'] = df['localidade'].str.replace('São Paulo', 'SAO PAULO')

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,codigo_bairro,localidade,uf
0,3281000,AV. VILA EMA,1387,VILA EMA,1,SAO PAULO,SP
1,3281904,AV. VILA EMA,3883,VILA EMA,1,SAO PAULO,SP
2,3275905,AV. VILA EMA,2718,VILA EMA,1,SAO PAULO,SP
3,3156000,AV. VILA EMA,1384,VILA PRUDENTE,0,SAO PAULO,SP
4,3281001,AV. VILA EMA,3703,VILA EMA,1,SAO PAULO,SP


In [15]:
# Adiciona uma nova coluna chamada 'paridade' ao DataFrame df, onde o valor de cada célula é determinado pela aplicação de uma função lambda à coluna 'complemento'
# A função lambda verifica se o valor numérico em 'complemento' é par ou ímpar e atribui 'PAR' ou 'IMPAR' à célula correspondente na coluna 'paridade'
df['paridade'] = df['complemento'].apply(lambda num: 'PAR' if int(num) % 2 == 0 else 'IMPAR')

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,bairro,codigo_bairro,localidade,uf,paridade
0,3281000,AV. VILA EMA,1387,VILA EMA,1,SAO PAULO,SP,IMPAR
1,3281904,AV. VILA EMA,3883,VILA EMA,1,SAO PAULO,SP,IMPAR
2,3275905,AV. VILA EMA,2718,VILA EMA,1,SAO PAULO,SP,PAR
3,3156000,AV. VILA EMA,1384,VILA PRUDENTE,0,SAO PAULO,SP,PAR
4,3281001,AV. VILA EMA,3703,VILA EMA,1,SAO PAULO,SP,IMPAR


In [16]:
# Definindo a nova ordem das colunas no DataFrame
nova_ordem_colunas = ["cep", "logradouro", "complemento", "paridade", "bairro", "codigo_bairro", 
                      "localidade", "uf"]

df = df[nova_ordem_colunas]

# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,cep,logradouro,complemento,paridade,bairro,codigo_bairro,localidade,uf
0,3281000,AV. VILA EMA,1387,IMPAR,VILA EMA,1,SAO PAULO,SP
1,3281904,AV. VILA EMA,3883,IMPAR,VILA EMA,1,SAO PAULO,SP
2,3275905,AV. VILA EMA,2718,PAR,VILA EMA,1,SAO PAULO,SP
3,3156000,AV. VILA EMA,1384,PAR,VILA PRUDENTE,0,SAO PAULO,SP
4,3281001,AV. VILA EMA,3703,IMPAR,VILA EMA,1,SAO PAULO,SP


In [17]:
# Informações do conjunto de dados
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 16 entries, 0 to 15
Data columns (total 8 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   cep            16 non-null     object
 1   logradouro     16 non-null     object
 2   complemento    16 non-null     object
 3   paridade       16 non-null     object
 4   bairro         16 non-null     object
 5   codigo_bairro  16 non-null     int64 
 6   localidade     16 non-null     object
 7   uf             16 non-null     object
dtypes: int64(1), object(7)
memory usage: 1.1+ KB


In [18]:
# Salva o DataFrame df em um arquivo do Excel chamado 'projeto-linktou1.xlsx', sem incluir o índice das linhas no arquivo
df.to_excel('dados_entregas_linktou.xlsx', index=False)

# **Visualização dos Dados no Power BI**

![image.png](attachment:image.png)

- **Identificação da Melhor Rota de Entrega**: A análise dos dados permitiu identificar a melhor rota de entrega nas regiões especificadas, levando em consideração fatores como distância, tempo e condições das vias.

- **Otimização das Entregas**: Com base na análise realizada, foi possível otimizar as rotas de entrega, reduzindo custos e tempo de transporte.

- **Melhoria na Qualidade das Entregas**: A implementação da melhor rota contribuiu para a melhoria da qualidade das entregas, garantindo maior eficiência e satisfação do cliente.
