In [25]:
# IMPORTAÇÃO DAS BIBLIOTECAS

import pandas as pd
import openpyxl  # Necessário para leitura de arquivos Excel


In [19]:
# LEITURA DA BASE DE DADOS

# Carrega o arquivo Excel
df = pd.read_excel('Customer Call List.xlsx')

# Remove registros duplicados
df = df.drop_duplicates()

In [20]:
# LIMPEZA DE COLUNAS

# Remove coluna que não é útil para análise
df = df.drop(columns='Not_Useful_Column')

In [21]:
# LIMPEZA DE NOMES

# Remove caracteres indesejados do sobrenome
df['Last_Name'] = (
    df['Last_Name']
    .str.strip('/')     # Remove /
    .str.strip('_')     # Remove _
    .str.strip('.')     # Remove pontos extras
)


In [34]:
# LIMPEZA E PADRONIZAÇÃO DE TELEFONE

# Limpa e padroniza telefone
def clean_phone(number):
    # Converte para string e remove tudo que não é dígito
    number = str(number)
    number = ''.join(filter(str.isdigit, number))  # remove tudo que não for número
    
    # Se tiver 10 dígitos, formata XXX-XXX-XXXX
    if len(number) == 10:
        return f"{number[:3]}-{number[3:6]}-{number[6:10]}"
    else:
        return ''  # ou retorna number se quiser manter incompletos

df['Phone_Number'] = df['Phone_Number'].fillna('').apply(clean_phone)


In [35]:
# DIVISÃO DE ENDEREÇO EM COLUNAS

# Divide a coluna Address em Rua, Estado e CEP
df[['Street_Address', 'State', 'Zip_Code']] = (
    df['Address']
    .astype(str)
    .str.split(',', n=2, expand=True)
)


In [36]:
# PADRONIZAÇÃO DE VARIÁVEIS BINÁRIAS

# Converte Yes/No para Y/N
df['Paying Customer'] = df['Paying Customer'].replace({'Yes': 'Y', 'No': 'N'})
df['Do_Not_Contact'] = df['Do_Not_Contact'].replace({'Yes': 'Y', 'No': 'N'})



In [37]:
# TRATAMENTO DE VALORES AUSENTES

# Remove textos que representam valores ausentes
df = df.replace(['N/a', 'NaN'], '')

# Preenche valores NaN restantes com string vazia
df = df.fillna('')

In [38]:
# VISUALIZAÇÃO FINAL

from tabulate import tabulate

print(tabulate(df.head(10), headers='keys', tablefmt='fancy_grid'))

╒════╤══════════════╤══════════════╤═════════════╤════════════════╤═══════════════════════════════════════╤═══════════════════╤══════════════════╤═════════════════════╤══════════════╤════════════╕
│    │   CustomerID │ First_Name   │ Last_Name   │ Phone_Number   │ Address                               │ Paying Customer   │ Do_Not_Contact   │ Street_Address      │ State        │ Zip_Code   │
╞════╪══════════════╪══════════════╪═════════════╪════════════════╪═══════════════════════════════════════╪═══════════════════╪══════════════════╪═════════════════════╪══════════════╪════════════╡
│  0 │         1001 │ Frodo        │ Baggins     │ 123-545-5421   │ 123 Shire Lane, Shire                 │ Y                 │ N                │ 123 Shire Lane      │ Shire        │            │
├────┼──────────────┼──────────────┼─────────────┼────────────────┼───────────────────────────────────────┼───────────────────┼──────────────────┼─────────────────────┼──────────────┼────────────┤
│  1 │         