#### Ambiente

In [1]:
# Bibliotecas
import pandas as pd

In [2]:
# Parametros opcionais
pd.set_option('display.max_columns', None)

In [3]:
# Funções
def analise(df,col):

    print("Tipo:", df[col].dtype)
    print("Registros:", df[col].count(),\
          "-", round((df[col].count()/df.shape[0])*100,2),"%")

    # Caso coluna seja numerica realizar as etapas abaixo
    if df[col].dtype == 'int64':
        print("Min:", df[col].min(),\
              "Max:", df[col].max())

    if df[col].dtype == 'float64':
        print("Min:", round(df[col].min(),2),\
              "Max:", round(df[col].max(),2))

    print("Valores Unicos:")
    print(df[col].value_counts())

In [4]:
# Leitura dos arquivos
compras = pd.read_csv('../HubFinanceiro/Data/compras.csv',sep=',',encoding='utf-8')
fatura = pd.read_csv('../HubFinanceiro/Data/fatura.csv',sep=',',encoding='utf-8')

#### Entendimento dos campos

##### Compras

In [None]:
# Colunas no dataframe
compras.columns

In [None]:
# Amostra dos 5 primeiros registros
compras.head(5)

In [None]:
analise(compras,'description')
# Campo que descreve a compra util 

In [None]:
analise(compras,'category')
# Campo sem relevancia para analise

In [None]:
analise(compras,'amount')
# Tras o valor de compra dos produtos, necessita de tratamento para casas decimais

In [None]:
analise(compras,'time')
# Data e hora exata da compra com fuso horario

In [None]:
analise(compras,'source')
# Forma de processamento da compra, sem relevancia para analise

In [None]:
analise(compras,'title')
# Categoria do produto comprado 

In [None]:
analise(compras,'amount_without_iof')
# Valor da compra sem IOF

In [None]:
analise(compras,'account')
# Conta do usuario autor da compra

In [None]:
analise(compras,'id')
# Codigo de indentificacao da compra, pode ser utilizado como chave

In [None]:
analise(compras,'tokenized')
# Informa as compras que necessitaram de token

In [None]:
analise(compras,'href')
# Id de transacao no servidor, sem relevancia para analise

In [None]:
analise(compras,'details.status')
# Campo sem relevancia para analise

In [None]:
analise(compras,'details.subcategory')
# Informa se a compra foi feita fisicamente ou nao

In [None]:
analise(compras,'_links.self.href')
# Id de transacao no servidor, sem relevancia para analise

In [None]:
analise(compras,'details.charges.count')
# Quantidade de Parcelas da compra, valores nulos sao de compras a vista (1x)

In [None]:
analise(compras,'details.charges.amount')
# Valor das parcelas valores nulos sao de compras a vista (1x)

In [None]:
analise(compras, 'details.fx.currency_origin')
# Moeda de Pagamento 

In [None]:
analise(compras, 'details.fx.amount_origin')
# Valor de transacao da moeda de origem, sem relevancia para analise

In [None]:
analise(compras, 'details.fx.amount_usd')
# Valor em dolar de transacao de outra origem, sem relevancia para analise

In [None]:
analise(compras, 'details.fx.precise_amount_origin')
# Valor de transacao preciso da moeda de origem, sem relevancia para analise

In [None]:
analise(compras, 'details.fx.precise_amount_usd')
# Valor de transacao preciso em dolar, sem relevancia para analise

In [None]:
analise(compras, 'details.fx.exchange_rate')
# Valor do cambio, sem relevancia para analise

In [None]:
analise(compras, 'details.lat')
# Latitude onde foi efetuada a compra

In [None]:
analise(compras, 'details.lon')
# Longitude onde foi efetuada a compra

In [None]:
analise(compras, 'details.tags')
# Tags associadas a compra

##### Fatura

In [None]:
# Colunas no dataframe
fatura.columns

In [None]:
# Amostra dos 5 primeiros registros
fatura.head(5)

In [None]:
analise(fatura, 'state')
# Estado da fatura

In [None]:
analise(fatura, 'summary.due_date')
# Data de vencimento da fatura

In [None]:
analise(fatura, 'summary.close_date')
# Data de fechamento da fatura

In [None]:
analise(fatura, 'summary.past_balance')
# Valor anterior da fatura

In [None]:
analise(fatura, 'summary.effective_due_date')
# Data efetiva de vencimento da fatura

In [None]:
analise(fatura, 'summary.spent_amount')
# Valor gasto na fatura

In [None]:
analise(fatura, 'summary.total_balance')
# Valor total da fatura

In [None]:
analise(fatura, 'summary.interest_rate')
# Percentual da taxa de juros, sem relevancia para analise

In [None]:
analise(fatura, 'summary.interest')
# Taxa de juros aplicada na fatura, sem relevancia para analise

In [None]:
analise(fatura, 'summary.total_cumulative')
# Total acumulado da fatura, sem relevancia para analise

In [None]:
analise(fatura, 'summary.paid')
# Pago em acumulo de fatura, sem relevancia para analise

In [None]:
analise(fatura, 'summary.minimum_payment')
# Valor de pagamento minimo da fatura, sem relevancia para analise

In [None]:
analise(fatura, 'summary.open_date')
# Data de abertura da fatura

In [None]:
analise(fatura, 'summary.late_interest_rate')
# Ultima taxa de juros, sem relevancia para analise

In [None]:
analise(fatura, 'summary.late_fee')
# Ultima taxa, sem relevancia para analise

In [None]:
analise(fatura, '_links.self.href')
# Id de transacao no servidor, sem relevancia para analise

In [None]:
analise(fatura, '_links.barcode.href')
# Codigo de barras de pagamento com boleto,Sem relevancia para analise

In [None]:
analise(fatura, '_links.boleto_email.href')
# Endereco do boleto, Sem relevancia para analise

In [None]:
analise(fatura, 'id')
# Codigo de indentificacao da compra, pode ser utilizado como chave

In [None]:
analise(fatura, 'summary.remaining_balance')
# Saldo remanescente para pagamento, sem relevancia para analise

In [None]:
analise(fatura, 'summary.remaining_minimum_payment')
# Pagamento minimo remanescente , sem relevancia para analise