In [None]:
import pandas as pd
import matplotlib.pyplot as plt

import seaborn as sns
sns.set()

plt.rcParams.update({'figure.figsize':(16,3), 'figure.dpi':100})

In [None]:
# Leitura do arquivo Excel
series = pd.read_excel('spare-parts-sales.xlsx', header=0, 
                       names=['item', 'sales', 'cost', 'date'], index_col=None, parse_dates=True, squeeze=True)

# Filtra o arquivo para os anos de 2014 a 2016
series['date'] = pd.to_datetime(series['date'])
date_filter = (series['date'] >= '2014-01-01') & (series['date'] <= '2016-11-30')
series = series[date_filter]

# Filtra para o item '98550154' (óleo de motor)
sku = '98550154'
series = series[series.item == sku]

# Exclui a coluna item e cost
series.drop(series.columns[[0, 2]], axis=1, inplace=True)

# Transforma para vendas semanais
series = (series.groupby(pd.Grouper(key='date',freq='W')).sum()).reset_index()

In [None]:
# Função para caracterizar o dataframe
def caract_dados(data):
    # Quantidade de registros
    print('Data Size: ', data.size, '\n')
    # Resumo do Dataframe
    print('Data Info:')
    print(data.info(), '\n')
    # Rótulos das colunas
    print('Data Columns:')
    print(data.columns, '\n')
    # Primeiras 5 linhas do Dataframe
    print('Primeiras linhas do Dataframe:')
    print(data.head(), '\n')
    # Dimensionalidade do Dataframe
    print('Data Shape:')
    print(data.shape, '\n')
    # Estatísticas descritivas
    print('Estatísticas Descritivas:')
    print(data.describe(), '\n')
    # Detecção de valores ausentes
    print('Registros Nulos:')
    print(data.isnull().sum(), '\n')

In [None]:
caract_dados(series)

In [None]:
# Função para visualização gráfica
def plot_df(df, x, y, title="", xlabel='Data', ylabel='Vendas', dpi=100):
    plt.figure(figsize=(15,4), dpi=dpi)
    plt.plot(x, y, color='tab:blue')
    plt.gca().set(title=title, xlabel=xlabel, ylabel=ylabel)
    plt.show()

In [None]:
# Visualização dos dados ao longo do tempo.
plot_df(series, x=series['date'], y=series['sales'], title='Vendas de Peças de 2014 a 2016')

In [None]:
fig, ax = plt.subplots(figsize=(10, 5))
sns.histplot(series['sales'], kde=True)
plt.title('Venda de Peças de Reposição', fontsize=20)
plt.xlabel('Quantidade de Vendas')
plt.ylabel('Frequência Absoluta')
plt.show()