Importando as bibliotecas para o tratamento e visualização dos dados.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from scipy import stats
import holidays
import datetime

Realizando a leitura da base de dados.

In [None]:
df: pd.DataFrame = pd.read_excel('data/01 Call-Center-Dataset.xlsx')
df.head()

Contando a quantidade de chamadas recebidas por dia.

In [None]:
dayly: pd.DataFrame = df[['Call Id', 'Date']].groupby('Date').count()
dayly.rename(columns={'Call Id': 'Calls'}, inplace=True)
dayly.index = pd.to_datetime(dayly.index)

dayly.head()

Visualização inicial dos dados.

In [None]:
plt.figure(figsize=(16, 3))
plt.plot(dayly.index, dayly['Calls'])
plt.xlabel('Data')
plt.ylabel('Quantidade de Chamadas')
plt.title('Chamadas por Dia')
plt.xticks(dayly.index[::8])
plt.show()

Calculando a média de chamadas por dia da semana.

In [None]:
weekly_means: pd.DataFrame = dayly.copy()
weekly_means['Day_name'] = weekly_means.index.day_name()
weekly_means = weekly_means.groupby('Day_name').mean()
weekly_means = weekly_means.reindex(['Sunday', 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday'])
weekly_means.rename(columns={'Calls': 'Mean Calls'}, inplace=True)

weekly_means

Visualizando em grafico de barras.

In [None]:
plt.figure(figsize=(8, 3))
plt.bar(weekly_means.index, weekly_means['Mean Calls'])
plt.xlabel('Dias da Semana')
plt.ylabel('Média de Chamadas')
plt.title('Médias de Chamadas por Dia da Semana')
plt.show()

In [None]:
sk_stat, sk_p_value = stats.shapiro(dayly)
print(f'Estatística do teste de Shapiro-Wilk: {sk_stat}, p-valor: {sk_p_value}')

jb_stat, jb_p_value = stats.jarque_bera(dayly)
print(f'Estatística do teste de Jarque-Bera: {jb_stat}, p-valor: {jb_p_value}')

result = stats.anderson(dayly['Calls'])
print(f"Estatística de teste: {result.statistic}")
print("Valores críticos:", result.critical_values)

In [None]:
plt.figure(figsize=(10, 6))
plt.hist(dayly['Calls'], bins=20, edgecolor='black')
plt.xlabel('Número de Chamadas')
plt.ylabel('Frequência')
plt.title('Distribuição do Número de Chamadas Diárias')
plt.show()

In [None]:
# Feriados brasileiros do ano de 2021
br_holidays: holidays.BR = holidays.BR(years=2021)

# Convertendo para pandas
holiday_df: pd.DataFrame = pd.DataFrame.from_dict(br_holidays.items())
holiday_df.columns = ['Date', 'Holiday']
holiday_df.set_index('Date', inplace=True)

holiday_df

In [None]:
# Adiciona Carnaval e Corpus Christi manualmente
holiday_df.loc[datetime.date(2021, 2, 15)] = 'Carnaval'
holiday_df.loc[datetime.date(2021, 2, 16)] = 'Carnaval'
holiday_df.loc[datetime.date(2021, 6, 3)] = 'Corpus Christi'
holiday_df.sort_index(inplace=True)

holiday_df