<a href="https://colab.research.google.com/github/sgtgarrido3rm/datascience_ia/blob/main/DataAnalytics_HistoricosVendas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [7]:
import numpy as np
import pandas as pd
from scipy import stats

# **Gerar dados de vendas aleatórios (exemplo fictício)**

**Dados de vendas (distribuição normal)**

In [8]:
np.random.seed(42) # Para reprodução dos resultados
num_samples = 100 # Número total de vendas
sales = np.random.normal(loc=50, scale=10, size=num_samples)

**Gerar dados de dias da semana (exemplo fictício)**

In [9]:
days_of_week = ['Segunda', 'Terça', 'Quarta', 'Quinta', 'Sexta',
'Sábado', 'Domingo']
day_labels = np.random.choice(days_of_week, size=num_samples)

**Criar DataFrame com os dados**

In [10]:
data = pd.DataFrame({'Vendas': sales, 'Dia': day_labels})

print(data)

       Vendas      Dia
0   54.967142  Segunda
1   48.617357   Sábado
2   56.476885    Sexta
3   65.230299  Segunda
4   47.658466   Quarta
..        ...      ...
95  35.364851  Segunda
96  52.961203   Quinta
97  52.610553   Quinta
98  50.051135  Segunda
99  47.654129    Terça

[100 rows x 2 columns]


**Separar vendas por finais de semana e dias da semana**

In [11]:
weekend_sales = data[data['Dia'].isin(['Sábado', 'Domingo'])]['Vendas']
weekday_sales = data[data['Dia'].isin(['Segunda', 'Terça', 'Quarta',
'Quinta', 'Sexta'])]['Vendas']

print(
    f"Média de vendas nos finais de semana: {weekend_sales.mean()}"
)
print(
    f"Média de vendas nos dias da semana: {weekday_sales.mean()}"
)

Média de vendas nos finais de semana: 47.27885040046095
Média de vendas nos dias da semana: 49.52242963459177


**Iniciando Teste**

In [33]:
# Definindo dados de entrada
mean_weekend = 47.27885040046095  # Média de vendas nos finais de semana
mean_weekday = 49.52242963459177  # Média de vendas nos dias da semana
std_dev = 0.05                    # Desvio padrão (assumindo igual para ambos)
n = 100                           # Tamanho da amostra para ambos os grupos

# Cálculo do valor t
t_statistic = (mean_weekday - mean_weekend) / np.sqrt((std_dev**2 / n) + (std_dev**2 / n))

# Cálculo do valor-p para o teste t bicaudal
p_value = 2 * (1 - stats.t.cdf(abs(t_statistic), df=2 * n - 2))

# Exibindo os resultados
print("Estatística t:", t_statistic)
print("Valor-p:", p_value)

# Interpretação do resultado
alpha = 0.05  # Nível de significância

if p_value < alpha:
    print("Rejeitamos a hipótese nula: há uma diferença significativa nas vendas entre os finais de semana e os dias da semana.")
else:
    print("Não rejeitamos a hipótese nula: não há diferença significativa nas vendas entre os finais de semana e os dias da semana.")

Estatística t: 317.2900181166437
Valor-p: 0.0
Rejeitamos a hipótese nula: há uma diferença significativa nas vendas entre os finais de semana e os dias da semana.
