# **Projeto :**  Análise de Servidores do Rock in Rio com a metríca MTBF (Mean Time Between Failures)

#### **Instalação das dependências**

In [None]:
#! pip install matplotlib
#! pip install seaborn
#! pip install scipy

#### **Importação dos Módulos**

In [None]:
import numpy as np
import seaborn as sns
import scipy.stats as stats
import matplotlib.pyplot as plt

#### **Leitura dos Dados**

In [None]:
data_file = "MBTF_data.txt"
data_set = open(data_file, 'r')

data = []
for linha in data_set:
   data.append(float(linha.replace(',', '.')))

### **Análise Descritiva**

#### **Medidas de Centralidade dos Dados**

In [None]:
import statistics
from scipy.stats import kurtosis

media = statistics.mean(data)
mediana = statistics.median(data)
moda = statistics.mode(data)
desvioPadrao = statistics.stdev(data)
variancia = statistics.variance(data)
quartis = np.percentile(data, [25, 50, 75])
curtose = kurtosis(data)

print(f"Média:  {media:.4f}")
print(f"Mediana:  {mediana:.4f}")
print(f"Moda:  {moda:.4f}")
print(f"Desvio Padrão:  {desvioPadrao:.4f}")
print(f"Variância:  {variancia:.4f}")
print("Quartis:", quartis)
print("Curtose:", curtose)


### **Teste de Hipótese - Não é uma distribuição Normal**

#### **Teste Q-Q**


In [None]:
from scipy.stats import probplot

fig, ax = plt.subplots(figsize=(8, 4))
probplot(data, plot=ax)

# Definir título e rótulos dos eixos
ax.set_title("Q-Q Plot dos dados")
ax.set_xlabel("Quantis teóricos")
ax.set_ylabel("MTBF - Mean Time Between Failures")

plt.show()

#### **Histograma de Distribuição de Frequência**

In [None]:
histog = sns.histplot(data, kde=True, bins=30)
histog.set(title="MTBF X Frequência", xlabel="Mean Time Between Failures (MTBF)", ylabel="Frequência")
plt.show()

#### **Box-Plot**

In [None]:
sns.boxplot(data)
plt.title("Box Plot - MBTF")
plt.xlabel("Valores (h)")
plt.show()

#### **Teste de Normalidade de Anderson Darling** - *Scipy*

In [None]:
# Teste de normalidade com o teste de Anderson-Darling
stats, critical, teoric = stats.anderson(data, dist='norm')

print("H0 = É uma distribuição normal")
print("Ha = NÃO é uma distribuição normal")
print(f"Estatística do teste AD: {stats}")
print()
print(f"O resultado da estatistica de Anderson Darling é igual a {stats:.4f} e o teste:")
    
# Compara o valor de estatística crítico com cada alfa 
for i in range(len(teoric)):
    if stats < critical[i]:
        print(f'com {str(100 - teoric[i])}% de confiança, teve evidências para ACEITAR a hipótese nula, segundo o teste de Anderson Darling')
    else:
        print(f'com {str(100 - teoric[i])}% de confiança, teve evidências para REJEITAR a hipótese nula, segundo o teste de Anderson Darling')

#### **Teste de Normalidade de Kolmogorov-Smirnov** - *Scipy*

In [None]:
import scipy.stats as stats
from modules import ks_teste

# realiza o teste de Kolmogorov-Smirnov usando a media e o desvio padrao obtido na análise descritiva
KS_stats, p_value = stats.kstest(data, cdf='norm', args=(media, desvioPadrao), N = len(data))

print("H0 = É uma distribuição normal")
print("Ha = NÃO é uma distribuição normal")
print(f"Estatística do teste KS: {KS_stats}")
print(f"Valor P: {p_value}")
print()

# Método que retorna o cálculo de cada valor crítico para amostras > 50 
ks_teste.kolmogorov_smirnov_critico(len(data), KS_stats)
