# An√°lise Pr√°tica da Distribui√ß√£o de Weibull

Este notebook apresenta exemplos pr√°ticos de implementa√ß√£o e an√°lise da Distribui√ß√£o de Weibull, fundamental para engenharia de confiabilidade e an√°lise de tempo de vida.

## Objetivos

1. Compreender os par√¢metros da distribui√ß√£o Weibull
2. Implementar an√°lises de confiabilidade
3. Realizar estima√ß√£o de par√¢metros
4. Validar modelos com testes estat√≠sticos
5. Aplicar em casos pr√°ticos de engenharia

## 1. Importa√ß√£o de Bibliotecas

Come√ßamos importando as bibliotecas necess√°rias para an√°lise estat√≠stica, visualiza√ß√£o e modelagem Weibull.

In [None]:
# Bibliotecas fundamentais
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
from scipy.stats import weibull_min
from scipy.optimize import minimize

# Configura√ß√£o de visualiza√ß√£o
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette('husl')
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 11

# Suprimir warnings
import warnings
warnings.filterwarnings('ignore')

# Seed para reprodutibilidade
np.random.seed(42)

print('Bibliotecas importadas com sucesso!')
print(f'NumPy vers√£o: {np.__version__}')
print(f'Pandas vers√£o: {pd.__version__}')

## 2. Fundamentos da Distribui√ß√£o de Weibull

### 2.1 Defini√ß√£o Matem√°tica

A distribui√ß√£o Weibull com dois par√¢metros √© definida por:

**Fun√ß√£o Densidade de Probabilidade (PDF):**
$$f(t; \beta, \eta) = \frac{\beta}{\eta}\left(\frac{t}{\eta}\right)^{\beta-1} \exp\left[-\left(\frac{t}{\eta}\right)^\beta\right]$$

**Fun√ß√£o de Distribui√ß√£o Acumulada (CDF):**
$$F(t; \beta, \eta) = 1 - \exp\left[-\left(\frac{t}{\eta}\right)^\beta\right]$$

**Par√¢metros:**
- $\beta > 0$: Par√¢metro de forma (shape)
- $\eta > 0$: Par√¢metro de escala (scale)

### 2.2 Interpreta√ß√£o dos Par√¢metros

In [None]:
# Visualiza√ß√£o do efeito do par√¢metro de forma (beta)
t = np.linspace(0, 5, 1000)
eta = 2  # Escala fixa
betas = [0.5, 1.0, 1.5, 2.0, 3.0]

fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# PDF
for beta in betas:
    pdf = weibull_min.pdf(t, beta, scale=eta)
    axes[0].plot(t, pdf, label=f'Œ≤ = {beta}', linewidth=2)

axes[0].set_title('Fun√ß√£o Densidade de Probabilidade (PDF)', fontsize=14, fontweight='bold')
axes[0].set_xlabel('Tempo (t)', fontsize=12)
axes[0].set_ylabel('f(t)', fontsize=12)
axes[0].legend(fontsize=10)
axes[0].grid(True, alpha=0.3)

# CDF
for beta in betas:
    cdf = weibull_min.cdf(t, beta, scale=eta)
    axes[1].plot(t, cdf, label=f'Œ≤ = {beta}', linewidth=2)

axes[1].set_title('Fun√ß√£o de Distribui√ß√£o Acumulada (CDF)', fontsize=14, fontweight='bold')
axes[1].set_xlabel('Tempo (t)', fontsize=12)
axes[1].set_ylabel('F(t)', fontsize=12)
axes[1].legend(fontsize=10)
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print('Interpreta√ß√£o dos valores de Œ≤:')
print('Œ≤ < 1: Taxa de falha decrescente (mortalidade infantil)')
print('Œ≤ = 1: Taxa de falha constante (distribui√ß√£o exponencial)')
print('Œ≤ > 1: Taxa de falha crescente (desgaste/envelhecimento)')

## 3. Exemplo Pr√°tico: An√°lise de Vida √ötil de Brocas Industriais

**Contexto:** Uma empresa manufatureira deseja analisar a vida √∫til de brocas de carboneto utilizadas na perfura√ß√£o de a√ßo inoxid√°vel.

**Objetivo:** Estimar quando as brocas devem ser substitu√≠das para minimizar falhas catastr√≥ficas e custos de manuten√ß√£o.

In [None]:
# Simular dados reais de falhas de brocas
# Par√¢metros verdadeiros (desconhecidos na pr√°tica)
beta_true = 2.5  # Desgaste progressivo
eta_true = 2000  # Vida caracter√≠stica: 2000 furos

# Gerar amostra de 80 brocas
n_samples = 80
failure_times = weibull_min.rvs(beta_true, scale=eta_true, size=n_samples)

# Adicionar censura (20% das brocas ainda funcionando ao fim do estudo)
censoring_time = 3000
censored = failure_times > censoring_time
observed_times = np.where(censored, censoring_time, failure_times)
status = (~censored).astype(int)  # 1 = falha observada, 0 = censurado

# Criar DataFrame
df = pd.DataFrame({
    'Tempo_Furos': observed_times,
    'Status': status,
    'Censored': censored
})

print('Resumo dos Dados:')
print(f'Total de brocas: {n_samples}')
print(f'Falhas observadas: {status.sum()}')
print(f'Censuradas: {censored.sum()}')
print(f'\nEstat√≠sticas Descritivas (falhas observadas):')
print(df[df['Status'] == 1]['Tempo_Furos'].describe())

# Histograma
plt.figure(figsize=(10, 5))
plt.hist(df[df['Status'] == 1]['Tempo_Furos'], bins=20, edgecolor='black', alpha=0.7)
plt.axvline(censoring_time, color='r', linestyle='--', linewidth=2, 
            label=f'Tempo de censura: {censoring_time}')
plt.xlabel('N√∫mero de Furos at√© Falha', fontsize=12)
plt.ylabel('Frequ√™ncia', fontsize=12)
plt.title('Distribui√ß√£o dos Tempos de Falha de Brocas Industriais', 
          fontsize=14, fontweight='bold')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

## 4. Estima√ß√£o de Par√¢metros

### 4.1 M√©todo da M√°xima Verossimilhan√ßa (MLE)

A estima√ß√£o por MLE maximiza a fun√ß√£o de verossimilhan√ßa dada os dados observados, considerando a censura.

In [None]:
# Fun√ß√£o de log-verossimilhan√ßa negativa com censura
def neg_log_likelihood_weibull(params, times, status):
    beta, eta = params
    if beta <= 0 or eta <= 0:
        return np.inf
    
    # Log-verossimilhan√ßa para falhas observadas
    ll_failures = status * (np.log(beta) - beta * np.log(eta) + 
                            (beta - 1) * np.log(times) - (times / eta) ** beta)
    
    # Log-verossimilhan√ßa para censurados (fun√ß√£o de sobreviv√™ncia)
    ll_censored = (1 - status) * (-(times / eta) ** beta)
    
    return -np.sum(ll_failures + ll_censored)

# Estima√ß√£o MLE
initial_guess = [1.5, 2000]
result = minimize(neg_log_likelihood_weibull, initial_guess, 
                 args=(observed_times, status), 
                 method='Nelder-Mead')

beta_hat, eta_hat = result.x

print('='*60)
print('ESTIMA√á√ÉO DE PAR√ÇMETROS - M√ÅXIMA VEROSSIMILHAN√áA (MLE)')
print('='*60)
print(f'\nPar√¢metro de Forma (Œ≤) estimado: {beta_hat:.4f}')
print(f'Par√¢metro de Escala (Œ∑) estimado: {eta_hat:.2f} furos')
print(f'\nValores verdadeiros (para compara√ß√£o):')
print(f'Œ≤ verdadeiro: {beta_true}')
print(f'Œ∑ verdadeiro: {eta_true}')
print(f'\nErro relativo Œ≤: {abs(beta_hat - beta_true) / beta_true * 100:.2f}%')
print(f'Erro relativo Œ∑: {abs(eta_hat - eta_true) / eta_true * 100:.2f}%')
print('='*60)

# Interpreta√ß√£o
print(f'\nüìä INTERPRETA√á√ÉO:')
if beta_hat > 1:
    print(f'Com Œ≤ = {beta_hat:.2f} > 1, a taxa de falha √© CRESCENTE.')
    print('Isso indica desgaste progressivo - brocas se degradam com o uso.')
elif beta_hat < 1:
    print(f'Com Œ≤ = {beta_hat:.2f} < 1, a taxa de falha √© DECRESCENTE.')
    print('Isso indica falhas precoces (mortalidade infantil).')
else:
    print(f'Com Œ≤ ‚âà 1, a taxa de falha √© CONSTANTE (exponencial).')
    print('Falhas ocorrem aleatoriamente, independente da idade.')

print(f'\nEm t = Œ∑ = {eta_hat:.0f} furos, 63.2% das brocas j√° falharam.')

## 5. An√°lise de Confiabilidade

### 5.1 Fun√ß√£o de Confiabilidade R(t)

A fun√ß√£o de confiabilidade representa a probabilidade de uma broca **n√£o falhar** at√© um determinado n√∫mero de furos.

In [None]:
# C√°lculos de confiabilidade
t_analysis = np.array([500, 1000, 1500, 2000, 2500, 3000])
reliability = np.exp(-(t_analysis / eta_hat) ** beta_hat)
failure_rate = (beta_hat / eta_hat) * (t_analysis / eta_hat) ** (beta_hat - 1)

# Criar tabela de resultados
results_df = pd.DataFrame({
    'Furos': t_analysis,
    'Confiabilidade R(t)': reliability,
    'Prob. Falha F(t)': 1 - reliability,
    'Taxa de Falha Œª(t)': failure_rate
})

print('\nüìà AN√ÅLISE DE CONFIABILIDADE')
print('='*80)
print(results_df.to_string(index=False, float_format='%.4f'))
print('='*80)

# Visualiza√ß√£o
t_plot = np.linspace(0, 4000, 1000)
R_t = np.exp(-(t_plot / eta_hat) ** beta_hat)
F_t = 1 - R_t
lambda_t = (beta_hat / eta_hat) * (t_plot / eta_hat) ** (beta_hat - 1)

fig, axes = plt.subplots(1, 3, figsize=(16, 5))

# Confiabilidade
axes[0].plot(t_plot, R_t, 'b-', linewidth=2.5)
axes[0].fill_between(t_plot, R_t, alpha=0.3)
axes[0].axhline(0.9, color='r', linestyle='--', alpha=0.6, label='R = 90%')
axes[0].set_xlabel('N√∫mero de Furos', fontsize=12)
axes[0].set_ylabel('Confiabilidade R(t)', fontsize=12)
axes[0].set_title('Fun√ß√£o de Confiabilidade', fontsize=13, fontweight='bold')
axes[0].grid(True, alpha=0.3)
axes[0].legend()

# Probabilidade de Falha
axes[1].plot(t_plot, F_t, 'g-', linewidth=2.5)
axes[1].fill_between(t_plot, F_t, alpha=0.3)
axes[1].set_xlabel('N√∫mero de Furos', fontsize=12)
axes[1].set_ylabel('Probabilidade de Falha F(t)', fontsize=12)
axes[1].set_title('Fun√ß√£o de Distribui√ß√£o Acumulada', fontsize=13, fontweight='bold')
axes[1].grid(True, alpha=0.3)

# Taxa de Falha
axes[2].plot(t_plot, lambda_t, 'r-', linewidth=2.5)
axes[2].set_xlabel('N√∫mero de Furos', fontsize=12)
axes[2].set_ylabel('Taxa de Falha Œª(t)', fontsize=12)
axes[2].set_title('Fun√ß√£o Taxa de Falha (Hazard)', fontsize=13, fontweight='bold')
axes[2].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Encontrar tempo para R = 0.90
t_90 = eta_hat * (-np.log(0.90)) ** (1 / beta_hat)
print(f'\nüí° INSIGHT: Para manter 90% de confiabilidade, substituir brocas a cada {t_90:.0f} furos.')

## 6. Valida√ß√£o do Modelo

### 6.1 Teste de Kolmogorov-Smirnov

Verificamos se os dados se ajustam adequadamente √† distribui√ß√£o Weibull estimada.

In [None]:
# Teste KS apenas com dados n√£o censurados
uncensored_data = observed_times[status == 1]

# Teste de Kolmogorov-Smirnov
ks_stat, ks_pvalue = stats.kstest(uncensored_data, 
                                   lambda x: weibull_min.cdf(x, beta_hat, scale=eta_hat))

print('\nüî¨ TESTE DE ADER√äNCIA - KOLMOGOROV-SMIRNOV')
print('='*60)
print(f'Estat√≠stica KS: {ks_stat:.4f}')
print(f'p-valor: {ks_pvalue:.4f}')
print('\nHip√≥teses:')
print('H0: Os dados seguem uma distribui√ß√£o Weibull')
print('H1: Os dados N√ÉO seguem uma distribui√ß√£o Weibull')
print(f'\nN√≠vel de signific√¢ncia: Œ± = 0.05')
if ks_pvalue > 0.05:
    print('‚úÖ Conclus√£o: N√£o rejeitamos H0. O modelo Weibull √© adequado.')
else:
    print('‚ùå Conclus√£o: Rejeitamos H0. O modelo Weibull pode n√£o ser adequado.')
print('='*60)

# Gr√°fico QQ-Plot
plt.figure(figsize=(10, 5))

# CDF emp√≠rica vs te√≥rica
sorted_data = np.sort(uncensored_data)
n = len(sorted_data)
empirical_cdf = np.arange(1, n + 1) / (n + 1)
theoretical_cdf = weibull_min.cdf(sorted_data, beta_hat, scale=eta_hat)

plt.subplot(1, 2, 1)
plt.plot(sorted_data, empirical_cdf, 'bo-', label='CDF Emp√≠rica', markersize=4)
plt.plot(sorted_data, theoretical_cdf, 'r-', label='CDF Weibull Te√≥rica', linewidth=2)
plt.xlabel('Tempo (furos)', fontsize=11)
plt.ylabel('Probabilidade Acumulada', fontsize=11)
plt.title('Compara√ß√£o CDF Emp√≠rica vs Te√≥rica', fontsize=12, fontweight='bold')
plt.legend()
plt.grid(True, alpha=0.3)

# QQ-Plot
plt.subplot(1, 2, 2)
theoretical_quantiles = weibull_min.ppf(empirical_cdf, beta_hat, scale=eta_hat)
plt.scatter(theoretical_quantiles, sorted_data, alpha=0.6, s=40)
min_val = min(theoretical_quantiles.min(), sorted_data.min())
max_val = max(theoretical_quantiles.max(), sorted_data.max())
plt.plot([min_val, max_val], [min_val, max_val], 'r--', linewidth=2, label='Linha 45¬∞')
plt.xlabel('Quantis Te√≥ricos (Weibull)', fontsize=11)
plt.ylabel('Quantis Observados', fontsize=11)
plt.title('QQ-Plot', fontsize=12, fontweight='bold')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## 7. Otimiza√ß√£o de Manuten√ß√£o

### 7.1 Determina√ß√£o do Intervalo √ìtimo de Manuten√ß√£o Preventiva

**Objetivo:** Minimizar o custo total esperado considerando:
- Custo de manuten√ß√£o preventiva (substitui√ß√£o planejada)
- Custo de falha (substitui√ß√£o emergencial + tempo de parada)

In [None]:
# Custos (em unidades monet√°rias)
C_preventive = 50  # Custo manuten√ß√£o preventiva
C_failure = 500    # Custo de falha (inclui parada de produ√ß√£o)

def expected_cost_per_unit_time(t_pm, beta, eta, C_p, C_f):
    """
    Custo esperado por unidade de tempo.
    t_pm: Tempo de manuten√ß√£o preventiva
    """
    R_t = np.exp(-(t_pm / eta) ** beta)
    # Custo esperado
    numerator = C_p * R_t + C_f * (1 - R_t)
    denominator = t_pm
    return numerator / denominator

# Avaliar custos para diferentes intervalos
t_range = np.linspace(100, 3500, 500)
costs = [expected_cost_per_unit_time(t, beta_hat, eta_hat, C_preventive, C_failure) 
         for t in t_range]

# Encontrar √≥timo
optimal_idx = np.argmin(costs)
t_optimal = t_range[optimal_idx]
cost_optimal = costs[optimal_idx]

print('\nüí∞ OTIMIZA√á√ÉO DE MANUTEN√á√ÉO PREVENTIVA')
print('='*60)
print(f'Custo Manuten√ß√£o Preventiva: ${C_preventive}')
print(f'Custo de Falha: ${C_failure}')
print(f'\nIntervalo √ìtimo: {t_optimal:.0f} furos')
print(f'Custo Esperado M√≠nimo: ${cost_optimal:.4f} por furo')
print(f'\nConfiabilidade no intervalo √≥timo: {np.exp(-(t_optimal/eta_hat)**beta_hat):.2%}')
print('='*60)

# Visualiza√ß√£o
plt.figure(figsize=(12, 6))
plt.plot(t_range, costs, 'b-', linewidth=2.5, label='Custo Esperado')
plt.axvline(t_optimal, color='r', linestyle='--', linewidth=2, 
            label=f'√ìtimo: {t_optimal:.0f} furos')
plt.scatter([t_optimal], [cost_optimal], color='r', s=200, zorder=5, 
           marker='*', edgecolors='black', linewidths=1.5)
plt.xlabel('Intervalo de Manuten√ß√£o Preventiva (furos)', fontsize=12)
plt.ylabel('Custo Esperado por Furo ($)', fontsize=12)
plt.title('Otimiza√ß√£o do Intervalo de Manuten√ß√£o Preventiva', 
         fontsize=14, fontweight='bold')
plt.legend(fontsize=11)
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

# An√°lise de sensibilidade
print('\nüìä AN√ÅLISE DE SENSIBILIDADE - Varia√ß√£o de Custos')
print('='*60)
cost_ratios = [5, 10, 15, 20]
for ratio in cost_ratios:
    C_f_temp = C_preventive * ratio
    costs_temp = [expected_cost_per_unit_time(t, beta_hat, eta_hat, C_preventive, C_f_temp) 
                  for t in t_range]
    t_opt_temp = t_range[np.argmin(costs_temp)]
    print(f'Raz√£o C_falha/C_preventiva = {ratio}: Intervalo √≥timo = {t_opt_temp:.0f} furos')
print('='*60)

## 8. Conclus√µes e Recomenda√ß√µes

### Principais Achados:

1. **Caracteriza√ß√£o do Desgaste:**
   - Par√¢metro Œ≤ > 1 confirma desgaste progressivo
   - Taxa de falha aumenta com o uso (t√≠pico de componentes mec√¢nicos)

2. **Confiabilidade:**
   - 63,2% das brocas falham em torno de Œ∑ furos
   - Modelo Weibull adequado (teste KS aprovado)

3. **Estrat√©gia de Manuten√ß√£o:**
   - Manuten√ß√£o preventiva economicamente justificada
   - Intervalo √≥timo balanceia custos preventivos e falhas

### Recomenda√ß√µes Pr√°ticas:

‚úÖ Implementar programa de manuten√ß√£o preventiva no intervalo √≥timo calculado

‚úÖ Monitorar continuamente tempos de falha para atualizar modelo

‚úÖ Considerar condi√ß√µes operacionais (material perfurado, velocidade, refrigera√ß√£o)

‚úÖ Treinar operadores para identificar sinais de degrada√ß√£o precoce

‚úÖ Reavaliar custos periodicamente para ajustar pol√≠tica de manuten√ß√£o

### Pr√≥ximos Passos:

- An√°lise de covari√°veis (temperatura, press√£o, velocidade)
- Implementa√ß√£o de sensores IoT para monitoramento em tempo real
- Desenvolvimento de dashboard de confiabilidade
- Estudo de outros componentes cr√≠ticos com metodologia similar

---

## Refer√™ncias

1. **Lawless, J. F.** (2003). *Statistical Models and Methods for Lifetime Data*. Wiley.
2. **Meeker, W. Q., & Escobar, L. A.** (1998). *Statistical Methods for Reliability Data*. Wiley.
3. **Nelson, W. B.** (1982). *Applied Life Data Analysis*. Wiley.
4. **Murthy, D. N. P., et al.** (2004). *Weibull Models*. Wiley.

---

**Desenvolvido para:** Curso de An√°lise de Dados  
**Autor:** Prof. Luis Caparroz  
**√öltima Atualiza√ß√£o:** 2025