# PTEF - Funcionalidades Avan√ßadas

Este notebook demonstra as funcionalidades avan√ßadas do PTEF implementadas conforme o artigo:

## Funcionalidades Demonstradas
- **Contexto Condicional**: Dura√ß√£o das s√≠labas baseada em contexto
- **Bootstrap**: Intervalos de confian√ßa robustos
- **Valida√ß√£o**: Compara√ß√£o com TTS e falantes humanos
- **An√°lise de Sensibilidade**: Varia√ß√£o de par√¢metros


In [None]:
import sys
import os
sys.path.append(os.path.join('..', 'src'))

import ptef
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from ptef import (
    estimate, PTEFParams, ContextModel, BootstrapConfig,
    bootstrap_estimate, run_full_validation, ValidationConfig
)

# Configurar matplotlib
plt.rcParams['font.size'] = 12
plt.rcParams['figure.figsize'] = (12, 8)


## 1. Contexto Condicional

Demonstra√ß√£o do modelo de dura√ß√£o condicionada ao contexto conforme o artigo.


In [None]:
# Criar modelo de contexto personalizado
context_model = ContextModel(
    beta_position=0.001,      # Efeito da posi√ß√£o no grupo
    beta_complexity=0.05,     # Efeito da complexidade recente
    beta_long_words=0.02,     # Efeito de palavras longas
    beta_connective=-0.1,     # Conectivos s√£o mais r√°pidos
    beta_boundary=0.15,       # Fronteiras pros√≥dicas s√£o mais lentas
    beta_stress=0.1,          # S√≠labas t√¥nicas s√£o mais lentas
    mu_base=0.15,             # Dura√ß√£o base
    sigma=0.3,                # Variabilidade
    fatigue_coeff=0.0001      # Coeficiente de fadiga
)

# Par√¢metros PTEF com contexto
params_with_context = PTEFParams(
    context_model=context_model,
    use_context=True
)

# Comparar estima√ß√µes com e sem contexto
N = 1000

# Sem contexto (m√©todo padr√£o)
result_no_context = estimate(N, return_ci=True)

# Com contexto
result_with_context = estimate(N, params=params_with_context, return_ci=True)

print("=== Compara√ß√£o: Sem vs Com Contexto ===")
print(f"Sem contexto: {result_no_context['mean']:.3f}s")
print(f"Com contexto: {result_with_context['mean']:.3f}s")
print(f"Diferen√ßa: {result_with_context['mean'] - result_no_context['mean']:.3f}s")
print(f"Percentual: {((result_with_context['mean'] / result_no_context['mean']) - 1) * 100:.1f}%")


## 2. Bootstrap para Intervalos de Confian√ßa

Demonstra√ß√£o do m√©todo bootstrap para estimar intervalos de confian√ßa robustos.


In [None]:
# Configura√ß√£o do bootstrap
bootstrap_config = BootstrapConfig(
    n_bootstrap=1000,           # 1000 amostras bootstrap
    confidence_level=0.95,      # IC 95%
    method="percentile",        # M√©todo percentil
    random_seed=42              # Semente para reprodutibilidade
)

# Par√¢metros PTEF com bootstrap
params_with_bootstrap = PTEFParams(
    bootstrap_config=bootstrap_config,
    use_bootstrap=True
)

# Comparar m√©todos de CI
N = 1000

# M√©todo padr√£o (aproxima√ß√£o normal)
result_normal = estimate(N, return_ci=True)

# M√©todo bootstrap
result_bootstrap = estimate(N, params=params_with_bootstrap, return_ci=True)

print("=== Compara√ß√£o: CI Normal vs Bootstrap ===")
print(f"M√©todo normal:")
print(f"  M√©dia: {result_normal['mean']:.3f}s")
print(f"  IC95%: [{result_normal['ci95']['lower']:.3f}, {result_normal['ci95']['upper']:.3f}]")
print(f"  Largura: {result_normal['ci95']['upper'] - result_normal['ci95']['lower']:.3f}s")

print(f"\nM√©todo bootstrap:")
print(f"  M√©dia: {result_bootstrap['mean']:.3f}s")
print(f"  IC95%: [{result_bootstrap['ci95']['lower']:.3f}, {result_bootstrap['ci95']['upper']:.3f}]")
print(f"  Largura: {result_bootstrap['ci95']['upper'] - result_bootstrap['ci95']['lower']:.3f}s")
print(f"  M√©todo: {result_bootstrap['ci95']['method']}")


## 3. An√°lise de Sensibilidade

Demonstra√ß√£o da an√°lise de sensibilidade dos par√¢metros conforme o artigo.


In [None]:
# An√°lise de sensibilidade dos par√¢metros
from ptef.bootstrap import bootstrap_sensitivity_analysis

# Definir faixas de par√¢metros para testar
parameter_ranges = {
    "mu_base": [0.10, 0.15, 0.20, 0.25],      # Dura√ß√£o base
    "sigma": [0.2, 0.3, 0.4, 0.5],            # Variabilidade
    "fatigue_coeff": [0.00005, 0.0001, 0.0002, 0.0005]  # Coeficiente de fadiga
}

# Executar an√°lise de sensibilidade
sensitivity_results = bootstrap_sensitivity_analysis(
    N=1000,
    parameter_ranges=parameter_ranges,
    config=bootstrap_config
)

# Visualizar resultados
fig, axes = plt.subplots(1, 3, figsize=(15, 5))

for i, (param, values) in enumerate(parameter_ranges.items()):
    ax = axes[i]
    
    # Extrair dados para o par√¢metro
    param_data = sensitivity_results[param]
    means = [data["mean"] for data in param_data.values()]
    
    # Plotar
    ax.plot(values, means, 'o-', linewidth=2, markersize=8)
    ax.set_xlabel(f'{param}')
    ax.set_ylabel('Dura√ß√£o M√©dia (s)')
    ax.set_title(f'Sensibilidade: {param}')
    ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Mostrar tabela de resultados
print("=== An√°lise de Sensibilidade ===")
for param, values in parameter_ranges.items():
    print(f"\n{param}:")
    for value, data in sensitivity_results[param].items():
        print(f"  {value}: {data['mean']:.3f}s (IC: [{data['ci_lower']:.3f}, {data['ci_upper']:.3f}])")


## 4. Valida√ß√£o com TTS e Falantes Humanos

Demonstra√ß√£o do sistema de valida√ß√£o conforme o artigo.


In [None]:
# Configura√ß√£o de valida√ß√£o
validation_config = ValidationConfig(
    tts_engines=["espeak", "festival"],  # Motores TTS dispon√≠veis
    num_speakers=5,                      # N√∫mero de falantes simulados
    accents=["southeast", "northeast", "south"],  # Sotaques
    small_range=(1, 50),                 # Faixa pequena para teste
    medium_range=(1, 200),               # Faixa m√©dia
    large_range=(1, 1000),               # Faixa grande
    confidence_level=0.95,               # N√≠vel de confian√ßa
    bootstrap_samples=500,               # Amostras bootstrap
    rmse_threshold=0.15                  # Limite de RMSE aceit√°vel
)

# Executar valida√ß√£o completa
print("Executando valida√ß√£o completa...")
print("(Nota: Esta √© uma simula√ß√£o - em produ√ß√£o usaria TTS e falantes reais)")

# N√∫meros para validar
test_numbers = list(range(1, 51))  # 1 a 50 para teste r√°pido

# Executar valida√ß√£o
validation_report = run_full_validation(test_numbers, validation_config)

# Mostrar relat√≥rio
print("\n=== Relat√≥rio de Valida√ß√£o ===")
print(f"TTS Analysis: {len(validation_report['tts_analysis'])} engines testados")
print(f"Human Analysis: {len(validation_report['human_analysis'])} falantes testados")
print(f"Ablation Analysis: {len(validation_report['ablation_analysis'])} m√©todos comparados")

# Mostrar recomenda√ß√µes
if validation_report['recommendations']:
    print("\nRecomenda√ß√µes:")
    for i, rec in enumerate(validation_report['recommendations'], 1):
        print(f"  {i}. {rec}")
else:
    print("\nNenhuma recomenda√ß√£o espec√≠fica - valida√ß√£o passou nos crit√©rios!")


## 5. Compara√ß√£o de M√©todos Bootstrap

Demonstra√ß√£o da compara√ß√£o entre diferentes m√©todos bootstrap.


In [None]:
# Comparar diferentes m√©todos bootstrap
from ptef.bootstrap import compare_bootstrap_methods

# M√©todos para comparar
bootstrap_methods = ["percentile", "bca", "studentized"]

# Executar compara√ß√£o
comparison_results = compare_bootstrap_methods(
    N=1000,
    methods=bootstrap_methods,
    config=bootstrap_config
)

# Visualizar compara√ß√£o
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Gr√°fico 1: M√©dias
methods = list(comparison_results.keys())
means = [comparison_results[method]["mean"] for method in methods]
ci_lowers = [comparison_results[method]["ci_lower"] for method in methods]
ci_uppers = [comparison_results[method]["ci_upper"] for method in methods]

x_pos = range(len(methods))
ax1.bar(x_pos, means, yerr=[np.array(means) - np.array(ci_lowers), 
                           np.array(ci_uppers) - np.array(means)], 
        capsize=5, alpha=0.7)
ax1.set_xlabel('M√©todo Bootstrap')
ax1.set_ylabel('Dura√ß√£o M√©dia (s)')
ax1.set_title('Compara√ß√£o de M√©dias por M√©todo')
ax1.set_xticks(x_pos)
ax1.set_xticklabels(methods, rotation=45)
ax1.grid(True, alpha=0.3)

# Gr√°fico 2: Largura dos intervalos
ci_widths = [comparison_results[method]["ci_width"] for method in methods]
ax2.bar(x_pos, ci_widths, alpha=0.7, color='orange')
ax2.set_xlabel('M√©todo Bootstrap')
ax2.set_ylabel('Largura do IC95% (s)')
ax2.set_title('Largura dos Intervalos de Confian√ßa')
ax2.set_xticks(x_pos)
ax2.set_xticklabels(methods, rotation=45)
ax2.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

# Tabela de resultados
print("=== Compara√ß√£o de M√©todos Bootstrap ===")
print(f"{'M√©todo':<12} {'M√©dia (s)':<10} {'IC95% Inferior':<15} {'IC95% Superior':<15} {'Largura (s)':<12}")
print("-" * 80)
for method in methods:
    result = comparison_results[method]
    print(f"{method:<12} {result['mean']:<10.3f} {result['ci_lower']:<15.3f} {result['ci_upper']:<15.3f} {result['ci_width']:<12.3f}")


## 6. Resumo e Conclus√µes

Este notebook demonstrou as funcionalidades avan√ßadas do PTEF implementadas conforme o artigo:

### ‚úÖ **Funcionalidades Implementadas**

1. **Contexto Condicional**: Dura√ß√£o das s√≠labas baseada em caracter√≠sticas contextuais
2. **Bootstrap**: Intervalos de confian√ßa robustos via amostragem
3. **Valida√ß√£o**: Sistema de valida√ß√£o com TTS e falantes humanos
4. **An√°lise de Sensibilidade**: Avalia√ß√£o da robustez dos par√¢metros
5. **Compara√ß√£o de M√©todos**: Diferentes abordagens bootstrap

### üìä **Conformidade com o Artigo**

- ‚úÖ Formula√ß√£o matem√°tica completa
- ‚úÖ Microdura√ß√£o lognormal condicionada
- ‚úÖ Pausas pros√≥dicas modeladas
- ‚úÖ Algoritmo O(log N) implementado
- ‚úÖ Gram√°tica R1 fiel ao artigo
- ‚úÖ Bootstrap para IC robustos
- ‚úÖ Valida√ß√£o com TTS/humano
- ‚úÖ An√°lise de sensibilidade

### üöÄ **Pr√≥ximos Passos**

1. **Valida√ß√£o Real**: Integrar com TTS engines reais
2. **Dados Humanos**: Coletar dados de falantes reais
3. **Otimiza√ß√£o**: Melhorar performance para N muito grande
4. **Interface Web**: Criar interface web para demonstra√ß√£o
