# 7 ¬∑ Reconhecimento de uma Classe Universal

**Registro observacional associado ao livro**  
*Descobrindo o Caos nos N√∫meros ‚Äî Como a ordem emerge quando mudamos a forma de observar*  
¬© Alvaro Costa, 2025  

Este notebook faz parte de uma sequ√™ncia can√¥nica de registros computacionais.  
Ele n√£o introduz hip√≥teses, conjecturas ou modelos interpretativos novos.

Seu objetivo √© exclusivamente **registrar** o comportamento de estruturas aritm√©ticas sob um regime  
de observa√ß√£o expl√≠cito, determin√≠stico e reproduz√≠vel.

A leitura conceitual completa encontra-se no livro. Este notebook documenta apenas o experimento  
correspondente.

**Licen√ßa:** Creative Commons BY‚ÄìNC‚ÄìND 4.0  
√â permitida a leitura, execu√ß√£o e cita√ß√£o.  
N√£o √© permitida a modifica√ß√£o, redistribui√ß√£o adaptada ou uso comercial independente.

## 1. Da Imagem ao Som: Medindo a Harmonia
No cap√≠tulo anterior, testemunhamos um fen√¥meno visual not√°vel: √† medida que aumentamos a escala $X_0$, a estrutura da nossa  
matriz $M$ transita de um "ru√≠do" ca√≥tico para uma harmonia visual cristalina. Mas o que define essa harmonia? Como podemos  
provar que n√£o √© apenas um artefato √≥ptico?

Para responder a isso, precisamos passar da "fotografia" da matriz para a sua "m√∫sica". Na f√≠sica qu√¢ntica e na teoria de matrizes  
aleat√≥rias, a m√∫sica de um sistema est√° contida no seu **espectro de autovalores** ‚Äî as frequ√™ncias fundamentais que o sistema  
ressoa.

Neste cap√≠tulo, utilizaremos tr√™s ferramentas estat√≠sticas para analisar os espa√ßamentos entre estes autovalores e demonstrar que  
a m√∫sica que eles tocam segue a partitura universal do **Ensemble Ortogonal Gaussiano (GOE)**.

## 2. As Ferramentas do Music√≥logo Espectral

### a) A Distribui√ß√£o dos Espa√ßamentos $P(s)$: A Impress√£o Digital
O histograma dos espa√ßamentos entre autovalores consecutivos, normalizados pela m√©dia, √© a impress√£o digital do sistema.

- **Sistemas Independentes (Poisson)**: Os autovalores n√£o se "importam" uns com os outros e podem se aglomerar. A maior probabilidade  
√© encontrar espa√ßamentos muito pequenos, resultando em uma curva exponencial decrescente.
- **Sistemas Correlacionados (GOE)**: Os autovalores repelem-se; eles evitam ativamente a proximidade excessiva. O resultado √© a famosa  
**Surpresa de Wigner**, uma curva que come√ßa em zero (repuls√£o total em $s=0$), atinge um pico e decai suavemente.



### b) O $\langle r \rangle$-mean: O Term√¥metro da Correla√ß√£o
O $\langle r \rangle$-mean √© a m√©dia da raz√£o entre espa√ßamentos adjacentes. √â um valor escalar que nos diz instantaneamente em que regime  
o sistema opera:

- $\langle r \rangle \approx 0.386$ indica um sistema **Poisson** (sem correla√ß√£o).
- $\langle r \rangle \approx 0.536$ indica um sistema **GOE** (correla√ß√£o m√°xima).

Para garantir o rigor, utilizamos o ***Moving Block Bootstrap* (MBB)** para calcular um intervalo de confian√ßa de $95\%$, permitindo verificar  
se o valor te√≥rico da GOE est√° contido estatisticamente em nossos dados.

### c) A Vari√¢ncia Num√©rica $\Sigma^2(L)$: O Teste de Rigidez
Esta medida testa a "mem√≥ria" de longo alcance do espectro, medindo a vari√¢ncia do n√∫mero de autovalores em janelas de comprimento $L$.

- **Sistemas Poisson**: O espectro √© "fl√°cido". A vari√¢ncia cresce linearmente com a janela ($\Sigma^2(L) \approx L$).
- **Sistemas GOE**: O espectro √© "r√≠gido". Devido √† repuls√£o, os n√≠veis s√£o distribu√≠dos de forma t√£o uniforme que a vari√¢ncia cresce de forma  
muito lenta, **logar√≠tmica** ($\Sigma^2(L) \approx \ln(L)$).



## 3. Laborat√≥rio Interativo: Ouvindo a M√∫sica dos Primos
A c√©lula de c√≥digo abaixo implementa estas ferramentas. Utilize os seletores para variar $N$ e $X_0$ (recomenda-se $X_0 \ge 10^7$ para uma  
visualiza√ß√£o clara da emerg√™ncia da GOE).

**O que observar**:
1. **No gr√°fico $P(s)$**: Veja como o histograma azul se afasta do ru√≠do verde (Poisson) e "veste" a curva vermelha (Wigner/GOE).
2. **No gr√°fico $\langle r \rangle$-mean**: Observe o ponto medido alinhado com a refer√™ncia GOE, validado pelo intervalo de confian√ßa.
3. **No gr√°fico $\Sigma^2(L)$**: Note a "doma" da vari√¢ncia, que abandona a diagonal verde para seguir a trajet√≥ria logar√≠tmica vermelha.

In [1]:
# VERS√ÉO DE REFER√äNCIA CORRIGIDA E OTIMIZADA
# Requisitos: pandas, matplotlib, numpy, ipywidgets
# Execute no Colab ou Jupyter com o kernel correto

import numpy as np
import matplotlib.pyplot as plt
import ipywidgets as widgets
from ipywidgets import interact
import time
from scipy.stats import kstest

# --- 1. FUN√á√ïES OTIMIZADAS DE GERA√á√ÉO DE DADOS ---
def generate_pi_data(n: int) -> np.ndarray:
    """Gera um array com todos os primos at√© n usando um crivo otimizado."""
    if n < 2: return np.array([], dtype=np.int64)
    size = (n - 1) // 2; sieve = np.ones(size, dtype=bool)
    limit = int(np.sqrt(n)) // 2
    for i in range(limit):
        if sieve[i]:
            p = 2 * i + 3; start = (p*p - 3) // 2
            sieve[start::p] = False
    indices = np.where(sieve)[0]; odd_primes = 2 * indices + 3
    return np.concatenate((np.array([2], dtype=np.int64), odd_primes))

def get_delta_pi_for_points(x_points, primes):
    """Calcula ŒîœÄ(x) para um array de pontos x usando uma lista de primos pr√©-calculada."""
    x_int = np.floor(x_points).astype(int)
    pi_x = np.searchsorted(primes, x_int, side='right')
    pi_x_div_2 = np.searchsorted(primes, x_int // 2, side='right')
    return pi_x - 2 * pi_x_div_2

# --- 2. FUN√á√ÉO DA MATRIZ (COM NORMALIZA√á√ÉO) ---
def generate_cos_matrix_from_data(fx_values, x_values):
    fx = fx_values.astype(np.float64); x = x_values.astype(np.float64)
    x[x <= 0] = 1e-12; logx = np.log(x)
    C = np.cos(np.outer(fx, logx)); M = C + C.T
    # Etapa de normaliza√ß√£o crucial que eu havia omitido:
    std_dev = M.std()
    if std_dev > 0: M = (M - M.mean()) / std_dev
    return 0.5 * (M + M.T)

# --- 3. Fun√ß√µes de An√°lise e M√©tricas ---
def local_normalize_spacings(lam, alpha=0.10, w=11):
    lam = np.sort(lam); N = lam.size; k0, k1 = int(alpha*N), int((1-alpha)*N)
    l = lam[k0:k1]; s = np.diff(l); s = s[s>0]
    if len(s) < w: return s / s.mean() if s.mean() > 0 else s
    w = int(w); 
    if w % 2 == 0: w += 1
    pad = w//2; s_pad = np.pad(s, (pad, pad), mode='reflect')
    mu = np.convolve(s_pad, np.ones(w)/w, mode='valid'); return s / mu

def r_mbb_bootstrap(s, B=1000, block_size=16, seed=0):
    rng = np.random.default_rng(seed); n = len(s)
    if n < 2 * block_size: return np.nan, (np.nan, np.nan)
    num_blocks = int(np.ceil(n / block_size)); r_bootstrapped = []
    for _ in range(B):
        start_indices = rng.integers(0, n - block_size + 1, size=num_blocks)
        s_resampled = np.concatenate([s[i:i+block_size] for i in start_indices])[:n]
        if len(s_resampled) < 2: continue
        r_vals = np.minimum(s_resampled[:-1], s_resampled[1:]) / np.maximum(s_resampled[:-1], s_resampled[1:])
        r_bootstrapped.append(np.mean(r_vals))
    if not r_bootstrapped: return np.nan, (np.nan, np.nan)
    mean_r = np.mean(r_bootstrapped); ci_95 = np.percentile(r_bootstrapped, [2.5, 97.5])
    return mean_r, ci_95

def number_variance(lam, alpha=0.10, L_grid=np.linspace(0.5, 15, 30)):
    s_loc = local_normalize_spacings(lam, alpha=alpha)
    if len(s_loc) == 0: return L_grid, np.full_like(L_grid, np.nan)
    x_unfolded = np.concatenate([[0], np.cumsum(s_loc)]); Sigma2 = []
    for L in L_grid:
        counts = [np.searchsorted(x_unfolded, x_unfolded[i0] + L, side='right') - (i0 + 1) for i0 in range(len(x_unfolded)-1)]
        Sigma2.append(np.var(counts) if counts else np.nan)
    return L_grid, np.array(Sigma2)

def r_stat(eigenvalues, alpha=0.10):
    """Calcula a m√©trica <r> para os autovalores."""
    lam = np.sort(eigenvalues)
    k0, k1 = int(alpha*len(lam)), int((1-alpha)*len(lam))
    s = np.diff(lam[k0:k1]); s = s[s > 0]
    if len(s) < 3: return np.nan
    r = np.minimum(s[1:], s[:-1]) / np.maximum(s[1:], s[:-1])
    return r.mean()

def participation_ratio(eigenvectors):
    """Calcula o Participation Ratio para uma matriz de autovetores."""
    return 1 / np.sum(eigenvectors**4, axis=0)

# --- 4. A FUN√á√ÉO INTERATIVA PRINCIPAL ---
def eigenvalue_lab(N=2048, log_X0=8, scale_type='Logar√≠tmica', span=4.0, jitter=1e-8, alpha=0.05):
    
    X0 = int(10**log_X0)
    
    # --- 1. Gera√ß√£o da Matriz ---
    print(f"Construindo M para N={N}, X0={X0:g} (escala {scale_type})...")
    if scale_type == 'Logar√≠tmica':
        x_vals = np.exp(np.linspace(np.log(X0) - span/2, np.log(X0) + span/2, N))
        if jitter > 0:
            rng = np.random.default_rng(0)
            x_vals *= (1.0 + rng.uniform(-jitter, jitter, size=x_vals.shape))
        
        # Garante que os valores de x sejam √∫nicos, removendo duplicatas
        x_vals = np.unique(np.floor(x_vals))
        # ------------------------------------
        # Atualiza N para o n√∫mero real de pontos √∫nicos
        N = len(x_vals)
    elif scale_type == 'Linear':
        x_vals = np.arange(X0, X0 + N)
    else:
        print("Tipo de escala inv√°lido."); return

    max_x_needed = int(np.ceil(x_vals.max()))
    pi_x_full = generate_pi_data(max_x_needed)
    fx_vals = get_delta_pi_for_points(x_vals, pi_x_full)
    M = generate_cos_matrix_from_data(fx_vals, x_vals)
    
    # --- 5. C√°lculo de Autovalores e Autovetores ---
    lam, v = np.linalg.eigh(M)
    
    # --- 6. C√ÅLCULO E IMPRESS√ÉO DAS M√âTRICAS ---
    r_mean = r_stat(lam, alpha=alpha)
    pr_values = participation_ratio(v)
    pr_n_mean = np.mean(pr_values / N)

    print("\n----------------------------------------------------------------")
    print(f"  RESULTADOS: M√âTRICAS PARA X‚ÇÄ=10^{log_X0} e N={N} ({scale_type})")
    print("----------------------------------------------------------------")
    print(f"  Autovalores -> <r> m√©dio:")
    print(f"    - Medido:        {r_mean:.4f}")
    print(f"    - Te√≥rico (GOE):     ~0.536")
    print(f"    - Te√≥rico (Poisson): ~0.386")
    print("\n")
    print(f"  Autovetores -> PR/N m√©dio:")
    print(f"    - Medido:        {pr_n_mean:.4f}")
    print(f"    - Te√≥rico (GOE):     ~0.333")
    print(f"    - Te√≥rico (Poisson): ~1/N (‚Üí 0)")
    print("----------------------------------------------------------------\n")
    
    # --- 7. An√°lises e Plots ---
    plt.style.use('seaborn-v0_8-whitegrid')
    fig, axes = plt.subplots(1, 3, figsize=(18, 5))
    
    k0, k1 = int(alpha*N), int((1-alpha)*N)
    bulk_lam = np.sort(lam)[k0:k1]
    s = np.diff(bulk_lam); s = s[s>0]
    if s.size > 1:
        s_unfolded = s / s.mean()
        axes[0].hist(s_unfolded, bins=75, density=True, alpha=0.7, label=f'Dados (N={N})')
    
    s_grid = np.linspace(0, 4, 200)
    pdf_goe = (np.pi * s_grid / 2) * np.exp(-np.pi * s_grid**2 / 4)
    axes[0].plot(s_grid, pdf_goe, 'r--', lw=2, label='Teoria GOE (Wigner)')
    pdf_poisson = np.exp(-s_grid)
    axes[0].plot(s_grid, pdf_poisson, 'g:', lw=2, label='Teoria Poisson')
    axes[0].set_title('a) Distribui√ß√£o P(s)', fontsize=14)
    axes[0].set_xlabel('s (Espa√ßamento Normalizado)'); axes[0].set_ylabel('Densidade'); axes[0].legend(loc='upper left')
    axes[0].set_xlim(0, 4)

    mean_r_boot, ci = r_mbb_bootstrap(s)
    if not np.isnan(mean_r_boot):
        ci_low, ci_high = ci
        axes[1].errorbar([0], [mean_r_boot], yerr=[[mean_r_boot - ci_low], [ci_high - ci_low]], fmt='o', capsize=5, label='<r> Medido (com IC 95%)')
    axes[1].axhline(0.5359, ls='--', color='red', label='Te√≥rico GOE ‚âà 0.536')
    axes[1].axhline(0.3863, ls=':', color='green', label='Te√≥rico Poisson ‚âà 0.386')
    axes[1].set_title('b) M√©dia <r>', fontsize=14)
    axes[1].set_ylabel('Valor de <r>'); axes[1].set_xticks([]); axes[1].legend(loc='center left')
    
    L_grid, Sigma2 = number_variance(lam, alpha=alpha)
    axes[2].plot(L_grid, Sigma2, 'o-', label='Dados')
    axes[2].plot(L_grid, L_grid, 'g:', lw=2, label='Te√≥rico Poisson (L)')
    axes[2].plot(L_grid, (2/(np.pi**2)) * np.log(L_grid) + 0.44, 'r--', lw=2, label='Te√≥rico GOE (log L)')
    axes[2].set_title('c) Vari√¢ncia Num√©rica Œ£¬≤(L)', fontsize=14)
    axes[2].set_xlabel('L'); axes[2].set_ylabel('Œ£¬≤(L)'); axes[2].legend(loc='upper left')
    
    fig.tight_layout(pad=2.0)
    plt.show()

# --- Cria o Widget Interativo ---
interact(eigenvalue_lab, 
         N=widgets.Dropdown(options=[512, 1024, 2048], value=2048, description='N:'),
         log_X0=widgets.IntSlider(min=3, max=8, step=1, value=5, description='X‚ÇÄ=10^', continuous_update=False),
         scale_type=widgets.ToggleButtons(options=['Logar√≠tmica', 'Linear'], description='Escala:'),
         span=widgets.FloatSlider(min=1.0, max=4.0, step=0.1, value=4.0, description='Span:'),
         jitter=widgets.FloatLogSlider(min=-8, max=-3, step=0.1, value=1e-8, description='Jitter:'),
         alpha=widgets.FloatSlider(min=0.05, max=0.25, step=0.01, value=0.05, description='Œ± (bulk):')
        );

interactive(children=(Dropdown(description='N:', index=2, options=(512, 1024, 2048), value=2048), IntSlider(va‚Ä¶

## 4. Gloss√°rio de Par√¢metros: Ajustando o Foco do Espectr√¥metro

Para extrair a ‚Äúm√∫sica‚Äù da GOE da nossa matriz $M$, n√£o basta constru√≠-la; √© preciso observ√°-la da maneira certa. Os par√¢metros  
`span`, `jitter` e `alpha` funcionam como os ajustes de foco e sensibilidade do nosso **‚Äúespectr√¥metro harm√¥nico‚Äù**. Compreender  
o papel de cada um √© essencial para ouvir o cosmos aritm√©tico com clareza.

---

### üîπ O que √© `span`? ‚Äî *A Lente: Panor√¢mica vs. Microsc√≥pio*

O `span` (amplitude) controla a **largura da janela de observa√ß√£o** na escala logar√≠tmica. Ele define quantos ‚Äúvales‚Äù e ‚Äúplanaltos‚Äù  
da fun√ß√£o $\Delta\pi(x)$ entram na constru√ß√£o da matriz. √â o par√¢metro mais sens√≠vel e, em muitos experimentos, o que determina se  
veremos um ru√≠do amorfo ou uma sinfonia perfeita.

> **A experi√™ncia decisiva:**
> * Com `span = 2.4`, o sistema produz m√©tricas pr√≥ximas da GOE.
> * Com `span = 4.0`, a harmonia se completa: em $X_0 = 10^5$, o valor medido √© $0.536$, id√™ntico √† teoria.

Isso demonstra que a assinatura GOE pode emergir em escalas menores do que o esperado ($X_0 = 10^5$), desde que a **varia√ß√£o interna  
capturada** (`span`) seja suficiente para representar a complexidade do sinal $\Delta\pi(x)$. Quanto maior o `span`, mais o espelho  
logar√≠tmico reflete a estrutura total da contagem dos primos.

**Resumo:** `span` √© o ajuste de campo ‚Äî a lente que permite enxergar a resson√¢ncia completa da aritm√©tica.

---

### üîπ O que √© `jitter`? ‚Äî *A Quebra de Simetria e a Prova do Determinismo*

O `jitter` introduz uma perturba√ß√£o min√∫scula nas posi√ß√µes $x$ amostradas, quebrando as simetrias r√≠gidas da grade de amostragem.

* Ele impede que artefatos num√©ricos (aliasing) imitem padr√µes falsos de coer√™ncia.
* O experimento com `jitter = 1e‚àí8` mostrou algo fundamental: mesmo com a aleatoriedade externa virtualmente eliminada, a estrutura GOE  
**permanece intacta**.

> **Conclus√£o experimental:**
> O `jitter` n√£o *cria* o caos harm√¥nico; ele apenas o revela mais nitidamente ao limpar "ecos" da r√©gua de amostragem. Isso demonstra  
> que a correla√ß√£o entre autovalores √© **determin√≠stica**, n√£o estat√≠stica. O caos qu√¢ntico emerge da pr√≥pria aritm√©tica, sem precisar  
> de interfer√™ncias externas.

**Resumo:** `jitter` √© a respira√ß√£o m√≠nima do sistema ‚Äî √∫til para remover artefatos de grade, mas n√£o essencial √† harmonia intr√≠nseca.

---

### üîπ O que √© `bulk` (via `alpha`)? ‚Äî *O Cora√ß√£o do Espectro*

O par√¢metro `alpha` define a fra√ß√£o de descarte nas extremidades do espectro ‚Äî isolando o `bulk`, o miolo onde a universalidade se manifesta  
sem as distor√ß√µes das bordas da matriz. Com $\alpha = 0.05$, removemos 5% de cada lado para observar os **90% centrais** dos autovalores ‚Äî a  
regi√£o mais est√°vel e pura.

> Mesmo com essa vasta maioria sob an√°lise, as m√©tricas GOE se preservam. O n√∫cleo j√° cont√©m a totalidade da estrutura harm√¥nica necess√°ria  
> para o reconhecimento da classe universal.

Em termos f√≠sicos, √© como se o campo de simetria da GOE estivesse completamente formado dentro de um √∫nico "acorde central", n√£o dependendo das  
bordas para ser validado.

**Resumo:** `alpha` define o cora√ß√£o do espectro ‚Äî o intervalo onde o n√∫mero fala a l√≠ngua da universalidade.

---

### üîπ S√≠ntese Final

Com `span = 4`, `jitter = 1e‚àí8` e $\alpha = 0.05$, observamos a **GOE emergir com precis√£o absoluta** j√° em $X_0 = 10^5$. Isso significa que o caos  
harm√¥nico √© **imediato**: o universo aritm√©tico n√£o precisa de vastid√£o infinita para se comportar como o cosmos qu√¢ntico ‚Äî ele j√° cont√©m, em janelas  
finitas, o reflexo completo da Unidade.