# 8 · A Ótica Adequada: Por Que a Escala Logarítmica É Estrutural

**Registro observacional associado ao livro**  
*Descobrindo o Caos nos Números Primos — Investigações Computacionais sob o Espelho de Euler*  
© Alvaro Costa, 2025  

Este notebook faz parte de uma sequência canônica de registros computacionais. Ele não introduz hipóteses, conjecturas ou modelos interpretativos novos.

Seu objetivo é exclusivamente **registrar** o comportamento de estruturas aritméticas sob um regime de observação explícito, determinístico e reproduzível.

A leitura conceitual completa encontra-se no livro. Este notebook documenta apenas o experimento correspondente.

**Licença:** Creative Commons BY–NC–ND 4.0  
É permitida a leitura, execução e citação. Não é permitida a modificação, redistribuição adaptada ou uso comercial independente.


---

## 1. Distintos regimes estatísticos sob diferentes métricas de observação

Nos capítulos anteriores, foi observada a emergência de estatísticas compatíveis com a GOE a partir do operador $M$. Uma análise adicional revela, no entanto, um ponto crucial: **o regime estatístico observado depende da métrica de amostragem adotada na reta numérica**.

Quando os pontos $x_i$ são amostrados de forma **linear**, o espectro de $M$ apresenta estatísticas compatíveis com um regime **Poisson**. Quando a amostragem é feita de forma **logarítmica**, mantendo fixa a construção do operador e a região aritmética analisada, emerge claramente um regime **correlacionado**, compatível com a estatística **GOE**.

Este contraste não é um artefato numérico. Ele reflete a dependência explícita entre o operador construído e a métrica de observação utilizada.

---

## 2. Métrica de observação e escala natural dos primos

A densidade assintótica dos números primos é governada pela relação
$$
\pi(x) \sim \frac{x}{\ln x},
$$
o que indica que a escala natural associada à distribuição dos primos é **logarítmica**, e não linear.

Consequentemente, a escolha da métrica de amostragem atua como um filtro estrutural:  
- métricas compatíveis com a escala logarítmica preservam as variações relevantes do sinal aritmético;
- métricas incompatíveis tendem a suprimir correlações de longo alcance.

Assim, diferentes estratégias de amostragem correspondem a diferentes regimes de observação do *mesmo* operador.

---

## 3. Amostragem logarítmica e regime correlacionado

Quando os pontos $x_i$ são distribuídos uniformemente em $\ln x$, a amostragem permanece coerente com a estrutura multiplicativa implícita no operador $M$.

- **Efeito sobre $\Delta_\pi(x)$:**  
  As flutuações do sinal são amostradas de forma equilibrada ao longo da escala, preservando sua variabilidade estrutural.

- **Consequência espectral:**  
  A matriz $M$ resultante apresenta alta complexidade interna, e o espectro exibe repulsão de níveis característica de estatísticas correlacionadas, compatíveis com a classe **GOE (Gaussian Orthogonal Ensemble)**.

---

## 4. Amostragem linear e regime não correlacionado

Quando os pontos $x_i$ são distribuídos uniformemente em $x$, a amostragem ignora a escala logarítmica subjacente à distribuição dos primos.

- **Efeito sobre $\Delta_\pi(x)$:**  
  Em janelas lineares restritas, o sinal varia lentamente e apresenta flutuações aproximadamente independentes.

- **Consequência espectral:**  
  A matriz $M$ construída nesse regime possui menor variabilidade efetiva, e o espectro resultante é compatível com estatísticas de eventos independentes, isto é, um regime **Poisson**.

---

## 5. Comparação entre regimes de observação

| Característica | Amostragem Linear | Amostragem Logarítmica |
|---------------|------------------|------------------------|
| Métrica de amostragem | Linear em $x$ | Uniforme em $\ln x$ |
| Compatibilidade com $\pi(x)$ | Baixa | Alta |
| Variabilidade de $\Delta_\pi(x)$ | Localmente reduzida | Estruturalmente preservada |
| Complexidade do operador $M$ | Baixa | Elevada |
| Estatística espectral | Poisson | GOE |

---

## 6. Normalização local e verificação do regime Poisson

No regime linear, pequenas variações residuais da densidade espectral podem obscurecer a identificação do comportamento Poisson.

A função `local_normalize_spacings` aplica uma normalização local dos espaçamentos espectrais, compensando variações suaves da densidade média.

Este procedimento:
- **não introduz correlação**;
- **não altera o operador**;
- apenas remove efeitos de escala que poderiam mascarar o regime estatístico subjacente.

Após essa normalização, a distribuição Poisson emerge de forma nítida, confirmando que se trata de uma **propriedade observacional do sistema sob esta métrica**, e não de um artefato computacional.


In [1]:
# Requisitos: pandas, matplotlib, numpy, ipywidgets

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import ipywidgets as widgets
from ipywidgets import interact
import time

# --- Funções de Geração de Dados e Matriz ---
def generate_pi_data(n: int) -> np.ndarray:
    """Gera um array com todos os primos até n usando um crivo otimizado."""
    if n < 2: return np.array([], dtype=np.int64)
    size = (n - 1) // 2; sieve = np.ones(size, dtype=bool)
    limit = int(np.sqrt(n)) // 2
    for i in range(limit):
        if sieve[i]:
            p = 2 * i + 3; start = (p*p - 3) // 2
            sieve[start::p] = False
    indices = np.where(sieve)[0]; odd_primes = 2 * indices + 3
    return np.concatenate((np.array([2], dtype=np.int64), odd_primes))

def get_delta_pi_for_points(x_points, primes):
    """Calcula Δπ(x) para um array de pontos x usando uma lista de primos pré-calculada."""
    x_int = np.floor(x_points).astype(int)
    pi_x = np.searchsorted(primes, x_int, side='right')
    pi_x_div_2 = np.searchsorted(primes, x_int // 2, side='right')
    return pi_x - 2 * pi_x_div_2
    
def generate_cos_matrix(fx_values, x_values):
    """Gera a matriz M a partir dos vetores F(x) e x."""
    fx = fx_values.astype(np.float64); x = x_values.astype(np.float64)
    x[x <= 0] = 1e-12; logx = np.log(x)
    C = np.cos(np.outer(fx, logx)); M = C + C.T
    std_dev = M.std()
    if std_dev > 0:
        M -= M.mean()
        M /= std_dev
    return 0.5 * (M + M.T)

# bulk fixo em 90% central (alpha = 0.10)
# janela local fixa para unfolding (não otimizada) w = 21
def local_normalize_spacings(lam, alpha=0.10, w=21):
    """
    Normaliza os espaçamentos pela sua média local (unfolding).
    Esta é a chave para visualizar corretamente a estatística de Poisson.
    """
    N = lam.size
    # Pega o "bulk" (meio) do espectro para evitar efeitos de borda
    k0, k1 = int(alpha * N), int((1 - alpha) * N)
    lam_bulk = np.sort(lam)[k0:k1]
    
    s = np.diff(lam_bulk)
    s = s[s > 0]
    
    if len(s) < w: return s / s.mean() if s.mean() > 0 else s

    # Usa uma média móvel para encontrar a densidade local de estados
    w = int(w)
    if w % 2 == 0: w += 1 # A janela deve ser ímpar
    pad = w // 2
    s_padded = np.pad(s, (pad, pad), mode='reflect')
    local_mean = np.convolve(s_padded, np.ones(w)/w, mode='valid')
    
    # Evita divisão por zero
    local_mean[local_mean == 0] = 1.0
    
    return s / local_mean

# --- A Função Interativa Principal ---
def scale_comparison_lab(N=2048, log_X0=8, span=2.4):
    
    X0 = int(10**log_X0)
    
    # --- Preparação dos Dados ---
    max_x_log = int(np.ceil(X0 * np.exp(span/2)))
    max_x_linear = X0 + N
    max_x_needed = max(max_x_log, max_x_linear)
    pi_x_full = generate_pi_data(max_x_needed)

    fig, axes = plt.subplots(1, 2, figsize=(16, 6), sharey=True) 
    
    # --- Gráfico da Esquerda: Amostragem Linear (Poisson) ---
    print("\n--- Processando Escala Linear ---")
    x_linear = np.arange(X0, X0 + N)
    fx_linear = get_delta_pi_for_points(x_linear, pi_x_full)
    
    M_linear = generate_cos_matrix(fx_linear, x_linear)
    lam_linear, _ = np.linalg.eigh(M_linear)
    # USA A NORMALIZAÇÃO LOCAL PARA OBTER POISSON
    s_unfolded_linear = local_normalize_spacings(lam_linear)

    # --- Gráfico da Direita: Amostragem Logarítmica (GOE) ---
    print("\n--- Processando Escala Logarítmica ---")
    x_log = np.exp(np.linspace(np.log(X0) - span/2, np.log(X0) + span/2, N))
    fx_log = get_delta_pi_for_points(x_log, pi_x_full)

    M_log = generate_cos_matrix(fx_log, x_log)
    lam_log, _ = np.linalg.eigh(M_log)
    # Para GOE, a normalização pela média global já funciona bem
    s_log = np.diff(np.sort(lam_log)); s_log = s_log[s_log > 0]
    s_unfolded_log = s_log / s_log.mean()

    # --- Plots Comparativos ---
    s_grid = np.linspace(0, 4, 200)
    pdf_goe = (np.pi * s_grid / 2) * np.exp(-np.pi * s_grid**2 / 4)
    pdf_poisson = np.exp(-s_grid)
    
    # Plot da Esquerda
    ax = axes[0]
    ax.hist(s_unfolded_linear, bins='auto', density=True, alpha=0.75, label='Dados (Linear)')
    ax.plot(s_grid, pdf_goe, 'r--', lw=2, label='Teoria GOE')
    ax.plot(s_grid, pdf_poisson, 'g:', lw=3, label='Teoria Poisson')
    ax.set_title(f'a) Escala Linear → Regime Não Correlacionado', fontsize=14)
    ax.set_xlabel('s (Espaçamento Normalizado Localmente)'); ax.set_ylabel('Densidade')
    ax.set_xlim(0, 4); ax.legend(loc='upper right')
    
    # Plot da Direita
    ax = axes[1]
    ax.hist(s_unfolded_log, bins='auto', density=True, alpha=0.75, label='Dados (Log)')
    ax.plot(s_grid, pdf_goe, 'r--', lw=2, label='Teoria GOE')
    ax.plot(s_grid, pdf_poisson, 'g:', lw=3, label='Teoria Poisson')
    ax.set_title(f'b) Escala Logarítmica → Regime Correlacionado', fontsize=14)
    ax.set_xlabel('s (Espaçamento Normalizado Globalmente)'); ax.legend(loc='upper right')
    ax.set_xlim(0, 4)
    
    fig.suptitle(f"Comparação Visual do Efeito da Escala em X₀ = {X0:g}", fontsize=18, weight='bold')
    fig.tight_layout(rect=[0, 0, 1, 0.96])
    plt.show()

# --- Widget Interativo ---
interact(scale_comparison_lab, 
         N=widgets.Dropdown(options=[512, 1024, 2048], value=2048, description='N:'),
         log_X0=widgets.IntSlider(min=5, max=8, step=1, value=8, description='X₀=10^', continuous_update=False),
         span=widgets.FloatSlider(min=1.0, max=4.0, step=0.1, value=2.4, description='Span (Log):')
        );


interactive(children=(Dropdown(description='N:', index=2, options=(512, 1024, 2048), value=2048), IntSlider(va…

---

## 7. Observação final

O contraste entre estatísticas Poisson e GOE não indica a presença de dois sistemas distintos, mas reflete a dependência da estatística espectral em relação à **adequação entre o operador e a métrica de observação**.

No próximo notebook, será analisada de forma mais detalhada a estrutura matemática que torna a amostragem logarítmica não apenas conveniente, mas necessária para a observação de correlações espectrais de longo alcance neste operador.
