# Median Binomial Based

In [None]:
import numpy as np
from scipy.stats import binom

x = np.array([2.10, 2.35, 2.35, 3.10, 3.10, 3.15, 3.90, 3.90, 4.00, 4.80,
              5.00, 5.00, 5.15, 5.35, 5.50, 6.00, 6.00, 6.25, 6.45])

x_sorted = np.sort(x)
n = len(x)

print(f"Número de observações (n): {n}")
print(f"Valores ordenados: {x_sorted.tolist()}")

print("\nCalculando intervalos de confiança aproximados para a mediana usando o método exato Binomial:")

best_k = None
best_coverage = 0
target_coverage = 0.95
chosen_interval = None

for k in range(n//2 + 1, 1, -1):
    coverage = 1 - 2 * binom.cdf(k-1, n, 0.5)
    lower = x_sorted[k-1]
    upper = x_sorted[n-k]
    print(f"\nk = {k}:")
    print(f"  Cobertura estimada: {coverage:.4%}")
    print(f"  Intervalo de confiança: ({lower}, {upper})")
    if best_k is None and coverage >= target_coverage:
        best_k = k
        best_coverage = coverage
        chosen_interval = (lower, upper)

if chosen_interval is not None:
    print(f"\nIntervalo recomendado (~95%) para a mediana:")
    print(f"  k = {best_k}")
    print(f"  Cobertura real: {best_coverage:.4%}")
    print(f"  Intervalo: ({chosen_interval[0]}, {chosen_interval[1]})")
else:
    print("\nNenhum intervalo encontrado com cobertura ≥ 95%.")

Número de observações (n): 19
Valores ordenados: [2.1, 2.35, 2.35, 3.1, 3.1, 3.15, 3.9, 3.9, 4.0, 4.8, 5.0, 5.0, 5.15, 5.35, 5.5, 6.0, 6.0, 6.25, 6.45]

Calculando intervalos de confiança aproximados para a mediana usando o método exato Binomial:

k = 10:
  Cobertura estimada: 0.0000%
  Intervalo de confiança: (4.8, 4.8)

k = 9:
  Cobertura estimada: 35.2394%
  Intervalo de confiança: (4.0, 5.0)

k = 8:
  Cobertura estimada: 64.0717%
  Intervalo de confiança: (3.9, 5.0)

k = 7:
  Cobertura estimada: 83.2932%
  Intervalo de confiança: (3.9, 5.15)

k = 6:
  Cobertura estimada: 93.6432%
  Intervalo de confiança: (3.15, 5.35)

k = 5:
  Cobertura estimada: 98.0789%
  Intervalo de confiança: (3.1, 5.5)

k = 4:
  Cobertura estimada: 99.5575%
  Intervalo de confiança: (3.1, 6.0)

k = 3:
  Cobertura estimada: 99.9271%
  Intervalo de confiança: (2.35, 6.0)

k = 2:
  Cobertura estimada: 99.9924%
  Intervalo de confiança: (2.35, 6.25)

Intervalo recomendado (~95%) para a mediana:
  k = 5
  Cobertu

# Median Normal Based

In [None]:
import numpy as np
from scipy.stats import norm

x = np.array([325, 325, 334, 339, 356, 356, 359, 359, 363, 364, 364, 366, 369, 370, 373, 373, 374, 375, 389, 392, 393, 394, 397, 402, 403, 424])
x_sorted = np.sort(x)
n = len(x)

print(f"Número de observações (n): {n}")
print(f"Valores ordenados: {x_sorted.tolist()}")

k1 = 7
k2 = 19

p = 0.5
mu = n * p
sigma2 = n * p * (1 - p)
sigma = np.sqrt(sigma2)

print("\nNeste caso, para estimar a confiança de um intervalo de ordem para a mediana usando a aproximação normal da binomial:")
print(f"  μ = np = {n} × {p} = {mu}")
print(f"  σ² = np(1-p) = {n} × {p} × (1-{p}) = {sigma2:.2f}")

a = k1 - 0.5
b = k2 - 0.5

z_lower = (a - mu) / sigma
z_upper = (b - mu) / sigma

p_lower = norm.cdf(z_lower)
p_upper = norm.cdf(z_upper)
conf_coeff = p_upper - p_lower


lower = x_sorted[k1-1]
upper = x_sorted[k2-1]

print(f"\nPodemos estar aproximadamente {conf_coeff*100:.1f}% confiantes de que a mediana populacional está no intervalo ({lower}, {upper}).")

Número de observações (n): 26
Valores ordenados: [325, 325, 334, 339, 356, 356, 359, 359, 363, 364, 364, 366, 369, 370, 373, 373, 374, 375, 389, 392, 393, 394, 397, 402, 403, 424]

Neste caso, para estimar a confiança de um intervalo de ordem para a mediana usando a aproximação normal da binomial:
  μ = np = 26 × 0.5 = 13.0
  σ² = np(1-p) = 26 × 0.5 × (1-0.5) = 6.50

Podemos estar aproximadamente 97.9% confiantes de que a mediana populacional está no intervalo (359, 389).


# Percentile Binomial Based

In [23]:
import numpy as np
from scipy.stats import binom

x = np.array([325, 325, 334, 339, 356, 356, 359, 359, 363, 364, 364, 366, 369, 370, 373, 373, 374, 375, 389, 392, 393, 394, 397, 402, 403, 424])
x_sorted = np.sort(x)
n = len(x)

print(f"Número de observações (n): {n}")
print(f"Valores ordenados: {x_sorted.tolist()}")

p = 0.75
k_lower = 16
k_upper = 24

percentil_continuo = p * (n + 1)
indice_int = int(np.floor(percentil_continuo))
peso_superior = percentil_continuo - indice_int
peso_inferior = 1 - peso_superior

if indice_int <= 0:
    ponto_percentil = x_sorted[0]
elif indice_int >= n:
    ponto_percentil = x_sorted[-1]
else:
    y_inf = x_sorted[indice_int - 1]
    y_sup = x_sorted[indice_int]
    ponto_percentil = peso_inferior * y_inf + peso_superior * y_sup

print(f"\nEstimativa pontual do {int(p*100)}º percentil: {ponto_percentil:.2f}")

limite_inferior = x_sorted[k_lower - 1]
limite_superior = x_sorted[k_upper - 1]
print(f"\nIntervalo de confiança proposto: ({limite_inferior}, {limite_superior}) = (y_{k_lower}, y_{k_upper})")

w_inf = k_lower - 1
w_sup = k_upper - 1

p_le_sup = binom.cdf(w_sup, n, p)
p_le_inf = binom.cdf(w_inf, n, p)
confidence = p_le_sup - p_le_inf

print(f"P(W ≤ {w_sup}) = {p_le_sup:.4f}")
print(f"P(W ≤ {w_inf}) = {p_le_inf:.4f}")
print(f"Coeficiente de confiança exato: {confidence:.4f}")

print(f"\nPodemos estar {confidence*100:.1f}% confiantes de que o {int(p*100)}º percentil populacional está no intervalo ({limite_inferior}, {limite_superior}).")

Número de observações (n): 26
Valores ordenados: [325, 325, 334, 339, 356, 356, 359, 359, 363, 364, 364, 366, 369, 370, 373, 373, 374, 375, 389, 392, 393, 394, 397, 402, 403, 424]

Estimativa pontual do 75º percentil: 392.25

Intervalo de confiança proposto: (373, 402) = (y_16, y_24)
P(W ≤ 23) = 0.9742
P(W ≤ 15) = 0.0401
Coeficiente de confiança exato: 0.9341

Podemos estar 93.4% confiantes de que o 75º percentil populacional está no intervalo (373, 402).


# Percentile Normal Based

In [6]:
import numpy as np
from scipy.stats import norm

x = np.array([325, 325, 334, 339, 356, 356, 359, 359, 363, 364, 364, 366, 369, 370, 373, 373, 374, 375, 389, 392, 393, 394, 397, 402, 403, 424])
x_sorted = np.sort(x)
n = len(x)

print(f"Número de observações (n): {n}")
print(f"Valores ordenados: {x_sorted.tolist()}")

# Defina o percentil de interesse (exemplo: p = 0.75 para o 75º percentil)
percentil = 0.75
p = percentil

# Ponto estimado do percentil pela interpolação (quando necessário)
percentil_continuo = 1 + (n - 1) * p
indice_inferior = int(np.floor(percentil_continuo))
indice_superior = int(np.ceil(percentil_continuo))
peso_superior = percentil_continuo - indice_inferior
peso_inferior = 1 - peso_superior

if indice_inferior == indice_superior:
    ponto_percentil = x_sorted[indice_inferior - 1]
else:
    ponto_percentil = x_sorted[indice_inferior - 1] * peso_inferior + x_sorted[indice_superior - 1] * peso_superior

print(f"\nEstimativa pontual do {int(p*100)}º percentil: {ponto_percentil}")

# Para intervalo de confiança, escolha índices para estatísticas de ordem (ajuste conforme desejado)
# Exemplo seguindo a referência: para n=26, p=0.75, usar 16 e 24 (ou seja, y_16 e y_24)
# Atenção: índices baseados em 1
k_lower = 16
k_upper = 24

# Média e variância da binomial usando p desejado para percentil
mu = n * p
sigma2 = n * p * (1 - p)
sigma = np.sqrt(sigma2)
print("\nPara o intervalo de confiança do percentil usando aproximação normal da binomial:")
print(f"  μ = np = {n} × {p} = {mu}")
print(f"  σ² = np(1-p) = {n} × {p} × (1-{p}) = {sigma2:.3f}")

# Limites do intervalo
a = k_lower - 0.5
b = k_upper - 0.5

z_lower = (a - mu) / sigma
z_upper = (b - mu) / sigma

p_lower = norm.cdf(z_lower)
p_upper = norm.cdf(z_upper)
conf_coeff = p_upper - p_lower

# Encontre os valores nas posições escolhidas
lower = x_sorted[k_lower - 1]
upper = x_sorted[k_upper - 1]

print(f"\nPodemos estar aproximadamente {conf_coeff:.2%} confiantes de que o {int(p*100)}º percentil populacional está no intervalo ({lower}, {upper}).")

Número de observações (n): 26
Valores ordenados: [325, 325, 334, 339, 356, 356, 359, 359, 363, 364, 364, 366, 369, 370, 373, 373, 374, 375, 389, 392, 393, 394, 397, 402, 403, 424]

Estimativa pontual do 75º percentil: 391.25

Para o intervalo de confiança do percentil usando aproximação normal da binomial:
  μ = np = 26 × 0.75 = 19.5
  σ² = np(1-p) = 26 × 0.75 × (1-0.75) = 4.875

Podemos estar aproximadamente 93.00% confiantes de que o 75º percentil populacional está no intervalo (373, 402).
