In [None]:
import sys, os
from scipy import stats
import numpy as np
import pandas as pd

from scipy import stats

sys.path.insert(1, '../src/')
from stat_lib import *

import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline

## SEM - Erro Padrão da Média (ou Standard Error of the Mean)

O **Erro Padrão da Média (SEM)** mede a **precisão da média amostral como estimativa da verdadeira média populacional**. Ele reflete a **variabilidade esperada entre médias de diferentes amostras**, e não a variabilidade dos dados individuais.

$SEM = SSD / \sqrt{N_{amostral}}$

**Interpretação**

  - Um SEM baixo indica que a média amostral é uma estimativa mais precisa da média populacional.
  - O SEM descreve incerteza do estimador (média), não a dispersão dos dados.

**Cuidado**

  - Aumentando-se o N o SSD tende a $\sigma$ - ou seja, o desvio padrão nunca decresce
  - À medida que o tamanho amostral (N) aumenta, o SEM diminui, mesmo que a variabilidade dos dados (SD) permaneça a mesma.
  - Não use o SEM para mostrar a barra de erro.


## O intervalo de confiança (IC)

O intervalo de confiança (IC ou Confidence Interval) é uma faixa de valores, calculada a partir de dados amostrais, que estima-se que contém o verdadeiro valor de um parâmetro populacional (como média ou proporção) dado um determinado nível de probabilidade (ex: 95% ou 99%).

$IC = <x> ± t_{α/2} * SEM$

IC(nível=95%) = \[valor inferiro, valor superior]

No nosso exemplo, a seguir, pacientes diabéticos são tratados e o intervalor de confiança calculado para 2 amostras indpenedentes (antes e depois do tratamento):

IC(nível=95%) = \[-40.80, -20.56] mg/dl

ou seja, há 95% de acharmos que o estimador de diminuição de glicemia esteja entre -40 e 20 mg/dl, aproximadamente.

**Principais Conceitos**

  - **Nível de Confiança** (usualmente 95% ou 99%): É a probabilidade de que o intervalo construído contenha o parâmetro real, indicando que, se o estudo for repetido várias vezes, 95% ou 99% dos intervalos conterão o parâmetro verdadeiro.
  - **Margem de Erro**: Define a amplitude do intervalo ao redor da estimativa pontual, influenciada pelo desvio padrão e tamanho da amostra.
  - **Interpretação**: Um IC 95%, IC = diminuição de glicemia entre \[-40.80, -20.56] mg/dl com um SEM=5.01, significa que, com 95% de confiança, o parâmetro real da população - média de diminuição da glicemia pós-tratamento- está enter -40 e 20 mgdl.
  - **Nível de confiança altos**: Aumentando-se o nível de confiança (90% para 95% para 99%) gera-se intervalos mais largos de forma a assegurar alta confiabilidade.
  - **Amostras Grandes**: Amostras maiores tendem a gerar intervalos menores (mais estreitos) e, ou seja, N grandes geram uma maior precisão.
  - Recomenda-se MUITO apresentar a barra de erro usando-se o IC (intervalo de confiança)

O intervalo de confiança é fundamental na estatística inferencial para avaliar a credibilidade e precisão de pesquisas, permitindo tomar decisões baseadas em dados. Sempre que possível apresente este resultado ao final de seu teste estatístico.

### Comparando-se o mesmo grupo duas vezes (pareado)

Vamos supor que temos um grupo de pacientes que vão ser medicados. Medimos um determinado marcador (p.ex. glicemia) antes da medicação e depois da medicação. ** Desenho experimental e cálculo de número amostral (N).

A principal pergunta: - O medicmaento fez efeito

Caso a distribuição do biomarcador seja normal, podemos fazer o teste t-student para comparar os dois grupos.

Glicose no sangue (mg/dl)
  - normal: < 99 mg/dl
  - pré-diabético: [100, 125] mg/dl
  - diabético: > 125 mg/dl

In [None]:
d = sns.load_dataset("tips")
d.head()

In [None]:
ax = sns.displot(data=d, x = "total_bill", kde=True)

In [None]:
penguins = sns.load_dataset("penguins")
penguins.head(3)

In [None]:
sns.displot(penguins, x="flipper_length_mm", hue="species", kind="kde", fill=True);

In [None]:
MU1 = 140; SSD1 = 15
MU2 = 110; SSD2 = 25
N   = 30

samp1 = np.random.normal(loc=MU1, scale=SSD1, size=N)
samp2 = np.random.normal(loc=MU2, scale=SSD2, size=N)

mu1 = np.mean(samp1); ssd1 = np.std(samp1)
mu2 = np.mean(samp2); ssd2 = np.std(samp2)

df = join_series(samp1, samp2)

sns.displot(df, x="vals", hue="grupo", kind="kde", fill=True, height=4, aspect=1.4)

title = 'Distância entre distribuições'
title += f'\nnão medicados têm média {mu1:.1f} ({ssd1:.1f})'
title += f'\nmedicados têm média {mu2:.1f} ({ssd2:.1f})'
plt.title(title);

In [None]:
g = sns.displot(df, x="vals", hue="grupo", kind="kde", rug=True, fill=True, height=4, aspect=1.4)
ax = g.ax

#----------- curva em azul
seqx = np.linspace(stats.norm.ppf(0.001, MU1, SSD1), stats.norm.ppf(0.999, MU1, SSD1), 100)
# fiting da curva teorica
normal_pdf = stats.norm.pdf(seqx, MU1, SSD1)
sns.lineplot(x=seqx, y=normal_pdf, color='darkcyan')

ax.vlines(MU1, 0, 0.028, color = 'navy')
ax.hlines(.016, MU1, MU1+SSD1, color = 'navy');

#----------- curva em vermelho
seqx = np.linspace(stats.norm.ppf(0.001, MU2, SSD2), stats.norm.ppf(0.999, MU2, SSD2), 100)
# fiting da curva teorica
normal_pdf = stats.norm.pdf(seqx, MU2, SSD2)
sns.lineplot(x=seqx, y=normal_pdf, color='darkred')

ax.vlines(MU2, 0, 0.017, color = 'red', linestyle='--')
ax.hlines(.010, MU2, MU2+SSD2, color = 'red', linestyle='--')

title = 'Distância entre distribuições - cuidado o KDE tem um fator de normalização distinto.'
title += f'\nnão medicados têm média {mu1:.1f} ({ssd1:.1f})'
title += f'\nmedicados têm média {mu2:.1f} ({ssd2:.1f})'
plt.title(title);

### As distribuições são nomais? teste de Shaprio-Wilkis

### Para controle

In [None]:
ret1, text1, text_stat1, stat1, pvalue1 = calc_normalidade_SWT(samp1, 0.05, NS='--')
text1, text_stat1

### Para tratado

In [None]:
ret2, text2, text_stat2, stat2, pvalue2 = calc_normalidade_SWT(samp2, 0.05, NS='---')
text2, text_stat2

### As variâncias iguais?

In [None]:
diff_ssd = np.abs(ssd1 - ssd2)

np.round(ssd1,1), np.round(ssd2,1), np.isclose(ssd1, ssd2), diff_ssd, diff_ssd <= ssd1*0.5

In [None]:
stats.norm.ppf(0.025, 0, 1)

In [None]:
stats.norm.ppf(1-0.025, 0, 1)

In [None]:
def calc_zs(dof, is_normal=False, confianca=.95):
    
    alpha = (1-confianca)/2
    
    if is_normal:
        # normal distribution
        z_inf = stats.norm.ppf(alpha, 0, 1)
        z_sup = stats.norm.ppf(1-alpha, 0, 1)
    else:
        # t-student distribution
        z_inf = stats.t.ppf( alpha, dof)
        z_sup = stats.t.ppf( (1-alpha), dof)

    return np.array( [z_inf, z_sup])

In [None]:
confianca = 0.95
dof=N-1

zs = calc_zs(dof, confianca=confianca, is_normal=False)
zs

In [None]:
zs = calc_zs(dof, confianca=confianca, is_normal=True)
zs

In [None]:
np.sqrt(ssd1**2 + ssd2**2)/2

In [None]:
diff_list = samp2-samp1
np.mean(diff_list), np.std(diff_list)

In [None]:
n1, n2 = len(samp1), len(samp2)

SEM = np.sqrt(ssd1**2/n1 + ssd2**2/n2)
SEM

In [None]:
confianca=.95

IC, SEM, n1, n2, effect_size, diff, pval_ttest, stri_ttest, mu1, mu2, ssd1, ssd2, ssd_pool = \
calc_intervalo_confianca(samp1, samp2, confianca=confianca)

stri1 = f"IC[inf] = {IC[0]:.2f} e IC[sup] = {IC[1]:.2f}"
stri2 = f"diferença = {diff:.2f} e  SEM = {SEM:.2f} e EF = {effect_size:.2f}"
stri3 = f"ttest: {stri_ttest}"
stri4 = f"N1={n1} e média 1 = {mu1:.2f} ({ssd1:.2f}), N2={n2} e média 2 = {mu2:.2f} ({ssd1:.2f})"

print(stri1)
print(stri2)
print(stri3)
print('\n', stri4)


### Perguntas

  - Porque a diferença deu negativa?
  - Porque o Tamanho de Efeito é menor que a diferença?
  - O que significa os valores do intervalo de confianca?


### Como devo apresentar meus resultados?

In [None]:
alpha = (1-confianca)/2
unidade = 'mg/dl'

ic_inf, ic_sup = IC

print()
print(f"Pacientes (n={N}) inicialmente apresentaram média de glicemia de {mu1:.2f}({ssd1:.2f}) {unidade}")
print(f"Após tratamento a mesma foi para {mu2:.2f}({ssd2:.2f}) mg/dl.")
print()
print(f"A difença média absoluta foi de {diff:.2f} {unidade}")
print(f"O tamanho do efeito foi de {effect_size:.2f} {unidade} com desvio padrão conjunto de {ssd_pool:.2f}")
print(f"O intervalo de confiança, com um coeficiente de confianca de {confianca*100:.1f}%, foi de [{ic_inf:.2f}, {ic_sup:.2f}] {unidade} com um SEM={SEM:.2f}")
print()

stri = f"Utilizando-se t-test, o p-value calculado foi de {pval_ttest:.2e} o que indica"
if pval_ttest < 0.05:
    print(f"{stri} que houve um efeito positivo do medicamento.")
else:
    print(f"{stri} que não houve efeito positivo do medicamento.")
print()

if effect_size < 0:
    print("apresentando uma diminuição na glicemia pós-tratamento")
else:
    print("não apresentando qualquer diminuição na glicemia pós-tratamento")


In [None]:
SEM, ssd_pool

In [None]:
fig, ax = plt.subplots(figsize=(8,6))

diff_samp = samp2 - samp1

# incorreto! 
ax = sns.histplot(diff_samp, stat='density', color='navy', alpha=0.3, label='diff incorreto', ax=ax, zorder=1)
sns.rugplot(diff_samp, color='blue', alpha=0.4, ax=ax, zorder=2)

seqx = np.linspace(diff - 5*SEM,  diff + 5*SEM, 100)

# fiting da curva teorica pdf da t
t_vals = (seqx - diff)/SEM
pdf = stats.t.pdf(t_vals, dof) / SEM

# área do IC
plt.fill_between(
    seqx, pdf,
    where=(seqx >= ic_inf) & (seqx <= ic_sup),
    alpha=0.3,
    label=f"IC com nível conf = {100*confianca:.0f}%", zorder=3
)

sns.lineplot(x=seqx, y=pdf, color='darkred', zorder=5)

posi_y = [ 0.01, 0.01 ]
posi_x = [ ic_inf, ic_sup ]
ax.plot(posi_x, posi_y, color='green', zorder=6)

# linhas verticais
ax.axvline(diff, color="black", linestyle="--", label="Diferença média")
ax.axvline(0, color="red", linestyle=":", label="Diferença = 0")

title = f"O intervalo de confiança (nível={confianca*100:.1f}%) com {n1} pacientes antes and {n2} depois\n[{ic_inf:.2f}, {ic_sup:.2f}] {unidade} com um SEM={SEM:.2f}"

plt.xlabel("Diferença de médias (mu₂ − mu₁)")
plt.ylabel("Densidade")

plt.grid()
ax.legend()
plt.tight_layout()
ax.set_title(title);

### Qual o erro conceitual?

## Como N pacientes pode ser um número amostral baixo, podemos calcula o Bootstrap para ver se o IC confere

In [None]:
## random generator
rng = np.random.default_rng(42)
rng

In [None]:
# escolha 30 vezes a glicmia do samp1, e cada vez que escolher uma delas a reponha na lista de 30 glicemias
rand1 = rng.choice(samp1, size=len(samp1), replace=True)
rand1

### Bootstrap: **reamostramos n vezes** a partir da amostra original de tamanho n, **com reposição** (replace=True)

  - Sorteamos, com devolução, n valores da amostra original:
    - Cada vez, pego um dos 30 valores de glicemia, 30 vezes
      - b1 - 30 valores quaisquer, pode repetir, sorteados com devolução de samp1
      - b2 - 30 valores quaisquer, pode repetir, sorteados com devolução de samp2
    - A diferença é calculada em cada loop e deve variar
  - Ao final temos o percentil 2.5% e 97% que mimetizam o IC(95%)

In [None]:
# random generator
rng = np.random.default_rng(42)
B = 10000

boot_diff = []
for _ in range(B):
    b1 = rng.choice(samp1, size=len(samp1), replace=True)
    b2 = rng.choice(samp2, size=len(samp2), replace=True)
    boot_diff.append(np.mean(b2) - np.mean(b1))

boot_diff = np.array(boot_diff)

IC_boot = np.percentile(boot_diff, [2.5, 97.5])

IC = [float(IC[0]), float(IC[1])]

f"CI_boot: {IC_boot} x CI: {IC}"

### Exercício:

  - Crie 2 grupos
    - 30 homens
    - 30 mulheres
  - Simule as glicemias e os resultados dos tratamentos
  - Compare homens x mulheres:
    - Antes do tratamento
    - Depois do tratamento
  - Compare todos os pacientes:
    - Antes x Depois do tratamento
  - Compare somente mulheres (depois somente homens):
    - Antes x Depois do tratamento
  - Análise seus resultados
  - Descreva seus resultados
 
#### Pergunta:

  - O que fizemos de diferente com relação ao estudo anterior?
    - a diferença é MÚLTIPLAS COMPARAÇÕES
  - Posso comparar todos os pacientes antes e depois do tratamento?
    - independente de sexo (gênero)
    - por gênero
    - antes e de pois de tratado

### Veja py05a - 01 - teste de hipótese.ipynb