# Teoria da Decisão Estatística

Como dito anteriormente, com frequência devemos tomar decisões acerca de populações, baseadas nas informações das amostras, decisões essas chamadas _estatísticas_. Por exemplo, pode-se desejar decidir, com base em dados amostrais, se um novo medicamento é eficaz, ou se um processo educacional é melhor do que outro, dentre outras possibilidades de comparação.

## Hipóteses estatísticas e hipóteses nulas

Para que possamos tomar decisões é conveniente a formulação de hipóteses ou conjecturas acerca das populações interessadas. Essas suposições, que podem ser ou não verdadeiras, são denominadas **_hipóteses estatísticas_** e, em geral, consistem em considerações acerca das distribuições de probabilidade das populações.

Em alguns casos, formula-se uma hipótese estatística com o único propósito de rejeitá-la ou invalidá-la. Por exemplo, caso o desejo seja provar que uma moeda é viciada, formula-se a hipótese de que ela não o seja, isto é, a moeda é honesta e a probabilidade de caras é igual a de coroa e vale $p=0,5$. Ou ainda, se deseja-se provar que um processo é melhor do que outro, formula-se a hipótese de que não há diferença entre eles (ou seja qualquer diferença observada é meramente ao acaso). Essas hipóteses são chamadas de **_Hipóteses nulas_** e são representadas por **$H_0$**.

É possível ainda que se tenham outras hipóteses, que sejam diferentes da _hipótese nula_, que denominamos com _hipótese alternativa_ e representamos por $H_1$. No caso da moeda viciada, poderíamos ter uma hipótese alternativa de que $p \ne 0,5$, $p=0,7$ ou $p > 0,5$.

## Testes de hipóteses e significância

Admitida uma hipótese particular como verdadeira se, se verificar que os resultados observados em uma amostra aleatória diferem acentuadamente dos esperados, para aquela hipótese, com base na probabilidade simples mediante a utilização da teoria da amostragem, pode-se concluir que as diferenças observadas **_são significativas_** e ficar inclinados a rejeitar a hipótese (ou, pelo menos, a não aceitá-la com base nas provas obtidas). Por exemplo, se 20 lances de uma moeda apresentam 16 caras, ficamos "inclinados" a rejeitar a hipótese de que a moeda é honesta, embora seja concebível que se esteja incorrendo em erro.

Os processos que habilitam a decidir se as hipóteses são aceitas ou rejeitadas, ou a determinar se a amostra observada difere de modo significativo dos resultados esperados, são denominados **_testes de hipóteses_** ou **_testes de significância_** (ou ainda **_regras de decisão_**).

## Erro Tipo I e Tipo II

Se uma hipótese for rejeitada quando deveria ser aceita, diz-se que foi cometido um erro do **_Tipo I_**. Se, por outro lado, for aceita uma hipótese que deveria ter sido rejeitada, diz-se que foi cometido um erro do **_Tipo II_**. Em ambos os casos, ocorreu uma decisão errada ou um erro de julgamento.

Para quaisquer testes de hipóteses ou regras ou regras de decisão sejam bons, eles devem ser planejados de modo que os erros de decisão sejam reduzidos ao mínimo. Embora não seja uma tarefa simples, um caminho possível para a diminuição de ambos os tipos de erros consiste em aumentar o tamanho da amostra, o que pode ou não ser possível.

## Nível de significância

Ao testar uma hipótese estabelecida, a probabilidade máxima com a qual se sujeitaria a correr o risco de um erro do Tipo I é denominado **_nível de significância do teste_**. Essa probabilidade, representada frequentemente por $\alpha$, é geralmente especificada antes da extração de quaisquer amostras, de modo que os resultados obtidos não influenciem a escolha.

Na prática, é usual a adoção de um nível de significância 0,05 ou 0,01, embora possam ser utilizados outros valores. Se, por exemplo, é escolhido um nível de significância 0,05 ou 5% no planjeamento de um teste de hipótese, há então cerca de 5 probabilidades, em 100 , da hipótese ser rejeitada, quando dever ser aceita, isto é, há uma confiança de cerca de 95% de que se tome uma decisão acertada. Nesses casos, diz-se que a hipótese é **_rejeitada no nível de significância 0,05_**, o que significa que a probabilidade de erro seria de 0,05.

## Testes que envolvem a distribuição normal

Para exemplificar as ideias acima apresentadas, admita-se que, sob uma certa hipótese, a distribuição amostral de uma estatística $S$ é normal, com a média $\mu_S$ e o desvio padrão $\sigma_S$. Entaão, a distribuição da variável reduzida (ou _z-score_ ou escore _z_) é a distribuição normal reduzida (com média 0 e variância 1) que está representada na figura abaixo:

<img src=https://www.lampada.uerj.br/arquivosdb/_book/bioestatisticabasica_files/figure-html/regiaoCritica-1.png  width="600" height="380" text-align="center">

Observem que se o nível de significância é 95%, $\alpha = 0,05$, ou seja, a região hachurada vale $\frac{\alpha}{2}=\frac{0,05}{2}=0,025$. Assim, por exemplo, se a hipótese for verdadeira, o escore de uma estatística amostral real $S$, estará compreendido entre -1,96 e 1,96. Entretanto, se ao escolher uma única amostra aleatória, verificar-se que o escore _z_ dessa estatística cai fora do intervalo de -1,96 e 1,96, concluiria-se que esse evento _difere de modo significativamente diferente do que seria esperado da hipótese (dentro do intervalo de confiança de 95%)_, estando propenso a rejeitar a hipótese.

A área total sombreada, de 0,05 é o nível de significância do teste. Ela representa a probabilidade de incorrer-se em erro na rejeição da hipótese, isto é, a probabilidade de ser cometido um erro do tipo I. Por essa razão, diz-se que a hipótese é _rejeitada no nível de significância de 0,05_, ou que o $z$ $score$ da estatística amostral dada é _significativo naquele nível_.

O conjunto dos _z escores_ situados fora do intervalo $-1,96$ e $+1,96$ constituia denominada _região crítica de rejeição da hipótese_ ou _de significância_. O conjunto dos $z$ $scores$ compreendidos no intervalo de $-1,96$ a $+1,96$ poderia, então, ser denominado  _região de aceitação da hipótese_ ou _de não-significância_.

Baseada nas informações acima, pode ser formulada a seguinte regra de decisão, teste de hipóteses ou significância:

a) Rejeição da hipótese no nível de significância $0,05$, quando o $z$ $score$ da estatística $S$ situar-se fora do intervalo de $-1,96$ a $+1,96$ (isto é, $z > +1,96$ ou $z < -1,96$). Isso equivale a dizer que a estatística amostral observada é significativa no nível $0,05$.

b) Aceitação da hipótese (ou, se for desejado, não tomar nenhuma decisão) no caso contrário.

## Testes Unilaterais e bilaterais

Nos testes acima, manifesta-se o interesse nos valores extremos da estatística $S$, ou nos escores $z$ correspondentes de ambos os lados da média, isto é, ambas as "extremidades" da distribuição. Por esta razão, esses testes são considerados **_bilaterais_** ou dos **_dois lados_**.

Muitas vezes, entretanto, pode-se ter interesse apenas nos valores extremos de um mesmo lado da média, isto é, em uma "extremidade" da distribuição, como por exemplo, quando se está testando a hipótese de um processo ser melhor do que outro (o que é diferente de testar se um processo é melhor ou pior do que o outro). Esses processos são chamados **_unilaterais_**.

**Tabela 1 -** Valores de críticos uni e bilaterais 
Limite de confiança, $\alpha$ | 0,10 | 0,05 | 0,01 | 0,005 | 0,002 | 
:-------:|:-------:|:-------:|:-------:|:-------:|:-------:|
|Valores críticos de $z$ para testes unilaterais |-1,28 ou 1,28|-1,645 ou 1,645|-2,33 ou 2,33|-2,58 ou 2,58|-2,88 ou 2,88|
|Valores críticos de $z$ para testes bilaterais |-1,645 ou 1,645|-1,96 ou 1,96|-2,58 ou 2,58|-2,81 ou 2,81|-3,08 ou 3,08|

## P valores

Existe uma forma de calcular a probabilidade de nossa hipótese nula ser rejeitada chamada p valor. A ideia do p valor é calcular a probabilidade de obter-se ma estatística de teste igual ou mais extrema que a estatística observada a partir de uma amostra de uma população assumindo–se a hipótese nula como verdadeira. Ou seja, escolhe-se um nível de significância e busca-se rejeitar a hipótese nula, se e somente se o p–valor for menor que o nível de significância pré–estabelecido.

### Exemplo
Considerem o problema de jogar um dado honesto 10 mil vezes.
Qual a média dessas jogadas?
Desconsiderem o fato de o dado ser honesto. Realize um teste de hipóteses para provar que o dado é honesto.