# Distribuição Normal

In [None]:
import numpy as np
import pandas as pd
from scipy.stats import norm, probplot

import matplotlib.pyplot as plt

%matplotlib inline

### Caixa de Galton

![Caixa de galton](LegalTameChanticleer-size_restricted.gif)

[Fonte: https://www.youtube.com/watch?v=UCmPmkHqHXk](https://www.youtube.com/watch?v=UCmPmkHqHXk&t=271s)

## Distribuição normal

$f(x) = \frac{1}{\sqrt{2 \pi} \sigma}e^{\frac{-(x - \mu)^2}{2 \sigma^2}}$

A normal padrão tem $\mu=0$ e $\sigma=1$

Temos que:

$E(X) = \mu$

e também que:

$V(X) = \sigma^2$

Notação:

$X \sim N(\mu, \sigma^2)$ - diz-se que $X$ segue uma distribuição normal com média $\mu$ e desvio padrão $\sigma$.

$f(z) = \frac{1}{\sqrt{2 \pi} }e^{\frac{-z^2}{2 }}$



A padronização (converter qualquer curva normal na normal padrão) pode ser feita com a seguinte mudança de variáveis:

$z = \frac{x-\mu}{\sigma}$  



### Faixas para valores inteiros de sigma

Resultados:

$$P(\mu-\sigma < X < \mu + \sigma) = 0.6827$$

$$P(\mu- 2\sigma < X < \mu + 2 \sigma) = 0.9545$$

$$P(\mu-3\sigma < X < \mu + 3\sigma) = 0.9973$$

E também, dada a forma da normal:

$$P(X<0.5) = P(X>0.5) = 0.5$$

Vamos verificar os resultados acima com programação:

Para $1 \sigma$

In [None]:
norm.cdf(1) - norm.cdf(-1)

Para 2 $\sigma$

In [None]:
norm.cdf(2) - norm.cdf(-2)

Para $3 \sigma$

In [None]:
norm.cdf(3) - norm.cdf(-3)

### Exercício 1
**Exemplo 4-15 Montgomery:**

Assuma que, na deteção de um sinal digital, o ruído de fundo segue uma distribuição normal com média $0 V$ e desvio padrão de $0.45 V$. O sistema assume que um dígito $1$  foi transmitido quando a tensão ultrapassa $0.9V$. Qual a probabilidade de detectar um sinal digital $1$ sem que nenhum tenha sido recebido? 

** Resposta:**

Vamos chamar a variável aleatória de $T$. O que queremos é $P(T > 0.9) = 1 - P(T<0.9)$ 

Defina níveis de tensão ao redor de zero que incluam $99\%$ das leituras quando não há bit $1$ sendo transmitido.

Os limites seriam [-1.159, 1.159]

Suponha que, quando de fato há transmissão de um sinal binário $1$ na linha, a média da distribuição do ruído se desloca para $1.8 V$. (Por que?) Qual a probabilidade de não detectar um sinal 1?

Vamos assumir o limiar dado de $0.9V$ a partir do qual consideramos que foi recebido um $1$ binário. Também vamos assumir que o desvio padrão se mantém

### Exercício 2
**Exemplo 4-13 Montgomery**

Assuma que a medida de corrente num pedaço de fio condutor segue uma distribuição normal com média de 10 $mA$ e variância de 4 $mA^2$. 

Qual a probabilidade de ter uma medida que excede $13 mA$? Queremos: $P(X>13)$

Qual a probabilidade de uma medida entre $9 mA$ e $11 mA$? 

Qual o valor $x$ abaixo do qual há $30\%$ de probabilidade de haver leitura?

### Exercício 3

** 4-72 Mont**

O tempo sem precisar de recarga para bateria de um laptop em condições normais é distribuído conforme uma normal com média de $260 min.$ e desvio padrão de $50 min$

1. Qual a probabilidade que a bateria dure mais de 4 horas?
1. Quais são os quartis da vida média de bateria? (encontre Q1 e Q3)
1. Qual o valor de duração de bateria que é atendido em pelo menos 95% das situações?

### Exercício 4

**4-74 Mont**

Colesterol é um ácido graxo que é componente importante da membrana das células dos animais. A faixa normal para um adulto é entre $120-240 mg/dl$. O Instituto de Nutrição e Saúde das Filipinas descobriu que os adultos daquele país têm média de 159.2 mg/dl e 84.1% dos adultos têm um nível de menos que 200 mg/dl. Suponha que o colesterol é distribuído normalmente

1. Encontre o desvio padrão desta distribuição
2. Quais são os quartis da distribuição?
3. Qual o valor de colesterol excedido por 90% da população?
1. Um adulto tem risco moderado se está mais que 2 desvios padrão acima da média. Qual a porcentagem da população que está em risco?


### Exercício 5

As notas no quiz final de Ciência dos Dados distribuem-se segundo uma variável aleatória normal com média 6,5 e desvio padrão 1,6. O professor deseja dividir a classe em 3 categorias, da seguinte forma: os 30% que tiveram as melhores notas serão aprovados, os 50% com notas intermediárias ficarão de exame e os 20% que tiveram as piores notas serão reprovados. 

1. Quais os limites de nota entre cada uma das categorias?

2. Caso a nota para aprovação (sem ir para exame) fosse igual a 7,0 e uma turma tivesse 50 alunos, quantos desses seriam aprovados, em média, sem ir para o exame? 

### Exercício 6

![](uzumaki_momochi.png)

(esta questão caiu na P1 2016)

Você foi selecionado para comprar projetores para sua empresa. Depois de uma pesquisa extensa no mercado, a decisão final será tomada entre modelos de duas marcas: *Uzumaki* e *Momochi*.

Os modelos da marca Uzumaki têm um tempo de duração da lâmpada que pode ser modelado com uma distribuição normal com média de 675 horas e um desvio padrão de 125

Os modelos da marca Momochi pode ser modelados por uma normal com média de 625 horas e um desvio padrão de 200.


a)	A meta de duração para as lâmpadas é de 830 horas. Qual marca de projetor você compraria baseado na probabilidade de cada um atingir a meta de duração? Justifique os cálculos  (1,50 ponto)

b)	Assuma, independentemente da resposta de (a), que você comprou um projetor Uzumaki e que ele já durou 675 horas. Qual a probabilidade deste projetor então durar até 925 horas? (1,0 ponto)

c)	Qual a probabilidade de um projetor Momochi durar até 300 horas? (0,5 ponto)

### Exercício 7 

Você recebeu o arquivo `dados_normal_1000.txt` com dados de concentração (em $\mu g/L$) de um determinado poluente em um tanque de combustível

Pede-se:

1. Visualize o histograma dos dados
1. Usando um plot de probabilidade, ou QQ-Plot, verifique se os dados aparentam seguir uma distribuição normal
1. Realize o `fit`  de uma distribuição normal, e faça o plot da `pdf` sobre o histograma de densidade da distribuição

In [None]:
dados = ""
with open("dados_normal_1000.txt") as f:
    dados = " ".join(f.readlines()) 

In [None]:
dados_float = [float(val) for val in dados.split()]