# Aula 13 - Atividades com distribuição Normal

In [None]:
import numpy as np
import pandas as pd
from scipy.stats import norm, probplot

import matplotlib.pyplot as plt

%matplotlib inline

## Caixa de Galton

![Caixa de galton](LegalTameChanticleer-size_restricted.gif)

[Fonte: https://www.youtube.com/watch?v=UCmPmkHqHXk](https://www.youtube.com/watch?v=UCmPmkHqHXk&t=271s)

## Distribuição normal

A função densidade de probabilidade (f.d.p.) da distribuição Normal com média $\mu$ e desvio padrão $\sigma$ é dada por:

$$f(x) = \frac{1}{\sqrt{2 \pi} \sigma}e^{\frac{-(x - \mu)^2}{2 \sigma^2}}$$

Ou seja, nesse caso, temos que:

$$E(X) = \mu$$

e também que:

$$Var(X) = \sigma^2$$

*Notação:* $X \sim N(\mu, \sigma^2)$ - diz-se que $X$ segue uma distribuição normal com média $\mu$ e desvio padrão $\sigma$.


A padronização (converter qualquer curva normal na normal padrão) pode ser feita com a seguinte mudança de variáveis:

$$Z = \frac{X-\mu}{\sigma}$$  

Nesse caso, a f.d.p. de uma normal padrão é dada por:

$$f(z) = \frac{1}{\sqrt{2 \pi} }e^{\frac{-z^2}{2 }}$$

Por fim, a normal padrão tem $\mu=0$ e $\sigma=1$.

## Faixas para valores inteiros de $z$ de $\sigma$, ou seja, $z\sigma$

*Resultados:*

$$P(\mu-1\sigma < X < \mu + 1\sigma) = 0.6827$$

$$P(\mu- 2\sigma < X < \mu + 2 \sigma) = 0.9545$$

$$P(\mu-3\sigma < X < \mu + 3\sigma) = 0.9973$$

E também, dada a simetria da distribuição normal, tem-se que 

$$P(X<\mu) = P(X>\mu) = 0.5$$.

**Vamos verificar os resultados acima com programação:**

Para $1 \sigma$, ou seja, $P(\mu-1\sigma < X < \mu + 1\sigma)$:

In [None]:
norm.cdf(1) - norm.cdf(-1)

Para 2$\sigma$, ou seja, $P(\mu-2\sigma < X < \mu + 2\sigma)$:

In [None]:
norm.cdf(2) - norm.cdf(-2)

Para $3 \sigma$, ou seja, $P(\mu-3\sigma < X < \mu + 3\sigma)$:

In [None]:
norm.cdf(3) - norm.cdf(-3)

___
## Exercício 1
**Exemplo baseado de Montgomery**

Assuma que a medida de corrente num pedaço de fio condutor segue uma distribuição normal com média de 10 $mA$ e variância de 4 $mA^2$. 

a) Qual a probabilidade de ter uma medida que excede $13 mA$? Queremos: $P(X>13)$

b) Qual a probabilidade de uma medida entre $9 mA$ e $11 mA$? 

c) Qual o maior valor de corrente num fio condutor dos $30\%$ possíveis menores valores?

___
## Exercício 2
**Exemplo baseado de Montgomery**

O tempo sem precisar de recarga para bateria de um *laptop*, em condições normais, é distribuído conforme uma normal com média de $260$ min e desvio padrão de $50$ min.

a) Qual a probabilidade que a bateria dure mais de 4 horas?

b) Quais são os quartis da vida média de bateria? (encontre Q1 e Q3)

c) Qual o maior valor de duração de bateria que é atendido em 95% das piores situações?

d) Se a bateria durar mais do qu $300$ min, qual a probabilidade de que não ultrapasse $350$ min?

___
## Exercício 3
**Exemplo baseado de Montgomery**

Colesterol é um ácido graxo que é componente importante da membrana das células dos animais. A faixa normal para um adulto é entre $120-240$ mg/dl. 

O Instituto de Nutrição e Saúde das Filipinas descobriu que os adultos daquele país têm média de $159.2$ mg/dl e $84.1$% dos adultos têm um nível de menos que $200$ mg/dl. Suponha que o colesterol é distribuído normalmente.

a) Encontre o desvio padrão desta distribuição

b) Quais são os quartis da distribuição?

c) Qual o menor valor de colesterol de 90% da população com piores resultados?

d) Um adulto tem risco moderado se está com mais que 2 desvios padrão acima da média. Qual a porcentagem da população que está em risco?

___
## Exercício 4

As notas no quiz final de Ciência dos Dados distribuem-se segundo uma variável aleatória normal com média $6.5$ e desvio padrão $1.6$. O professor deseja dividir a classe em 3 categorias, da seguinte forma: os $30$% que tiveram as melhores notas serão aprovados, os $50$% com notas intermediárias ficarão de exame e os $20$% que tiveram as piores notas serão reprovados. 

a) Quais os limites de nota entre cada uma das categorias?

b) Caso a nota para aprovação (sem ir para exame) fosse igual a $7.0$ e uma turma tivesse $50$ alunos, quantos desses seriam aprovados, em média, sem ir para o exame? 

___
## Exercício 5

![](uzumaki_momochi.png)

*Esta questão caiu na P1 2016*

Você foi selecionado para comprar projetores para sua empresa. Depois de uma pesquisa extensa no mercado, a decisão final será tomada entre modelos de duas marcas: *Uzumaki* e *Momochi*.

Os modelos da marca Uzumaki têm um tempo de duração da lâmpada que pode ser modelado com uma distribuição normal com média de $675$ horas e um desvio padrão de $125$

Os modelos da marca Momochi pode ser modelados por uma normal com média de $625$ horas e um desvio padrão de $200$.

a)	A meta de duração para as lâmpadas é de $830$ horas. Qual marca de projetor você compraria baseado na probabilidade de cada um atingir a meta de duração? Justifique os cálculos.

b)	Assuma, independentemente da resposta de (a), que você comprou um projetor Uzumaki e que ele já durou $675$ horas. Qual a probabilidade deste projetor então durar até $925$ horas? 

c)	Qual a probabilidade de um projetor Momochi durar até $300$ horas? 

___
## Exercício 6

Você recebeu o arquivo `dados_normal_1000.txt` com dados de concentração (em $\mu g/L$) de um determinado poluente em um tanque de combustível

Pede-se:

1. Visualize o histograma dos dados
1. Usando um plot de probabilidade, ou QQ-Plot, verifique se os dados aparentam seguir uma distribuição normal
1. Realize o `fit`  de uma distribuição normal, e faça o plot da `pdf` sobre o histograma de densidade da distribuição

In [None]:
dados = ""
with open("dados_normal_1000.txt") as f:
    dados = " ".join(f.readlines()) 

In [None]:
dados_float = [float(val) for val in dados.split()]

In [None]:
# Item 1.


In [None]:
# Item 2.


In [None]:
# Item 3.
