### Como vimos, o Teorema do Limite Central nos diz que, para uma amostra grande o suficiente, a média tem distribuição normal. Um resultado disso é que podemos fazer uma estimativa intervalar para a média da população utilizando a amostra que temos disponível. 


<br>
<br>

### Na prática, o que estamos calculando é um intervalo de x% de confiança onde esperamos que a média da população esteja, com x% de probabilidade.

<br>

### Por exemplo, para um intervalo de 95% de confiança, a gente espera que a média da população esteja dentro desse intervalo, com 95% de probabilidade. Quanto mais o nível de confiança, maior será o intervalo.

![alt text](https://nulib.github.io/moderndive_book/ismaykimkuyper_files/figure-html/N-CIs-1.png)

<br>
<br>
<br>

### Para calcularmos um intervalo de 99% de confiança, por exemplo, utilizamos o quantil 0.99 da Normal Padrão.

<br>


![alt_text](http://www.statisticslectures.com/images/ci3.gif)



<br>
<br>

---
<br>
<br>

### Num intervalo de confiança, a média sempre estará no centro do intervalo. Daí, a distância entre a média e o limite do intervalo é chamada de margem de erro.

#### A margem de erro tem a ver com o quanto eu estou aceitando errar; mais especificamente, é a amplitude do meu intervalo. Quanto maior a amostra, menor é a margem de erro.

<br>
<br>

![alt text](https://upload.wikimedia.org/wikipedia/commons/thumb/f/f9/Margin-of-error-95.svg/1200px-Margin-of-error-95.svg.png)

## `IMPORTANTE`

<br>

#### O intervalo de confiança é para a média dos dados, não para os dados todos!

### Vamos usar os dados do preço do Big Mac de Julho de 2022.

<br>

https://www.kaggle.com/datasets/vittoriogiatti/bigmacprice

#### Importando a biblioteca pandas (https://pandas.pydata.org)

In [1]:
import pandas

#### Lendo os dados, que estão em csv

In [2]:
df = pandas.read_csv('BigmacPriceJuly2022.csv')

In [3]:
df.head()

Unnamed: 0,date,currency_code,name,local_price,dollar_ex,dollar_price
0,2022-07-01,ARS,Argentina,590.0,129,4.57
1,2022-07-01,AUD,Australia,6.7,1,6.7
2,2022-07-01,EUR,Austria,4.35,1,4.35
3,2022-07-01,AZN,Azerbaijan,4.7,1,4.7
4,2022-07-01,BHD,Bahrain,1.6,1,1.6


### Descrição das colunas

* **`date`** - Data do registro
* **`currency_code`** - Código ISO 4217 internacional da moeda do país
* **`name`** - Nome do país
* **`local_price`** - Preço do Big Mac na moeda local
* **`dollar_ex`** - Taxa de Conversão do dólar americano para a moeda local
* **`local_price`** - Preço do Big Mac em dólares americanos


#### Vamos fazer um Intervalo com 95% Confiança para a média do preço do Big Mac em dólares

In [4]:
from scipy import stats

big_mac_media = df["dollar_price"].mean()
big_mac_desvio_padrao = df["dollar_price"].std()

print('\n')
print('Média do preco do Big Mac em dólares: {}'.format(big_mac_media))
print('Desvio Padrão do preco do Big Mac em dólares: {}'.format(big_mac_desvio_padrao))



Média do preco do Big Mac em dólares: 4.003571428571429
Desvio Padrão do preco do Big Mac em dólares: 1.3532130692415167


In [5]:
# loc é a média.
# scale é o desvio padrão.
 
intervalo_95_big_mac = stats.norm.interval(0.95 ,
                                         loc = big_mac_media , 
                                         scale = big_mac_desvio_padrao)


print('Intervalo de 95% de Confiança para Média: {}'.format(intervalo_95_big_mac))



Intervalo de 95% de Confiança para Média: (1.3513225494491499, 6.655820307693708)


In [6]:
margem_de_erro_big_mac = intervalo_95_big_mac[1] - big_mac_media
print('Margem de erro do intervalo: {}'.format(margem_de_erro_big_mac))

Margem de erro do intervalo: 2.652248879122279
