# 🌈 Objetivos da Aula:

* Compreender o que é viés em um estimador
* Entender o conceito de variabilidade (ou variabilidade amostral)
* Diferenciar estimadores viesados de não viesados
* Compreender o impacto do tamanho da amostra e do número de amostras

#🔍 Introdução

Em estatística, muitas vezes estamos tentando estimar um parâmetro populacional (como a média, variância, proporção, etc) com base em amostras da população. Mas o quão bom é o nosso estimador?

Existem duas características fundamentais para avaliar um estimador:

* Viés (bias): Um estimador é viesado quando seu valor esperado não é igual ao parâmetro que ele tenta estimar.

* Variabilidade (variability): A variabilidade representa o quanto o estimador varia de amostra para amostra. Mesmo estimadores não viesados podem ter grande variabilidade, o que afeta a precisão das estimativas.


#🎓 Exemplos

In [1]:
from numpy import linspace
from scipy.stats import norm
import plotly.graph_objects as go

In [2]:
def plot(scale_1, scale_2):
    X = linspace(
        min((scale_1.interval(0.99)[0], scale_2.interval(0.99)[0])),
        max((scale_1.interval(0.99)[1], scale_2.interval(0.99)[1])),
        1000
    )
    return go.Figure(
        {
            'data': [
                {'y': scale_1.pdf(X), 'x': X, 'name': 'scale 1'},
                {'y': scale_2.pdf(X), 'x': X, 'name': 'scale 2', 'yaxis': 'y2'}
            ],
            'layout': {
                'yaxis2': {'side': 'right', 'overlaying': 'y'},
                'shapes': [
                    {
                        'type': 'line',
                        'yref': 'paper', 'y0': 0, 'y1': 1,
                        'xref': 'x', 'x0': true_weight, 'x1': true_weight,
                        'line': {'color': 'black', 'width': 3, 'dash': 'dash'},
                    }
                ]
            }
        }
    )

In [3]:
true_weight = 80

Imagine duas balanças:

* Balança 1: sempre marca +1kg acima do seu peso real. É viesada, mas consistente.

* Balança 2: ora marca +2kg, ora -3kg, sem padrão. É não viesada, mas tem alta variabilidade.

In [4]:
scale_1 = norm(true_weight + 1, 0.2)  ## eficiente, mas tendencioso
scale_2 = norm(true_weight, 2)  ## não tendencioso, mas ineficiente

In [5]:
plot(scale_1, scale_2)

O ideal seria ter um estimador:
* Sem viés (em média acerta)
* Com baixa variabilidade (não oscila demais entre amostras)

In [16]:
def plot(scale_3, scale_4):
    X = linspace(
        min((scale_1.interval(0.99)[0], scale_2.interval(0.99)[0])),
        max((scale_1.interval(0.99)[1], scale_2.interval(0.99)[1])),
        1000
    )
    return go.Figure(
        {
            'data': [
                {'y': scale_3.pdf(X), 'x': X, 'name': 'scale 3'},
                {'y': scale_4.pdf(X), 'x': X, 'name': 'scale 4', 'yaxis': 'y2'}
            ],
            'layout': {
                'yaxis2': {'side': 'right', 'overlaying': 'y'},
                'shapes': [
                    {
                        'type': 'line',
                        'yref': 'paper', 'y0': 0, 'y1': 1,
                        'xref': 'x', 'x0': true_weight, 'x1': true_weight,
                        'line': {'color': 'black', 'width': 3, 'dash': 'dash'},
                    }
                ]
            }
        }
    )

In [17]:
scale_3 = norm(true_weight, 0.2)  ## eficiente e imparcial
scale_4 = norm(true_weight + 1, 2)  ## tendencioso e ineficiente

In [18]:
plot(scale_3, scale_4)

Estes conceitos são fundamentais para entender a qualidade das estimativas estatísticas e embasam inferências como testes de hipótese e intervalos de confiança.

