# <b>Probabilidade

## Teorema de Bayes

O Teorema de Bayes descreve a probabilidade de um evento, baseada em informa√ß√µes pr√©vias que podem estar relacionadas ao evento.

A f√≥rmula do Teorema de Bayes √©:

$$
P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)}
$$

Onde:

- $P(A|B)$: probabilidade de $A$ dado que $B$ ocorreu (probabilidade posterior);
- $P(B|A)$: probabilidade de $B$ dado que $A$ ocorreu (verossimilhan√ßa);
- $P(A)$: probabilidade de $A$ (probabilidade a priori);
- $P(B)$: probabilidade de $B$ (evid√™ncia total).

---

Se houver v√°rios eventos $A_i$, a evid√™ncia $P(B)$ pode ser calculada como:

$$
P(B) = \sum_{i=1}^{n} P(B|A_i) \cdot P(A_i)
$$

Essa f√≥rmula permite aplicar o teorema em contextos com m√∫ltiplas hip√≥teses.


In [50]:
def bayes_theorem(likelihood, prior, evidence):
    """
    Calcula a probabilidade posterior usando o Teorema de Bayes.
    
    Par√¢metros:
    - likelihood: P(B|A), verossimilhan√ßa
    - prior: P(A), probabilidade a priori
    - evidence: P(B), evid√™ncia

    Retorna:
    - posterior: P(A|B), probabilidade posterior
    """
    if evidence == 0:
        raise ValueError("A evid√™ncia n√£o pode ser zero.")
    
    posterior = (likelihood * prior) / evidence
    return posterior

# Exemplo de uso do Teorema de Bayes:
# 1% da popula√ß√£o tem uma doen√ßa.
# O teste d√° positivo em 99% dos casos com a doen√ßa e positivo em 5% dos casos sem a doen√ßa.

P_A = 0.01              # Probabilidade de ter a doen√ßa
P_B_given_A = 0.99      # Probabilidade do teste ser positivo dado que a pessoa tem a doen√ßa
P_B_given_not_A = 0.05  # Probabilidade do teste ser positivo dado que a pessoa N√ÉO tem a doen√ßa
P_not_A = 1 - P_A

# Evid√™ncia total
P_B = (P_B_given_A * P_A) + (P_B_given_not_A * P_not_A)

# Aplicando o Teorema de Bayes
posterior = bayes_theorem(P_B_given_A, P_A, P_B)
print(f"Probabilidade de ter a doen√ßa dado teste positivo: {posterior:.4f}")

Probabilidade de ter a doen√ßa dado teste positivo: 0.1667


## Fun√ß√£o de Distribui√ß√£o Acumulada (FDA ou CDF)

A fun√ß√£o de distribui√ß√£o acumulada (FDA), tamb√©m chamada de CDF (do ingl√™s *Cumulative Distribution Function*), descreve a **probabilidade de que uma vari√°vel aleat√≥ria $X$ assuma um valor menor ou igual a um determinado valor $x$**.

$$
F(x) = P(X \leq x)
$$

No caso de dados observados (dados emp√≠ricos), a distribui√ß√£o acumulada emp√≠rica √© dada por:

$$
\hat{F}(x) = \frac{\text{n√∫mero de elementos } \leq x}{\text{n√∫mero total de elementos}}
$$

Essa fun√ß√£o √© **monotonicamente crescente**, e seu valor est√° sempre entre 0 e 1.

In [51]:
def distribuicao_acumulada(conjunto_de_dados, x):
    """
    Calcula a fun√ß√£o de distribui√ß√£o acumulada emp√≠rica (ECDF) para um valor x.

    Par√¢metros:
    - conjunto_de_dados: lista ou array com os dados num√©ricos
    - x: valor at√© o qual se deseja calcular a propor√ß√£o acumulada

    Retorna:
    - F_x: propor√ß√£o dos valores no conjunto que s√£o menores ou iguais a x

    F√≥rmula:
    F(x) = n√∫mero de valores <= x / n√∫mero total de valores
    """
    n = len(conjunto_de_dados)
    count = sum(1 for i in conjunto_de_dados if i <= x)
    F_x = count / n
    return F_x

# Exemplo de uso
amostra = [45, 56, 67, 70, 75, 80, 83, 88, 90, 95]
x = 75
print(f"A propor√ß√£o de valores <= {x} √© {distribuicao_acumulada(amostra, x)}")

A propor√ß√£o de valores <= 75 √© 0.5


## Fun√ß√£o Densidade de Probabilidade (FDP ou PDF)

A fun√ß√£o densidade de probabilidade (FDP), conhecida como PDF (*Probability Density Function*), descreve a **probabilidade relativa** de uma vari√°vel aleat√≥ria cont√≠nua assumir um determinado valor.

Para uma vari√°vel cont√≠nua $X$ com distribui√ß√£o normal, a PDF √© definida por:

$$
f(x) = \frac{1}{\sigma \sqrt{2\pi}} \cdot e^{ -\frac{1}{2} \left( \frac{x - \mu}{\sigma} \right)^2 }
$$

Onde:

- $\mu$ √© a m√©dia da distribui√ß√£o
- $\sigma$ √© o desvio padr√£o
- $e$ √© a base do logaritmo natural

---

### üìå Interpreta√ß√£o da PDF

Para vari√°veis cont√≠nuas, a probabilidade de um valor exato ocorrer √© **zero**:

$$
P(X = x) = 0
$$

O que realmente interessa √© a **probabilidade de um intervalo**, que pode ser obtida calculando a √°rea sob a curva da PDF entre dois pontos $a$ e $b$:

$$
P(a \leq X \leq b) = \int_a^b f(x)\,dx
$$

---

### üìê Uso da Regra dos Trap√©zios para resolver a Integral

A ideia da regra dos trap√©zios √©:

- Dividir o intervalo $[a, b]$ em $n$ partes pequenas;
- Calcular a √°rea de cada trap√©zio sob a curva da PDF;
- Somar todas essas √°reas para estimar a integral:

$$
\int_a^b f(x)\,dx \approx \sum_{i=1}^{n} \frac{f(x_i) + f(x_{i+1})}{2} \cdot (x_{i+1} - x_i)
$$

Quanto maior o n√∫mero de subdivis√µes, mais precisa ser√° a estimativa da √°rea ‚Äî e, portanto, da **probabilidade acumulada no intervalo**.

In [52]:
def densidade_normal(x, media=0, desvio=1):
    """
    Calcula a fun√ß√£o densidade de probabilidade (PDF) da distribui√ß√£o normal.

    Par√¢metros:
    - x: valor da vari√°vel aleat√≥ria
    - media: m√©dia da distribui√ß√£o (Œº)
    - desvio: desvio padr√£o da distribui√ß√£o (œÉ)

    Retorna:
    - f_x: valor da PDF em x
    """
    pi = 3.141592653589793
    e = 2.718281828459045

    coeficiente = 1 / (desvio * (2 * pi) ** 0.5)
    expoente = -0.5 * ((x - media) / desvio) ** 2
    f_x = coeficiente * (e ** expoente)
    return f_x

def probabilidade_intervalo(a, b, media=0, desvio=1, passos=1000):
    """
    Estima a probabilidade de P(a <= X <= b) para uma distribui√ß√£o normal,
    usando a regra dos trap√©zios para integra√ß√£o num√©rica.

    Par√¢metros:
    - a: limite inferior do intervalo
    - b: limite superior do intervalo
    - media: m√©dia da distribui√ß√£o
    - desvio: desvio padr√£o
    - passos: n√∫mero de subdivis√µes (maior = mais preciso)

    Retorna:
    - estimativa da probabilidade no intervalo [a, b]
    """
    largura = (b - a) / passos
    soma = 0
    for i in range(passos):
        x0 = a + i * largura
        x1 = a + (i + 1) * largura
        y0 = densidade_normal(x0, media, desvio)
        y1 = densidade_normal(x1, media, desvio)
        area_trapezio = (y0 + y1) * largura / 2
        soma += area_trapezio
    return soma

# Estimando P(60 <= X <= 80) em uma normal com m√©dia 70 e desvio padr√£o 10
p = probabilidade_intervalo(60, 80, media=70, desvio=10)
print(f"Probabilidade entre 60 e 80: {p:.4f}")

Probabilidade entre 60 e 80: 0.6827
