> Em situações como experimentos de Bernoulli repetidos independentemente (como lançamentos de moedas, testes de qualidade ou contagem de sucessos em amostras com reposição), a variável aleatória que conta o número de sucessos em um conjunto fixo de tentativas segue uma **distribuição binomial**.

## Objetivo

Este notebook é o terceiro de uma série que busca encaixar os conhecimentos de variáveis aleatórias num *framework* que nos permita modelar e compreender a ordem dos aprendizados sobre distribuições de variáveis aleatórias. Neste documento, iremos analisar e caracterizar variáveis aleatórias modeladas segundo uma distribuição **binomial**.

<center>
<img src='\images\framework.png'>
</center>

**Digressão quanto as notações**
* $X$ é a variável aleatória (função que associa subconjuntos de $S$ nos $\mathbb{R}$ - $X:S\rightarrow \mathbb{R}$
* $\mathcal{X}$ é a **imagem** da variável aleatória $X$. Isto é, o conjunto de todos os valores de $X(s_i)$ pode assumir
* $P$ ou também $P(s)$ é a função de probabilidade definida sobre o espaço amostral
* $P_X$ ou também $P_X(X=x)$ é a função de probabilidade definida sobre a variável aleatória $X$. O subscrito é para enfatizar que se trata de uma probabilidade induzida, pois seu cálculo é definido indiretamente.

## 1. Definição do Espaço Amostral $ S $

Seja um experimento aleatório onde realizamos **$ n $ ensaios de Bernoulli independentes**, cada um com probabilidade de sucesso $ p $ e probabilidade de fracasso $ 1 - p $.

O espaço amostral $ S $ será definido como o conjunto de todas as sequências de $ n $ tentativas, onde cada tentativa pode ser sucesso ($ 1 $) ou fracasso ($ 0 $):

$$
S = \{s_1, s_2, ..., s_m\}
$$

onde cada $ s_i $ representa uma sequência de $ n $ observações. O número total de elementos no espaço amostral é:

$$
m = 2^n
$$

Já que cada um dos $ n $ ensaios pode resultar em **sucesso ou fracasso**, há $ 2^n $ sequências possíveis.

> A **distribuição binomial** modela o número total de sucessos em $ n $ tentativas independentes de um experimento de Bernoulli, onde cada tentativa tem uma probabilidade $ p $ de sucesso.

> Antes de partir para definição da função de probabilidade, acho importante sempre exercitar o conceito de que espaços amostrais e variáveis aleatórias estão associadas a experimentos. Os resultados (eventos) dos experimentos são base para construção desses conceitos e é importante ter em mente como eles aparecem nas situações reais. Sendo assim, vou listar alguns exemplos de situações onde experimentos de Bernoulli são utilizados para modelar um aspecto real do dia-a-dia. Somente a partir do enquadramento do experimento é que podemos definir seu espaço amostral, calcular sua cardinalidade e pensar em qual variável aleatória será definida.

**a. Controle de Qualidade na Indústria**

*Experimento*<br>
Uma fábrica produz componentes eletrônicos e quer verificar se há defeitos em sua produção. Para isso, seleciona aleatoriamente **20 peças** de um lote e verifica quantas são defeituosas.

<div style="text-align: center;">
    <img src="\images\defective_screws.png" style="max-width: 50%; height: auto;">
</div>


*Definição do Espaço Amostral $ S $*<br>
Cada peça inspecionada pode ser defeituosa ❌ ou não defeituosa ✅. Assim, o espaço amostral é composto por todas as sequências possíveis de 20 inspeções, onde cada peça pode ser defeituosa ou não:

$$
S = \{(s_1, s_2, ..., s_{20}) \mid s_i \in \{\text{defeituosa}, \text{não-defeituosa}\}
$$

*Cardinalidade de $S$*

$$
\Omega_{S} = 2^{20}
$$

---

**b.Testes Diagnósticos em Medicina**

*Experimento*<br>
Um hospital quer avaliar a eficácia de um teste diagnóstico para uma doença. O teste tem uma taxa de acerto de **90%** para pacientes infectados. Aplicamos esse teste a **50 pacientes** sabidamente infectados e registramos quantos resultados são **positivos**.

<div style="text-align: center;">
    <img src="\images\test_results.png" style="max-width: 50%; height: auto;">
</div>

*Definição do Espaço Amostral $ S $*<br>
Cada teste pode ter dois resultados possíveis: positivo ✅ ou negativo ❌. Assim, o espaço amostral contém todas as sequências possíveis de **50 testes**, onde cada teste pode ser positivo ou negativo:

$$
S = \{(s_1, s_2, ..., s_{50}) \mid s_i \in \{\text{positivo}, \text{negativo}\}
$$

*Cardinalidade de $S$*

$$
\Omega_{S} = 2^{50}
$$

---

**c. Eleições e Pesquisas de Opinião**

*Experimento*<br>
Uma empresa de pesquisas entrevista **500 eleitores** para estimar a intenção de voto em um candidato. Suponha que a verdadeira taxa de apoio ao candidato seja **40%**.

*Definição do Espaço Amostral $ S $*<br>
Cada eleitor pode votar no candidato A ou não votar no candidato B. Assim, o espaço amostral contém todas as sequências possíveis de **500 respostas**, onde cada eleitor pode apoiar ou não:

$$
S = \{(s_1, s_2, ..., s_{500}) \mid s_i \in \{\text{Candidato A}, \text{Candidado B}\}
$$

$s_i$ é o voto do *i-esimo* eleitor

*Cardinalidade de $S$*

$$
\Omega_{S} = 2^{500}
$$

## 2. Definição da Função de Probabilidade $ P $ sobre $ S $
Para obter a função de probabilidade nesse caso, vamos utilizar os axiomas de Kolmogorov

$$P(A) \geq 0, \quad \forall A \subseteq S$$
   Ou seja, a probabilidade de qualquer evento sempre é um número **não negativo**.

$$P(S) = 1$$
   A soma das probabilidades de **todos os elementos do espaço amostral $ S $** deve ser **1**.


Se $ A_1, A_2, \dots, A_n $ são **eventos mutuamente exclusivos**, então:
$$P(A_1 \cup A_2 \cup \dots \cup A_n) = P(A_1) + P(A_2) + \dots + P(A_n)$$
Ou seja, a probabilidade da união de eventos disjuntos é a soma das probabilidades individuais.

O espaço amostral é o conjunto de **todas as possíveis sequências** de $ n $ ensaios de Bernoulli, ou seja:

$$
S = \{ (s_1, s_2, ..., s_n) \mid s_i \in \{0,1\} \}
$$

Cada $ s_i $ representa o resultado de um ensaio individual.

O total de elementos em $ S $ é:

$$
|S| = 2^n
$$

Ótima observação! O objetivo agora é **não assumir** a existência de \( p \) diretamente, mas sim **deduzi-lo a partir do espaço amostral \( S \)** e da função de probabilidade \( P(S) \).

---

## **📌 1. Definição do Experimento**
Consideramos uma **pesquisa eleitoral** com **500 eleitores**, onde cada eleitor vota em um dos dois candidatos: **\( A \) ou \( B \)**.

O objetivo é determinar **quantos votos \( A \) recebe**.

---

## **📌 2. Definição do Espaço Amostral \( S \)**
O espaço amostral \( S \) contém **todas as possíveis sequências** de votos dos **500 eleitores**, onde cada voto pode ser **A ou B**:

\[
S = \{ (s_1, s_2, ..., s_{500}) \mid s_i \in \{A, B\} \}
\]

Cada **sequência específica** \( s_i \) representa **um conjunto de 500 votos**, como:

\[
(A, B, A, A, B, A, B, ..., A)
\]

O número total de elementos em \( S \) é:

\[
|S| = 2^{500}
\]

Cada elemento \( s_i \) do espaço amostral é uma **realização específica do experimento**.

---

## **📌 3. Definição da Função de Probabilidade \( P(S) \)**
Agora, **sem assumir previamente a existência de \( p \)**, precisamos definir **como atribuir probabilidades a cada elemento \( s_i \) do espaço amostral**.

Vamos definir a probabilidade de qualquer sequência específica \( (s_1, s_2, ..., s_{500}) \) a partir de algumas suposições:

1️⃣ **Cada eleitor vota de forma independente dos outros.**  
2️⃣ **Todos os eleitores têm a mesma tendência de voto.**  
3️⃣ **Apenas duas opções são possíveis para cada voto: \( A \) ou \( B \).**  

Com base nessas suposições, cada voto individual \( s_i \) pode ser visto como o resultado de um **ensaio de Bernoulli** com:

- **\( P(A) = \theta_A \)** (probabilidade de um eleitor votar em \( A \)).
- **\( P(B) = \theta_B \)** (probabilidade de um eleitor votar em \( B \)).

Pela **soma das probabilidades dos eventos elementares**:

\[
\theta_A + \theta_B = 1
\]

Como cada eleitor vota de forma **independente**, a probabilidade de uma sequência específica \( (s_1, s_2, ..., s_{500}) \) ocorre como o **produto das probabilidades individuais**:

\[
P(s_1, s_2, ..., s_{500}) = \prod_{i=1}^{500} P(s_i)
\]

onde, para cada \( i \):

\[
P(s_i) =
\begin{cases}
\theta_A, & \text{se } s_i = A \\
\theta_B, & \text{se } s_i = B
\end{cases}
\]

Agora, seja \( k \) o **número total de votos para \( A \) na sequência**. Então, há **\( k \) eleitores votando em \( A \)** e **\( 500 - k \) votando em \( B \)**. A probabilidade da sequência inteira ser observada é:

\[
P(s_i) = \theta_A^k \theta_B^{500 - k}
\]

Essa é a **probabilidade atribuída a cada elemento do espaço amostral**.

Agora, como **\( \theta_A \) e \( \theta_B \) são parâmetros livres**, convencionamos a notação usual:

\[
p = \theta_A, \quad 1 - p = \theta_B
\]

Chegamos então à forma:

\[
P(s_i) = p^k (1 - p)^{500 - k}
\]

---

## **📌 4. Definição da Variável Aleatória \( X \)**
Agora que temos a função de probabilidade sobre \( S \), definimos a variável aleatória \( X \):

\[
X: S \to \mathbb{R}
\]

onde \( X(s_i) \) é o **número total de votos para \( A \) na sequência \( s_i \)**:

\[
X(s_i) = \sum_{i=1}^{500} \mathbb{1}(s_i = A)
\]

Aqui, \( \mathbb{1}(s_i = A) \) é a **função indicadora**, que vale:
- **1** se o eleitor \( i \) votou em \( A \),
- **0** caso contrário.

A variável aleatória \( X \) **conta** quantos eleitores votaram em \( A \).

---

## **📌 5. Probabilidade Induzida \( P_X(X = k) \)**
Agora, queremos calcular a **probabilidade de \( X = k \)**, ou seja, a probabilidade de exatamente **\( k \) eleitores** votarem em \( A \).

A quantidade de maneiras de escolher **quais \( k \) posições** conterão votos para \( A \) nos \( 500 \) eleitores é dada pelo **coeficiente binomial**:

\[
\binom{500}{k} = \frac{500!}{k!(500-k)!}
\]

Portanto, a **probabilidade de que exatamente \( k \) eleitores votem em \( A \)** é:

\[
P_X(X = k) = \binom{500}{k} p^k (1 - p)^{500 - k}
\]

onde:
- **\( \binom{500}{k} \)** representa todas as formas possíveis de escolher **quais \( k \) eleitores** votaram em \( A \).
- **\( p^k (1 - p)^{500 - k} \)** é a probabilidade de uma sequência específica com \( k \) votos para \( A \) e \( 500 - k \) votos para \( B \).

---

## **📌 Conexão entre \( S \) e \( P_X(X = k) \)**
Agora podemos ver claramente a transição:

1️⃣ **Definição do espaço amostral \( S \)**: Todas as **sequências de votos possíveis**.  
2️⃣ **Definição da função de probabilidade \( P(S) \)**: Cada **sequência específica** tem uma probabilidade baseada em **\( \theta_A \) e \( \theta_B \)**.  
3️⃣ **Definição da variável aleatória \( X \)**: Resume **o número total de votos para \( A \)** em uma sequência.  
4️⃣ **Derivação da distribuição de \( X \)**: Contamos **todas as sequências que levam ao mesmo número \( k \) de votos para \( A \), usando a distribuição binomial**.

---

## **📌 Conclusão**
✔ **Agora a conexão entre \( S \) e a probabilidade definida sobre \( S \) está explícita!**  
✔ **O espaço amostral contém sequências completas de eleitores votando em \( A \) ou \( B \).**  
✔ **A função de probabilidade \( P(S) \) é definida a partir dos parâmetros \( \theta_A \) e \( \theta_B \), sem assumir \( p \) a priori.**  
✔ **A variável aleatória \( X \) resume o problema e leva à distribuição binomial.**  

Se precisar de mais detalhes ou quiser expandir para outros exemplos, me avise! 🚀

## 3. Definição da Variável Aleatória $ X $

Agora que temos o espaço amostral $ S $ e a **função de probabilidade $ P $ definida sobre $ S $**, podemos definir a variável aleatória $ X $.

A variável aleatória $ X $ será definida como o número de sucessos em $ n $ tentativas de Bernoulli. Assim, $ X $ é uma função que mapeia cada sequência $ s_i $ do espaço amostral $ S $ para um número real:

$$
X: S \to \mathbb{R}
$$

onde,

$$
X(s_i) = k
$$

significa que a sequência $ s_i $ contém exatamente $ k $ sucessos.

## 4. Probabilidade Induzida $ P_X(X = x) $

Agora que definimos $ X $, podemos calcular a **distribuição de probabilidade** de $ X $, $ P_X(X = x) $, que é dada por:

$$
P_X(X = k) = P(\{s_i \in S: X(s_i) = k\})
$$

A quantidade de formas diferentes de obter exatamente $ k $ sucessos em $ n $ tentativas é dada pelo coeficiente binomial:

$$
\# \text{de maneiras de obter } k \text{ sucessos} = \binom{n}{k}
$$

Cada uma dessas sequências tem a mesma probabilidade de ocorrer:

$$
P(\text{uma sequência com } k \text{ sucessos}) = p^k (1 - p)^{n - k}
$$

Portanto, a **função de massa de probabilidade (PMF)** da distribuição binomial é:

$$
P_X(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k \in \{0, 1, 2, ..., n\}
$$

## 5. Probabilidade acumulada $P_X(X\le x)$

A **CDF** da distribuição binomial é:

$$
F(x) = P(X \leq x) = \sum_{j=0}^{x} P_X(X = j)
$$

Ou seja, $ F_X(x) $ é a soma das probabilidades da PMF até o valor $ x $.

## 6. Momentos da distribuição

Momentos são estatísticas úteis para caracterizar a distribuição de uma variável aleatória. Os mais importantes são a **média** e a **variância**.

### **6.1. Média ($\mu$) - Primeiro momento**
O valor esperado de $ X $ é:

$$
\mathbb{E}[X] = n p
$$

### **6.2. Variância $\text{Var}(X)$ - Segundo momento central**
A variância da distribuição binomial é:

$$
\text{Var}(X) = n p (1 - p)
$$