> Em situa√ß√µes como experimentos de Bernoulli repetidos independentemente (como lan√ßamentos de moedas, testes de qualidade ou contagem de sucessos em amostras com reposi√ß√£o), a vari√°vel aleat√≥ria que conta o n√∫mero de sucessos em um conjunto fixo de tentativas segue uma **distribui√ß√£o binomial**.

## Objetivo

Este notebook √© o terceiro de uma s√©rie que busca encaixar os conhecimentos de vari√°veis aleat√≥rias num *framework* que nos permita modelar e compreender a ordem dos aprendizados sobre distribui√ß√µes de vari√°veis aleat√≥rias. Neste documento, iremos analisar e caracterizar vari√°veis aleat√≥rias modeladas segundo uma distribui√ß√£o **binomial**.

<center>
<img src='\images\framework.png'>
</center>

**Digress√£o quanto as nota√ß√µes**
* $X$ √© a vari√°vel aleat√≥ria (fun√ß√£o que associa subconjuntos de $S$ nos $\mathbb{R}$ - $X:S\rightarrow \mathbb{R}$
* $\mathcal{X}$ √© a **imagem** da vari√°vel aleat√≥ria $X$. Isto √©, o conjunto de todos os valores de $X(s_i)$ pode assumir
* $P$ ou tamb√©m $P(s)$ √© a fun√ß√£o de probabilidade definida sobre o espa√ßo amostral
* $P_X$ ou tamb√©m $P_X(X=x)$ √© a fun√ß√£o de probabilidade definida sobre a vari√°vel aleat√≥ria $X$. O subscrito √© para enfatizar que se trata de uma probabilidade induzida, pois seu c√°lculo √© definido indiretamente.

## 1. Defini√ß√£o do Espa√ßo Amostral $ S $

Seja um experimento aleat√≥rio onde realizamos **$ n $ ensaios de Bernoulli independentes**, cada um com probabilidade de sucesso $ p $ e probabilidade de fracasso $ 1 - p $.

O espa√ßo amostral $ S $ ser√° definido como o conjunto de todas as sequ√™ncias de $ n $ tentativas, onde cada tentativa pode ser sucesso ($ 1 $) ou fracasso ($ 0 $):

$$
S = \{s_1, s_2, ..., s_m\}
$$

onde cada $ s_i $ representa uma sequ√™ncia de $ n $ observa√ß√µes. O n√∫mero total de elementos no espa√ßo amostral √©:

$$
m = 2^n
$$

J√° que cada um dos $ n $ ensaios pode resultar em **sucesso ou fracasso**, h√° $ 2^n $ sequ√™ncias poss√≠veis.

> A **distribui√ß√£o binomial** modela o n√∫mero total de sucessos em $ n $ tentativas independentes de um experimento de Bernoulli, onde cada tentativa tem uma probabilidade $ p $ de sucesso.

> Antes de partir para defini√ß√£o da fun√ß√£o de probabilidade, acho importante sempre exercitar o conceito de que espa√ßos amostrais e vari√°veis aleat√≥rias est√£o associadas a experimentos. Os resultados (eventos) dos experimentos s√£o base para constru√ß√£o desses conceitos e √© importante ter em mente como eles aparecem nas situa√ß√µes reais. Sendo assim, vou listar alguns exemplos de situa√ß√µes onde experimentos de Bernoulli s√£o utilizados para modelar um aspecto real do dia-a-dia. Somente a partir do enquadramento do experimento √© que podemos definir seu espa√ßo amostral, calcular sua cardinalidade e pensar em qual vari√°vel aleat√≥ria ser√° definida.

**a. Controle de Qualidade na Ind√∫stria**

*Experimento*<br>
Uma f√°brica produz componentes eletr√¥nicos e quer verificar se h√° defeitos em sua produ√ß√£o. Para isso, seleciona aleatoriamente **20 pe√ßas** de um lote e verifica quantas s√£o defeituosas.

<div style="text-align: center;">
    <img src="\images\defective_screws.png" style="max-width: 50%; height: auto;">
</div>


*Defini√ß√£o do Espa√ßo Amostral $ S $*<br>
Cada pe√ßa inspecionada pode ser defeituosa ‚ùå ou n√£o defeituosa ‚úÖ. Assim, o espa√ßo amostral √© composto por todas as sequ√™ncias poss√≠veis de 20 inspe√ß√µes, onde cada pe√ßa pode ser defeituosa ou n√£o:

$$
S = \{(s_1, s_2, ..., s_{20}) \mid s_i \in \{\text{defeituosa}, \text{n√£o-defeituosa}\}
$$

*Cardinalidade de $S$*

$$
\Omega_{S} = 2^{20}
$$

---

**b.Testes Diagn√≥sticos em Medicina**

*Experimento*<br>
Um hospital quer avaliar a efic√°cia de um teste diagn√≥stico para uma doen√ßa. O teste tem uma taxa de acerto de **90%** para pacientes infectados. Aplicamos esse teste a **50 pacientes** sabidamente infectados e registramos quantos resultados s√£o **positivos**.

<div style="text-align: center;">
    <img src="\images\test_results.png" style="max-width: 50%; height: auto;">
</div>

*Defini√ß√£o do Espa√ßo Amostral $ S $*<br>
Cada teste pode ter dois resultados poss√≠veis: positivo ‚úÖ ou negativo ‚ùå. Assim, o espa√ßo amostral cont√©m todas as sequ√™ncias poss√≠veis de **50 testes**, onde cada teste pode ser positivo ou negativo:

$$
S = \{(s_1, s_2, ..., s_{50}) \mid s_i \in \{\text{positivo}, \text{negativo}\}
$$

*Cardinalidade de $S$*

$$
\Omega_{S} = 2^{50}
$$

---

**c. Elei√ß√µes e Pesquisas de Opini√£o**

*Experimento*<br>
Uma empresa de pesquisas entrevista **500 eleitores** para estimar a inten√ß√£o de voto em um candidato. Suponha que a verdadeira taxa de apoio ao candidato seja **40%**.

*Defini√ß√£o do Espa√ßo Amostral $ S $*<br>
Cada eleitor pode votar no candidato A ou n√£o votar no candidato B. Assim, o espa√ßo amostral cont√©m todas as sequ√™ncias poss√≠veis de **500 respostas**, onde cada eleitor pode apoiar ou n√£o:

$$
S = \{(s_1, s_2, ..., s_{500}) \mid s_i \in \{\text{Candidato A}, \text{Candidado B}\}
$$

$s_i$ √© o voto do *i-esimo* eleitor

*Cardinalidade de $S$*

$$
\Omega_{S} = 2^{500}
$$

## 2. Defini√ß√£o da Fun√ß√£o de Probabilidade $ P $ sobre $ S $
Para obter a fun√ß√£o de probabilidade nesse caso, vamos utilizar os axiomas de Kolmogorov

$$P(A) \geq 0, \quad \forall A \subseteq S$$
   Ou seja, a probabilidade de qualquer evento sempre √© um n√∫mero **n√£o negativo**.

$$P(S) = 1$$
   A soma das probabilidades de **todos os elementos do espa√ßo amostral $ S $** deve ser **1**.


Se $ A_1, A_2, \dots, A_n $ s√£o **eventos mutuamente exclusivos**, ent√£o:
$$P(A_1 \cup A_2 \cup \dots \cup A_n) = P(A_1) + P(A_2) + \dots + P(A_n)$$
Ou seja, a probabilidade da uni√£o de eventos disjuntos √© a soma das probabilidades individuais.

O espa√ßo amostral √© o conjunto de **todas as poss√≠veis sequ√™ncias** de $ n $ ensaios de Bernoulli, ou seja:

$$
S = \{ (s_1, s_2, ..., s_n) \mid s_i \in \{0,1\} \}
$$

Cada $ s_i $ representa o resultado de um ensaio individual.

O total de elementos em $ S $ √©:

$$
|S| = 2^n
$$

√ìtima observa√ß√£o! O objetivo agora √© **n√£o assumir** a exist√™ncia de \( p \) diretamente, mas sim **deduzi-lo a partir do espa√ßo amostral \( S \)** e da fun√ß√£o de probabilidade \( P(S) \).

---

## **üìå 1. Defini√ß√£o do Experimento**
Consideramos uma **pesquisa eleitoral** com **500 eleitores**, onde cada eleitor vota em um dos dois candidatos: **\( A \) ou \( B \)**.

O objetivo √© determinar **quantos votos \( A \) recebe**.

---

## **üìå 2. Defini√ß√£o do Espa√ßo Amostral \( S \)**
O espa√ßo amostral \( S \) cont√©m **todas as poss√≠veis sequ√™ncias** de votos dos **500 eleitores**, onde cada voto pode ser **A ou B**:

\[
S = \{ (s_1, s_2, ..., s_{500}) \mid s_i \in \{A, B\} \}
\]

Cada **sequ√™ncia espec√≠fica** \( s_i \) representa **um conjunto de 500 votos**, como:

\[
(A, B, A, A, B, A, B, ..., A)
\]

O n√∫mero total de elementos em \( S \) √©:

\[
|S| = 2^{500}
\]

Cada elemento \( s_i \) do espa√ßo amostral √© uma **realiza√ß√£o espec√≠fica do experimento**.

---

## **üìå 3. Defini√ß√£o da Fun√ß√£o de Probabilidade \( P(S) \)**
Agora, **sem assumir previamente a exist√™ncia de \( p \)**, precisamos definir **como atribuir probabilidades a cada elemento \( s_i \) do espa√ßo amostral**.

Vamos definir a probabilidade de qualquer sequ√™ncia espec√≠fica \( (s_1, s_2, ..., s_{500}) \) a partir de algumas suposi√ß√µes:

1Ô∏è‚É£ **Cada eleitor vota de forma independente dos outros.**  
2Ô∏è‚É£ **Todos os eleitores t√™m a mesma tend√™ncia de voto.**  
3Ô∏è‚É£ **Apenas duas op√ß√µes s√£o poss√≠veis para cada voto: \( A \) ou \( B \).**  

Com base nessas suposi√ß√µes, cada voto individual \( s_i \) pode ser visto como o resultado de um **ensaio de Bernoulli** com:

- **\( P(A) = \theta_A \)** (probabilidade de um eleitor votar em \( A \)).
- **\( P(B) = \theta_B \)** (probabilidade de um eleitor votar em \( B \)).

Pela **soma das probabilidades dos eventos elementares**:

\[
\theta_A + \theta_B = 1
\]

Como cada eleitor vota de forma **independente**, a probabilidade de uma sequ√™ncia espec√≠fica \( (s_1, s_2, ..., s_{500}) \) ocorre como o **produto das probabilidades individuais**:

\[
P(s_1, s_2, ..., s_{500}) = \prod_{i=1}^{500} P(s_i)
\]

onde, para cada \( i \):

\[
P(s_i) =
\begin{cases}
\theta_A, & \text{se } s_i = A \\
\theta_B, & \text{se } s_i = B
\end{cases}
\]

Agora, seja \( k \) o **n√∫mero total de votos para \( A \) na sequ√™ncia**. Ent√£o, h√° **\( k \) eleitores votando em \( A \)** e **\( 500 - k \) votando em \( B \)**. A probabilidade da sequ√™ncia inteira ser observada √©:

\[
P(s_i) = \theta_A^k \theta_B^{500 - k}
\]

Essa √© a **probabilidade atribu√≠da a cada elemento do espa√ßo amostral**.

Agora, como **\( \theta_A \) e \( \theta_B \) s√£o par√¢metros livres**, convencionamos a nota√ß√£o usual:

\[
p = \theta_A, \quad 1 - p = \theta_B
\]

Chegamos ent√£o √† forma:

\[
P(s_i) = p^k (1 - p)^{500 - k}
\]

---

## **üìå 4. Defini√ß√£o da Vari√°vel Aleat√≥ria \( X \)**
Agora que temos a fun√ß√£o de probabilidade sobre \( S \), definimos a vari√°vel aleat√≥ria \( X \):

\[
X: S \to \mathbb{R}
\]

onde \( X(s_i) \) √© o **n√∫mero total de votos para \( A \) na sequ√™ncia \( s_i \)**:

\[
X(s_i) = \sum_{i=1}^{500} \mathbb{1}(s_i = A)
\]

Aqui, \( \mathbb{1}(s_i = A) \) √© a **fun√ß√£o indicadora**, que vale:
- **1** se o eleitor \( i \) votou em \( A \),
- **0** caso contr√°rio.

A vari√°vel aleat√≥ria \( X \) **conta** quantos eleitores votaram em \( A \).

---

## **üìå 5. Probabilidade Induzida \( P_X(X = k) \)**
Agora, queremos calcular a **probabilidade de \( X = k \)**, ou seja, a probabilidade de exatamente **\( k \) eleitores** votarem em \( A \).

A quantidade de maneiras de escolher **quais \( k \) posi√ß√µes** conter√£o votos para \( A \) nos \( 500 \) eleitores √© dada pelo **coeficiente binomial**:

\[
\binom{500}{k} = \frac{500!}{k!(500-k)!}
\]

Portanto, a **probabilidade de que exatamente \( k \) eleitores votem em \( A \)** √©:

\[
P_X(X = k) = \binom{500}{k} p^k (1 - p)^{500 - k}
\]

onde:
- **\( \binom{500}{k} \)** representa todas as formas poss√≠veis de escolher **quais \( k \) eleitores** votaram em \( A \).
- **\( p^k (1 - p)^{500 - k} \)** √© a probabilidade de uma sequ√™ncia espec√≠fica com \( k \) votos para \( A \) e \( 500 - k \) votos para \( B \).

---

## **üìå Conex√£o entre \( S \) e \( P_X(X = k) \)**
Agora podemos ver claramente a transi√ß√£o:

1Ô∏è‚É£ **Defini√ß√£o do espa√ßo amostral \( S \)**: Todas as **sequ√™ncias de votos poss√≠veis**.  
2Ô∏è‚É£ **Defini√ß√£o da fun√ß√£o de probabilidade \( P(S) \)**: Cada **sequ√™ncia espec√≠fica** tem uma probabilidade baseada em **\( \theta_A \) e \( \theta_B \)**.  
3Ô∏è‚É£ **Defini√ß√£o da vari√°vel aleat√≥ria \( X \)**: Resume **o n√∫mero total de votos para \( A \)** em uma sequ√™ncia.  
4Ô∏è‚É£ **Deriva√ß√£o da distribui√ß√£o de \( X \)**: Contamos **todas as sequ√™ncias que levam ao mesmo n√∫mero \( k \) de votos para \( A \), usando a distribui√ß√£o binomial**.

---

## **üìå Conclus√£o**
‚úî **Agora a conex√£o entre \( S \) e a probabilidade definida sobre \( S \) est√° expl√≠cita!**  
‚úî **O espa√ßo amostral cont√©m sequ√™ncias completas de eleitores votando em \( A \) ou \( B \).**  
‚úî **A fun√ß√£o de probabilidade \( P(S) \) √© definida a partir dos par√¢metros \( \theta_A \) e \( \theta_B \), sem assumir \( p \) a priori.**  
‚úî **A vari√°vel aleat√≥ria \( X \) resume o problema e leva √† distribui√ß√£o binomial.**  

Se precisar de mais detalhes ou quiser expandir para outros exemplos, me avise! üöÄ

## 3. Defini√ß√£o da Vari√°vel Aleat√≥ria $ X $

Agora que temos o espa√ßo amostral $ S $ e a **fun√ß√£o de probabilidade $ P $ definida sobre $ S $**, podemos definir a vari√°vel aleat√≥ria $ X $.

A vari√°vel aleat√≥ria $ X $ ser√° definida como o n√∫mero de sucessos em $ n $ tentativas de Bernoulli. Assim, $ X $ √© uma fun√ß√£o que mapeia cada sequ√™ncia $ s_i $ do espa√ßo amostral $ S $ para um n√∫mero real:

$$
X: S \to \mathbb{R}
$$

onde,

$$
X(s_i) = k
$$

significa que a sequ√™ncia $ s_i $ cont√©m exatamente $ k $ sucessos.

## 4. Probabilidade Induzida $ P_X(X = x) $

Agora que definimos $ X $, podemos calcular a **distribui√ß√£o de probabilidade** de $ X $, $ P_X(X = x) $, que √© dada por:

$$
P_X(X = k) = P(\{s_i \in S: X(s_i) = k\})
$$

A quantidade de formas diferentes de obter exatamente $ k $ sucessos em $ n $ tentativas √© dada pelo coeficiente binomial:

$$
\# \text{de maneiras de obter } k \text{ sucessos} = \binom{n}{k}
$$

Cada uma dessas sequ√™ncias tem a mesma probabilidade de ocorrer:

$$
P(\text{uma sequ√™ncia com } k \text{ sucessos}) = p^k (1 - p)^{n - k}
$$

Portanto, a **fun√ß√£o de massa de probabilidade (PMF)** da distribui√ß√£o binomial √©:

$$
P_X(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k \in \{0, 1, 2, ..., n\}
$$

## 5. Probabilidade acumulada $P_X(X\le x)$

A **CDF** da distribui√ß√£o binomial √©:

$$
F(x) = P(X \leq x) = \sum_{j=0}^{x} P_X(X = j)
$$

Ou seja, $ F_X(x) $ √© a soma das probabilidades da PMF at√© o valor $ x $.

## 6. Momentos da distribui√ß√£o

Momentos s√£o estat√≠sticas √∫teis para caracterizar a distribui√ß√£o de uma vari√°vel aleat√≥ria. Os mais importantes s√£o a **m√©dia** e a **vari√¢ncia**.

### **6.1. M√©dia ($\mu$) - Primeiro momento**
O valor esperado de $ X $ √©:

$$
\mathbb{E}[X] = n p
$$

### **6.2. Vari√¢ncia $\text{Var}(X)$ - Segundo momento central**
A vari√¢ncia da distribui√ß√£o binomial √©:

$$
\text{Var}(X) = n p (1 - p)
$$