# Tutorial de Distribuição Binomial

Este notebook apresenta um guia completo sobre a distribuição binomial, seus conceitos, fórmulas e aplicações práticas em Python.

## Conteúdo
1. Introdução à Distribuição Binomial
2. Fundamentos Matemáticos
3. Implementação em Python
4. Visualizações
5. Exemplos Práticos
6. Método de Newton-Raphson
7. Aplicações Avançadas

## 1. Introdução à Distribuição Binomial

A distribuição binomial é um modelo probabilístico discreto que modela o número de sucessos em uma sequência de experimentos independentes. É um dos modelos probabilísticos mais importantes e amplamente utilizados.

### Características da Distribuição Binomial:

- Número fixo de tentativas (n)
- Tentativas independentes
- Apenas dois resultados possíveis por tentativa (sucesso/fracasso)
- Probabilidade constante de sucesso (p) em cada tentativa

### Aplicações Comuns:

- Lançamento de moedas ou dados
- Controle de qualidade industrial
- Testes clínicos (sucesso/fracasso de tratamentos)
- Pesquisas de opinião (sim/não)
- Análise de risco e seguros

## 2. Fundamentos Matemáticos

### Fórmula da Distribuição Binomial

A probabilidade de obter exatamente $k$ sucessos em $n$ tentativas é dada por:

$$ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} $$

Onde:
- $n$ é o número de tentativas
- $k$ é o número de sucessos
- $p$ é a probabilidade de sucesso em cada tentativa
- $\binom{n}{k}$ é o coeficiente binomial, dado por $\frac{n!}{k!(n-k)!}$

### Propriedades Estatísticas

- **Média (Valor Esperado)**: $\mu = n \times p$
- **Variância**: $\sigma^2 = n \times p \times (1-p)$
- **Desvio Padrão**: $\sigma = \sqrt{n \times p \times (1-p)}$

In [None]:
# Importar bibliotecas necessárias
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import math
from scipy.stats import binom

# Configuração para visualizações
plt.style.use('ggplot')
sns.set_palette('viridis')
plt.rcParams['figure.figsize'] = [12, 6]
plt.rcParams['font.size'] = 12

## 3. Implementação em Python

Vamos implementar as funções necessárias para trabalhar com a distribuição binomial.

In [None]:
class DistribuicaoBinomial:
    """Implementação da distribuição binomial."""
    
    def __init__(self, n, p):
        """Inicializa a distribuição binomial."""
        self._validar_parametros(n, p)
        self.n = n
        self.p = p
        self.media, self.variancia = self._calcular_estatisticas()
    
    @staticmethod
    def _validar_parametros(n, p):
        """Valida os parâmetros da distribuição."""
        if not isinstance(n, int):
            raise TypeError("n deve ser um número inteiro")
        if n < 0:
            raise ValueError("n deve ser não negativo")
        if not 0 <= p <= 1:
            raise ValueError("p deve estar entre 0 e 1")
    
    def _calcular_estatisticas(self):
        """Calcula a média e variância da distribuição."""
        media = self.n * self.p
        variancia = self.n * self.p * (1 - self.p)
        return media, variancia
    
    def calcular_coeficiente_binomial(self, k):
        """Calcula o coeficiente binomial C(n,k)."""
        if k > self.n:
            raise ValueError("k não pode ser maior que n")
        return math.comb(self.n, k)
    
    def pmf(self, k):
        """Calcula a função massa de probabilidade P(X = k)."""
        return binom.pmf(k, self.n, self.p)
    
    def pmf_manual(self, k):
        """Calcula manualmente a função massa de probabilidade."""
        coef = self.calcular_coeficiente_binomial(k)
        return coef * (self.p ** k) * ((1 - self.p) ** (self.n - k))
    
    def cdf(self, k):
        """Calcula a função de distribuição acumulada P(X ≤ k)."""
        return binom.cdf(k, self.n, self.p)
    
    def sf(self, k):
        """Calcula a função de sobrevivência P(X > k)."""
        return 1 - self.cdf(k)
    
    def plotar_distribuicao(self, titulo=None):
        """Plota a distribuição de probabilidade."""
        k = np.arange(0, self.n + 1)
        prob = binom.pmf(k, self.n, self.p)
        
        plt.figure(figsize=(12, 6))
        bars = plt.bar(k, prob, alpha=0.8, color='darkblue', width=0.7)
        
        # Adicionar valores acima das barras
        for bar in bars:
            height = bar.get_height()
            if height > 0.01:  # Só mostrar valores significativos
                plt.text(bar.get_x() + bar.get_width()/2., height + 0.01,
                        f'{height:.3f}', ha='center', va='bottom')
        
        plt.title(titulo or f'Distribuição Binomial (n={self.n}, p={self.p})')
        plt.xlabel('Número de Sucessos (k)')
        plt.ylabel('Probabilidade')
        plt.grid(True, alpha=0.3)
        plt.xticks(k)
        plt.ylim(0, max(prob) * 1.2)  # Dar espaço para os valores acima das barras
        
        # Adicionar linha com média
        plt.axvline(x=self.media, color='red', linestyle='--', 
                   label=f'Média: {self.media:.2f}')
        
        plt.legend()
        plt.show()
    
    def resumo(self):
        """Imprime um resumo das estatísticas da distribuição."""
        print(f"Distribuição Binomial com n={self.n}, p={self.p}")
        print(f"Média (μ): {self.media}")
        print(f"Variância (σ²): {self.variancia}")
        print(f"Desvio Padrão (σ): {np.sqrt(self.variancia):.4f}")
        
        # Calcular probabilidades para todos os valores possíveis
        print("\nTabela de probabilidades:")
        print("k\tP(X=k)\tP(X≤k)")
        for k in range(self.n + 1):
            print(f"{k}\t{self.pmf(k):.4f}\t{self.cdf(k):.4f}")

## 4. Visualizações

Vamos criar alguns exemplos para visualizar a distribuição binomial com diferentes parâmetros.

In [None]:
# Criar e visualizar várias distribuições binomiais
fig, axes = plt.subplots(2, 2, figsize=(14, 10))
fig.suptitle('Comparação de Diferentes Distribuições Binomiais', fontsize=16)

# Parâmetros para comparação
params = [
    {'n': 10, 'p': 0.5, 'titulo': 'n=10, p=0.5 (Moeda justa, 10 lançamentos)'},
    {'n': 10, 'p': 0.2, 'titulo': 'n=10, p=0.2 (Evento improvável, 10 tentativas)'},
    {'n': 20, 'p': 0.5, 'titulo': 'n=20, p=0.5 (Moeda justa, 20 lançamentos)'},
    {'n': 20, 'p': 0.1, 'titulo': 'n=20, p=0.1 (Evento raro, 20 tentativas)'}
]

# Cores para os gráficos
cores = ['royalblue', 'forestgreen', 'darkorange', 'purple']

for i, (param, ax) in enumerate(zip(params, axes.flat)):
    n, p = param['n'], param['p']
    k = np.arange(0, n + 1)
    
    # Calcular PMF, média e desvio padrão
    pmf = binom.pmf(k, n, p)
    media = n * p
    desvio = np.sqrt(n * p * (1 - p))
    
    # Plotar distribuição
    bars = ax.bar(k, pmf, alpha=0.7, color=cores[i])
    ax.set_title(param['titulo'])
    ax.set_xlabel('Número de Sucessos (k)')
    ax.set_ylabel('Probabilidade')
    ax.grid(True, alpha=0.3)
    
    # Adicionar linha da média
    ax.axvline(x=media, color='red', linestyle='--', 
              label=f'Média: {media:.2f}\nDesvio: {desvio:.2f}')
    
    # Adicionar textos com estatísticas
    stats_text = f"μ = {media:.2f}\nσ² = {media*(1-p):.2f}\nσ = {desvio:.2f}"
    props = dict(boxstyle='round', facecolor='white', alpha=0.7)
    ax.text(0.95, 0.95, stats_text, transform=ax.transAxes, fontsize=10,
           verticalalignment='top', horizontalalignment='right', bbox=props)
    
    ax.legend()

plt.tight_layout(rect=[0, 0, 1, 0.95])
plt.show()

## 5. Exemplos Práticos

Vamos explorar alguns exemplos práticos do uso da distribuição binomial.

In [None]:
# Exemplo 1: Lançamentos de moeda
# Qual a probabilidade de obter exatamente 6 caras em 10 lançamentos de uma moeda justa?

exemplo_moeda = DistribuicaoBinomial(n=10, p=0.5)
prob_6_caras = exemplo_moeda.pmf(6)

print("Exemplo 1: Lançamentos de moeda")
print(f"Probabilidade de obter exatamente 6 caras em 10 lançamentos: {prob_6_caras:.4f}")
print(f"Isso equivale a {prob_6_caras*100:.2f}%")

# Visualização
exemplo_moeda.plotar_distribuicao("Distribuição para 10 lançamentos de moeda justa")

# Verificação: calculando manualmente
prob_manual = exemplo_moeda.pmf_manual(6)
print(f"Verificação calculando manualmente: {prob_manual:.4f}")
print(f"Diferença: {abs(prob_6_caras - prob_manual):.10f}")

In [None]:
# Exemplo 2: Controle de Qualidade
# Em uma linha de produção, 5% das peças são defeituosas.
# Qual a probabilidade de encontrar no máximo 2 peças defeituosas em uma amostra de 20 peças?

controle_qualidade = DistribuicaoBinomial(n=20, p=0.05)

# Probabilidade de no máximo 2 peças defeituosas: P(X ≤ 2)
prob_max_2_defeitos = controle_qualidade.cdf(2)

print("\nExemplo 2: Controle de Qualidade")
print(f"Probabilidade de no máximo 2 peças defeituosas em 20: {prob_max_2_defeitos:.4f}")
print(f"Isso equivale a {prob_max_2_defeitos*100:.2f}%")

# Visualização
controle_qualidade.plotar_distribuicao("Distribuição para controle de qualidade (n=20, p=0.05)")

# Calculando contribuições individuais
print("\nContribuições individuais:")
for k in range(3):
    prob_k = controle_qualidade.pmf(k)
    print(f"P(X = {k}) = {prob_k:.4f} ({prob_k*100:.2f}%)")

In [None]:
# Exemplo 3: Teste Clínico
# Um novo medicamento tem 70% de chance de ser eficaz para um paciente.
# Se 15 pacientes tomam o medicamento, qual a probabilidade de que seja eficaz para pelo menos 10 pacientes?

teste_clinico = DistribuicaoBinomial(n=15, p=0.7)

# Probabilidade de pelo menos 10 sucessos: P(X ≥ 10) = 1 - P(X ≤ 9)
prob_pelo_menos_10 = teste_clinico.sf(9)  # ou 1 - teste_clinico.cdf(9)

print("\nExemplo 3: Teste Clínico")
print(f"Probabilidade de eficácia em pelo menos 10 de 15 pacientes: {prob_pelo_menos_10:.4f}")
print(f"Isso equivale a {prob_pelo_menos_10*100:.2f}%")

# Visualização com destaque na área de interesse
k = np.arange(0, 16)
prob = binom.pmf(k, 15, 0.7)

plt.figure(figsize=(12, 6))
plt.bar(k, prob, alpha=0.5, color='lightblue')
plt.bar(k[10:], prob[10:], alpha=0.8, color='darkblue', 
       label=f'P(X ≥ 10) = {prob_pelo_menos_10:.4f}')

plt.title('Distribuição para teste clínico (n=15, p=0.7)')
plt.xlabel('Número de pacientes com resposta eficaz')
plt.ylabel('Probabilidade')
plt.grid(True, alpha=0.3)
plt.xticks(k)

# Adicionar linha com média
media = 15 * 0.7
plt.axvline(x=media, color='red', linestyle='--', 
           label=f'Média: {media:.2f}')

plt.legend()
plt.show()

## 6. Método de Newton-Raphson

O método de Newton-Raphson é um poderoso algoritmo para encontrar raízes de funções. Embora não esteja diretamente relacionado com a distribuição binomial, é uma ferramenta matemática útil que pode ser aplicada em diversos contextos estatísticos.

In [None]:
def newton(f, df, x0, tol=1e-6, max_iter=100):
    """Implementa o método de Newton para encontrar raízes de funções."""
    
    # Histórico de aproximações para visualização
    historico = [x0]
    xn = x0
    
    for i in range(max_iter):
        fxn = f(xn)
        dfxn = df(xn)
        
        # Evitar divisão por zero
        if abs(dfxn) < 1e-10:
            print(f"Atenção: Derivada próxima de zero na iteração {i}")
            break
            
        # Fórmula de Newton-Raphson
        xn1 = xn - fxn/dfxn
        historico.append(xn1)
        
        # Verificar convergência
        if abs(xn1 - xn) < tol:
            print(f"Convergência atingida na iteração {i+1}")
            break
            
        xn = xn1
    else:
        print(f"Aviso: Atingido número máximo de {max_iter} iterações sem convergência")
    
    return xn, historico

# Exemplo: Encontrar a raiz de f(x) = x^3 - 4x - 9
def f(x):
    return x**3 - 4*x - 9

def df(x):
    return 3*x**2 - 4

# Aproximação inicial
x0 = 2.5

# Encontrar a raiz
raiz, historico = newton(f, df, x0)
print(f"Raiz encontrada: {raiz}")
print(f"f({raiz}) = {f(raiz)}")

# Visualizar a convergência
plt.figure(figsize=(12, 6))

# Plotar a função
x = np.linspace(-3, 4, 1000)
y = [f(xi) for xi in x]
plt.plot(x, y, 'k-', label='f(x) = x³ - 4x - 9')

# Plotar linha horizontal y=0
plt.axhline(y=0, color='gray', linestyle='-', alpha=0.3)

# Marcar as aproximações
for i, xi in enumerate(historico):
    if i < len(historico) - 1:
        plt.plot([xi, xi], [0, f(xi)], 'r--', alpha=0.5)
        plt.plot(xi, f(xi), 'ro', alpha=0.7)
        plt.text(xi, f(xi) + 2, f"x{i}", fontsize=10)
    else:
        plt.plot(xi, f(xi), 'ro', markersize=8, label=f'Raiz: x ≈ {xi:.4f}')

plt.title('Método de Newton-Raphson - Convergência')
plt.xlabel('x')
plt.ylabel('f(x)')
plt.grid(True, alpha=0.3)
plt.legend()
plt.ylim(-20, 20)
plt.show()

# Visualizar a progressão das aproximações
plt.figure(figsize=(10, 5))
iteracoes = list(range(len(historico)))
plt.plot(iteracoes, historico, 'bo-')
plt.plot(iteracoes[-1], historico[-1], 'ro', markersize=8)

plt.title('Convergência do Método de Newton-Raphson')
plt.xlabel('Iteração')
plt.ylabel('Valor de x')
plt.grid(True)
plt.show()

## 7. Aplicações Avançadas

### 7.1 Aproximação Normal

Para valores grandes de n, a distribuição binomial pode ser aproximada por uma distribuição normal com média μ = np e variância σ² = np(1-p).

In [None]:
from scipy.stats import norm

# Comparar distribuição binomial com aproximação normal
n = 50
p = 0.3

# Criar eixo x
k = np.arange(0, n+1)

# Calcular média e desvio padrão
media = n * p
desvio = np.sqrt(n * p * (1-p))

# Binomial PMF
binomial_pmf = binom.pmf(k, n, p)

# Aproximação normal (com correção de continuidade)
x = np.linspace(0, n, 1000)
normal_pdf = norm.pdf(x, loc=media, scale=desvio)

# Plotar comparação
plt.figure(figsize=(12, 6))
plt.bar(k, binomial_pmf, alpha=0.5, label='Binomial', width=0.8)
plt.plot(x, normal_pdf, 'r-', linewidth=2, label='Aproximação Normal')

plt.title(f'Comparação: Binomial(n={n}, p={p}) vs. Aproximação Normal')
plt.xlabel('Número de Sucessos (k)')
plt.ylabel('Probabilidade')
plt.legend()
plt.grid(True, alpha=0.3)

# Adicionar média
plt.axvline(x=media, color='green', linestyle='--', 
           label=f'Média: {media:.2f}')

plt.legend()
plt.show()

### 7.2 Teste Binomial

O teste binomial é usado para testar se a proporção de sucessos em uma sequência de experimentos difere significativamente de um valor esperado.

In [None]:
from scipy.stats import binomtest

# Exemplo: Uma moeda é lançada 100 vezes, resultando em 65 caras.
# A moeda é justa (p=0.5)?

resultado = binomtest(65, n=100, p=0.5, alternative='two-sided')

print("Teste Binomial para moeda justa:")
print(f"Número de lançamentos: 100")
print(f"Número de caras observadas: 65")
print(f"p-valor: {resultado.pvalue:.6f}")

alpha = 0.05
if resultado.pvalue < alpha:
    print(f"Como p-valor < {alpha}, rejeitamos a hipótese de que a moeda é justa.")
else:
    print(f"Como p-valor >= {alpha}, não podemos rejeitar a hipótese de que a moeda é justa.")

# Visualização da região crítica
dist_nula = DistribuicaoBinomial(n=100, p=0.5)
k_valores = np.arange(0, 101)
probs = [dist_nula.pmf(k) for k in k_valores]

# Identificar regiões críticas (p-valor < alpha)
regioes_criticas = []
for k in k_valores:
    test_result = binomtest(k, n=100, p=0.5, alternative='two-sided')
    if test_result.pvalue < alpha:
        regioes_criticas.append(k)

# Plotar distribuição sob hipótese nula
plt.figure(figsize=(14, 6))

# Barras para todos os valores
plt.bar(k_valores, probs, alpha=0.3, color='gray')

# Destacar regiões críticas
for k in regioes_criticas:
    plt.bar(k, dist_nula.pmf(k), color='red', alpha=0.7)

# Destacar valor observado
plt.bar(65, dist_nula.pmf(65), color='blue', alpha=0.9,
       label='Valor observado (k=65)')

plt.title('Teste Binomial: Regiões de Rejeição (α=0.05)')
plt.xlabel('Número de caras (k)')
plt.ylabel('Probabilidade sob H₀: p=0.5')

# Adicionar linha vertical na média sob H₀
plt.axvline(x=50, color='green', linestyle='--', 
           label='Média sob H₀: 50')

plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

## Resumo

Neste notebook, exploramos a distribuição binomial, seus fundamentos matemáticos e aplicações práticas. Implementamos métodos para calcular probabilidades binomiais, visualizar distribuições e aplicar conceitos em exemplos do mundo real.

A distribuição binomial é uma ferramenta estatística fundamental para modelar situações com resultados binários (sucesso/fracasso) e tem aplicações em diversas áreas, incluindo controle de qualidade, medicina, finanças e pesquisas de opinião.

Principais tópicos abordados:

1. Fundamentos matemáticos da distribuição binomial
2. Implementação de cálculos e visualizações em Python
3. Aplicações práticas em diversos contextos
4. Método de Newton-Raphson para encontrar raízes de funções
5. Aproximação normal da distribuição binomial
6. Testes binomiais para hipóteses estatísticas