# Probabilidade e Distribuições: Tutorial Interativo

Este notebook apresenta conceitos fundamentais de probabilidade e distribuições de forma interativa com exemplos práticos em Python.

## Conteúdo
1. [Conceitos Básicos de Probabilidade](#1-conceitos-básicos-de-probabilidade)
2. [Variáveis Aleatórias e Distribuições](#2-variáveis-aleatórias-e-distribuições)
3. [Distribuição Normal e suas Propriedades](#3-distribuição-normal-e-suas-propriedades)
4. [Funções Densidade de Probabilidade (PDFs)](#4-funções-densidade-de-probabilidade-pdfs)
5. [Intervalos de Confiança](#5-intervalos-de-confiança)
6. [Aplicações Práticas](#6-aplicações-práticas)
7. [Exercícios Práticos](#7-exercícios-práticos)

Este material é uma referência prática para estatística aplicada utilizando Python.

In [None]:
# Configuração inicial e importação de bibliotecas
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import sympy as sp
from scipy import stats
import random

# Importar nossos módulos personalizados
from probabilidade import (
    calcular_intervalo_confianca,
    calcular_probabilidade_evento,
    calcular_probabilidade_normal,
    calcular_estatisticas_descritivas,
    visualizar_distribuicao_com_ic
)

from conceitos.basicos.densidade_de_probabilidade import (
    DistribuicaoProbabilidade,
    DISTRIBUICOES_EXEMPLO
)

# Configuração para gráficos mais bonitos
plt.style.use('seaborn')
sns.set_palette('viridis')
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

## 1. Conceitos Básicos de Probabilidade

A probabilidade é uma medida da chance de um evento ocorrer, expressa como um número entre 0 (impossível) e 1 (certeza).

### Definição Clássica (Laplace)

$$P(A) = \frac{\text{número de casos favoráveis}}{\text{número de casos possíveis}}$$

Esta definição pressupõe que todos os resultados são igualmente prováveis.

### Propriedades Fundamentais

- **Não-negatividade**: $P(A) \geq 0$ para qualquer evento $A$
- **Normalização**: $P(\Omega) = 1$ para o espaço amostral $\Omega$
- **Aditividade**: Se $A$ e $B$ são mutuamente exclusivos, $P(A \cup B) = P(A) + P(B)$

### Exemplo: Lançamento de Dados

In [None]:
# Calcular a probabilidade de obter um número par em um lançamento de dado
casos_favoraveis = 3  # números pares: 2, 4, 6
casos_possiveis = 6   # faces do dado: 1, 2, 3, 4, 5, 6

probabilidade = calcular_probabilidade_evento(casos_favoraveis, casos_possiveis)
print(f"Probabilidade de obter um número par: {probabilidade:.4f} ou {probabilidade*100:.1f}%")

# Simulação para verificar a probabilidade teórica
num_simulacoes = 10000
resultados = [random.randint(1, 6) for _ in range(num_simulacoes)]
pares = [x for x in resultados if x % 2 == 0]
probabilidade_experimental = len(pares) / num_simulacoes

print(f"Probabilidade experimental após {num_simulacoes} lançamentos: {probabilidade_experimental:.4f}")

# Visualização dos resultados
contagem = pd.Series(resultados).value_counts().sort_index()
ax = contagem.plot(kind='bar', color=['lightblue' if i % 2 else 'navy' for i in contagem.index])
ax.set_title('Frequência dos Resultados nos Lançamentos de Dado')
ax.set_xlabel('Resultado')
ax.set_ylabel('Frequência')
plt.show()

### Probabilidade Condicional

A probabilidade condicional $P(A|B)$ representa a probabilidade do evento $A$ ocorrer dado que o evento $B$ já ocorreu:

$$P(A|B) = \frac{P(A \cap B)}{P(B)}$$

### Eventos Independentes

Dois eventos $A$ e $B$ são independentes se:

$$P(A \cap B) = P(A) \cdot P(B)$$

## 2. Variáveis Aleatórias e Distribuições

Uma variável aleatória é uma função que atribui um valor numérico a cada resultado de um experimento aleatório. Existem dois tipos principais:

1. **Variáveis Aleatórias Discretas**: Podem assumir um número contável de valores
2. **Variáveis Aleatórias Contínuas**: Podem assumir qualquer valor em um intervalo

### Distribuição de Probabilidade

Uma distribuição de probabilidade descreve como os valores de uma variável aleatória se distribuem.

## 3. Distribuição Normal e suas Propriedades

A distribuição normal (ou gaussiana) é caracterizada por sua curva em forma de sino, sendo definida por dois parâmetros:

- $\mu$ (média): define o centro da distribuição
- $\sigma$ (desvio padrão): define a dispersão da distribuição

A função densidade de probabilidade (PDF) da distribuição normal é:

$$f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$$

### Propriedades da Distribuição Normal

- Simétrica em torno da média $\mu$
- Aproximadamente 68% dos valores estão a menos de um desvio padrão da média
- Aproximadamente 95% dos valores estão a menos de dois desvios padrão da média
- Aproximadamente 99.7% dos valores estão a menos de três desvios padrão da média (regra 68-95-99.7)

In [None]:
# Criar dados normalmente distribuídos
media = 100
desvio_padrao = 15
tamanho = 1000
dados_normais = np.random.normal(media, desvio_padrao, tamanho)

# Visualizar a distribuição
plt.figure(figsize=(12, 6))

plt.subplot(1, 2, 1)
sns.histplot(dados_normais, kde=True, bins=30)
plt.axvline(media, color='red', linestyle='--', label=f'Média: {media}')
plt.axvline(media + desvio_padrao, color='green', linestyle=':', label=f'+1 Desvio Padrão')
plt.axvline(media - desvio_padrao, color='green', linestyle=':', label=f'-1 Desvio Padrão')
plt.axvline(media + 2*desvio_padrao, color='orange', linestyle=':', label=f'+2 Desvios Padrão')
plt.axvline(media - 2*desvio_padrao, color='orange', linestyle=':')
plt.title('Distribuição Normal')
plt.legend(loc='upper right')

# QQ-plot para verificar normalidade
plt.subplot(1, 2, 2)
stats.probplot(dados_normais, plot=plt)
plt.title('Q-Q Plot (Verificação de Normalidade)')

plt.tight_layout()
plt.show()

# Calcular algumas probabilidades usando a distribuição normal
# Probabilidade de um valor ser menor que 85 (média - 1DP)
prob_menos_85 = calcular_probabilidade_normal(85, media, desvio_padrao)
print(f"P(X < 85) = {prob_menos_85:.4f} ou {prob_menos_85*100:.1f}%")

# Probabilidade de um valor ser maior que 130 (média + 2DP)
prob_mais_130 = calcular_probabilidade_normal(130, media, desvio_padrao, cauda='superior')
print(f"P(X > 130) = {prob_mais_130:.4f} ou {prob_mais_130*100:.1f}%")

# Probabilidade de um valor estar entre média ± 1 desvio padrão (regra 68-95-99.7)
prob_entre_1dp = (calcular_probabilidade_normal(media + desvio_padrao, media, desvio_padrao) - 
                  calcular_probabilidade_normal(media - desvio_padrao, media, desvio_padrao))
print(f"P(μ-σ < X < μ+σ) = {prob_entre_1dp:.4f} ou {prob_entre_1dp*100:.1f}% (≈ 68%)")

# Probabilidade de um valor estar entre média ± 2 desvios padrão
prob_entre_2dp = (calcular_probabilidade_normal(media + 2*desvio_padrao, media, desvio_padrao) - 
                  calcular_probabilidade_normal(media - 2*desvio_padrao, media, desvio_padrao))
print(f"P(μ-2σ < X < μ+2σ) = {prob_entre_2dp:.4f} ou {prob_entre_2dp*100:.1f}% (≈ 95%)")

## 4. Funções Densidade de Probabilidade (PDFs)

Uma função densidade de probabilidade (PDF) descreve a probabilidade relativa de uma variável aleatória contínua assumir um valor em uma determinada região.

### Propriedades Matemáticas das PDFs

Para que uma função $f(x)$ seja uma PDF válida, deve satisfazer:

1. **Não-negatividade**: $f(x) \geq 0$ para todo $x$
2. **Integração unitária**: $\int_{-\infty}^{\infty} f(x)dx = 1$

A probabilidade de um intervalo é calculada pela integral:

$$P(a \leq X \leq b) = \int_a^b f(x)dx$$

### Estatísticas de uma Distribuição

- **Média (valor esperado)**: $\mu = E[X] = \int_{-\infty}^{\infty} x \cdot f(x)dx$
- **Variância**: $\sigma^2 = Var[X] = \int_{-\infty}^{\infty} (x - \mu)^2 \cdot f(x)dx$

### Distribuições Contínuas Importantes

Vamos explorar algumas distribuições contínuas frequentemente utilizadas em estatística:

#### 1. Distribuição Exponencial

Usada para modelar tempos de espera ou vida útil de componentes. Sua PDF é:

$$f(x) = \lambda e^{-\lambda x}, \quad x \geq 0$$

onde $\lambda > 0$ é o parâmetro de taxa.

- **Média**: $E[X] = 1/\lambda$
- **Variância**: $Var[X] = 1/\lambda^2$

In [None]:
# Criar distribuição exponencial com λ=2
dist_exp = DistribuicaoProbabilidade(
    DISTRIBUICOES_EXEMPLO['exponencial']['funcao'],
    DISTRIBUICOES_EXEMPLO['exponencial']['var'],
    DISTRIBUICOES_EXEMPLO['exponencial']['dominio']
)

# Calcular probabilidades para diferentes intervalos
areas = [(0, 0.5), (0.5, 1), (1, 2)]
dist_exp.plotar_distribuicao(
    titulo='Distribuição Exponencial (λ=2)',
    areas=areas
)

# Mostrar estatísticas
relatorio = dist_exp.gerar_relatorio()
print(f"Média: {relatorio['media']:.4f} (teoricamente 1/λ = 0.5)")
print(f"Desvio Padrão: {relatorio['desvio_padrao']:.4f} (teoricamente 1/λ = 0.5)")
print(f"Variância: {relatorio['variancia']:.4f} (teoricamente 1/λ² = 0.25)")

# Calcular probabilidades específicas
print("\nProbabilidades para a distribuição exponencial:")
print(f"P(X ≤ 0.5) = {dist_exp.calcular_probabilidade((0, 0.5)):.4f}")
print(f"P(X > 1) = {1 - dist_exp.calcular_probabilidade((0, 1)):.4f}")

#### 2. Distribuição Triangular

Útil quando temos informações limitadas sobre a distribuição, conhecendo apenas os valores mínimo, máximo e modal.

Para uma distribuição triangular simétrica no intervalo [0,1] com pico em 0.5:

$$f(x) = \begin{cases}
2x, & \text{se } 0 \leq x \leq 0.5 \\
2(1-x), & \text{se } 0.5 < x \leq 1 \\
0, & \text{caso contrário}
\end{cases}$$

In [None]:
# Criar distribuição triangular
dist_tri = DistribuicaoProbabilidade(
    DISTRIBUICOES_EXEMPLO['triangular']['funcao'],
    DISTRIBUICOES_EXEMPLO['triangular']['var'],
    DISTRIBUICOES_EXEMPLO['triangular']['dominio']
)

# Plotar com áreas de interesse
areas = [(0, 0.25), (0.25, 0.75), (0.75, 1)]
dist_tri.plotar_distribuicao(
    titulo='Distribuição Triangular',
    areas=areas
)

# Mostrar estatísticas
relatorio = dist_tri.gerar_relatorio()
print(f"Média: {relatorio['media']:.4f}")
print(f"Desvio Padrão: {relatorio['desvio_padrao']:.4f}")
print(f"Variância: {relatorio['variancia']:.4f}")

# Calcular probabilidades específicas
print("\nProbabilidades para a distribuição triangular:")
print(f"P(X ≤ 0.25) = {dist_tri.calcular_probabilidade((0, 0.25)):.4f}")
print(f"P(0.25 < X < 0.75) = {dist_tri.calcular_probabilidade((0.25, 0.75)):.4f}")

#### 3. Distribuição Normal Padrão

A distribuição normal padrão tem média 0 e desvio padrão 1. Sua PDF é:

$$f(x) = \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$$

Esta é a base para todas as distribuições normais, que podem ser convertidas para a forma padrão usando a transformação $Z = \frac{X-\mu}{\sigma}$.

In [None]:
# Criar distribuição normal padrão
dist_norm = DistribuicaoProbabilidade(
    DISTRIBUICOES_EXEMPLO['normal_aproximada']['funcao'],
    DISTRIBUICOES_EXEMPLO['normal_aproximada']['var'],
    DISTRIBUICOES_EXEMPLO['normal_aproximada']['dominio']
)

# Plotar com intervalos de confiança padrão
areas = [(-1, 1), (-2, 2), (-3, 3)]  # 68%, 95% e 99.7%
dist_norm.plotar_distribuicao(
    titulo='Distribuição Normal Padrão',
    areas=areas
)

# Mostrar probabilidades importantes
print("Probabilidades para a distribuição normal padrão (regra 68-95-99.7):")
print(f"P(-1 ≤ Z ≤ 1): {dist_norm.calcular_probabilidade((-1, 1)):.4f} (≈ 0.6827 ou 68.27%)")
print(f"P(-2 ≤ Z ≤ 2): {dist_norm.calcular_probabilidade((-2, 2)):.4f} (≈ 0.9545 ou 95.45%)")
print(f"P(-3 ≤ Z ≤ 3): {dist_norm.calcular_probabilidade((-3, 3)):.4f} (≈ 0.9973 ou 99.73%)")

# Calcular a probabilidade de um valor estar acima de 1.96 desvios padrão (usado para IC de 95%)
print(f"P(Z > 1.96): {1 - dist_norm.calcular_probabilidade((-float('inf'), 1.96)):.4f} (≈ 0.025 ou 2.5%)")

## 5. Intervalos de Confiança

Um intervalo de confiança (IC) é uma estimativa de um intervalo que provavelmente contém um parâmetro populacional desconhecido.

### Intervalo de Confiança para a Média

Para amostras com distribuição aproximadamente normal ou amostras grandes (n ≥ 30), o intervalo de confiança para a média é:

$$IC_{(1-\alpha)} = \bar{x} \pm t_{\alpha/2, n-1} \cdot \frac{s}{\sqrt{n}}$$

Onde:
- $\bar{x}$ é a média amostral
- $s$ é o desvio padrão amostral
- $n$ é o tamanho da amostra
- $t_{\alpha/2, n-1}$ é o valor crítico da distribuição t com $n-1$ graus de liberdade

### Interpretação Correta

Um intervalo de confiança de 95% significa que, se repetirmos o experimento muitas vezes, aproximadamente 95% dos intervalos calculados conterão o verdadeiro valor do parâmetro populacional.

In [None]:
# Exemplo de dados: notas de alunos de diferentes professores
notas_prof1 = [82, 64, 64, 79, 64, 76, 52, 61, 85]
notas_prof2 = [64, 88, 79, 67, 85, 100, 82]
notas_prof3 = [73, 91, 82, 85, 82, 67]

# Calcular estatísticas descritivas
print("Estatísticas descritivas para as notas do Professor 1:")
estatisticas = calcular_estatisticas_descritivas(notas_prof1)
for chave, valor in estatisticas.items():
    print(f"{chave}: {valor:.2f}")

# Calcular intervalos de confiança para diferentes níveis
niveis_confianca = [0.90, 0.95, 0.99]

resultados = []
for nivel in niveis_confianca:
    ic_inf, ic_sup = calcular_intervalo_confianca(notas_prof1, nivel)
    resultados.append({
        'Nível de Confiança': f"{nivel*100:.0f}%",
        'Limite Inferior': round(ic_inf, 2),
        'Limite Superior': round(ic_sup, 2),
        'Amplitude': round(ic_sup - ic_inf, 2)
    })

# Exibir resultados em forma de tabela
print("\nIntervalos de confiança para diferentes níveis:")
print(pd.DataFrame(resultados).set_index('Nível de Confiança'))

# Visualização dos intervalos de confiança
plt.figure(figsize=(12, 6))

# Gráfico para diferentes níveis de confiança
media = np.mean(notas_prof1)
y_pos = [0, 1, 2]

plt.subplot(1, 2, 1)
for i, nivel in enumerate(niveis_confianca):
    ic_inf, ic_sup = calcular_intervalo_confianca(notas_prof1, nivel)
    plt.plot([ic_inf, ic_sup], [y_pos[i], y_pos[i]], 'o-', linewidth=2, 
             label=f"IC {nivel*100:.0f}%: ({ic_inf:.2f}, {ic_sup:.2f})")
    
plt.axvline(media, color='red', linestyle='--', label=f'Média: {media:.2f}')
plt.yticks(y_pos, [f"{nivel*100:.0f}%" for nivel in niveis_confianca])
plt.xlabel('Valor')
plt.ylabel('Nível de Confiança')
plt.title('Intervalos de Confiança para Diferentes Níveis')
plt.legend()

# Comparação de diferentes professores
plt.subplot(1, 2, 2)
professores = ['Professor 1', 'Professor 2', 'Professor 3']
notas = [notas_prof1, notas_prof2, notas_prof3]
y_pos = [0, 1, 2]

for i, (prof, nota) in enumerate(zip(professores, notas)):
    media = np.mean(nota)
    ic_inf, ic_sup = calcular_intervalo_confianca(nota)
    plt.plot([ic_inf, ic_sup], [y_pos[i], y_pos[i]], 'o-', linewidth=2, 
             label=f"{prof}: ({ic_inf:.2f}, {ic_sup:.2f})")
    plt.plot(media, y_pos[i], 'ro')
    
plt.yticks(y_pos, professores)
plt.xlabel('Média das Notas')
plt.title('Comparação de Intervalos de Confiança (95%)')
plt.grid(True, linestyle='--', alpha=0.7)

plt.tight_layout()
plt.show()

# Histograma com intervalos de confiança
visualizar_distribuicao_com_ic(notas_prof1, 0.95, 
                              "Distribuição das Notas do Professor 1 com IC de 95%")

## 6. Aplicações Práticas

### Análise de Desempenho Acadêmico

Vamos aplicar os conceitos estatísticos para analisar o desempenho de estudantes em diferentes disciplinas e determinar se há diferenças significativas entre as médias.

In [None]:
# Dados simulados de notas em diferentes disciplinas
np.random.seed(42)  # Para reprodutibilidade

disciplinas = ['Matemática', 'Português', 'Ciências', 'História', 'Geografia']
notas = {
    'Matemática': np.random.normal(75, 12, 40),  # média 75, desvio 12, 40 alunos
    'Português': np.random.normal(70, 10, 40),
    'Ciências': np.random.normal(78, 15, 40),
    'História': np.random.normal(72, 8, 40),
    'Geografia': np.random.normal(68, 11, 40)
}

# Calcular intervalo de confiança para cada disciplina
resultados = []
for disciplina, notas_disc in notas.items():
    ic_inf, ic_sup = calcular_intervalo_confianca(notas_disc)
    resultados.append({
        'Disciplina': disciplina,
        'Média': np.mean(notas_disc),
        'Desvio Padrão': np.std(notas_disc, ddof=1),
        'IC Inferior (95%)': ic_inf,
        'IC Superior (95%)': ic_sup,
        'Tamanho da Amostra': len(notas_disc)
    })

# Exibir resultados
df_resultados = pd.DataFrame(resultados).set_index('Disciplina')
print(df_resultados[['Média', 'Desvio Padrão', 'IC Inferior (95%)', 'IC Superior (95%)']].round(2))

# Visualizar os resultados
plt.figure(figsize=(12, 10))

# Gráfico de barras com intervalos de confiança
plt.subplot(2, 1, 1)
y_pos = np.arange(len(disciplinas))
medias = [np.mean(notas[disc]) for disc in disciplinas]
erro = [(calcular_intervalo_confianca(notas[disc])[1] - 
         calcular_intervalo_confianca(notas[disc])[0]) / 2 for disc in disciplinas]

bars = plt.bar(y_pos, medias, yerr=erro, align='center', alpha=0.7, 
               capsize=10, color='skyblue', ecolor='black')
plt.xticks(y_pos, disciplinas)
plt.ylabel('Média das Notas')
plt.title('Médias das Disciplinas com Intervalos de Confiança (95%)')
plt.ylim(0, 100)
plt.grid(axis='y', linestyle='--', alpha=0.5)

# Boxplots para comparação de distribuições
plt.subplot(2, 1, 2)
data_to_plot = [notas[disc] for disc in disciplinas]
box = plt.boxplot(data_to_plot, patch_artist=True)

# Adicionar cores aos boxplots
colors = ['lightblue', 'lightgreen', 'pink', 'lightyellow', 'lightcoral']
for patch, color in zip(box['boxes'], colors):
    patch.set_facecolor(color)

plt.xticks(range(1, len(disciplinas) + 1), disciplinas)
plt.ylabel('Notas')
plt.title('Distribuição das Notas por Disciplina')
plt.grid(True, linestyle='--', alpha=0.3)

plt.tight_layout()
plt.show()

## 7. Exercícios Práticos

### Exercício 1: Verificação Empírica de Intervalos de Confiança

Vamos demonstrar empiricamente a interpretação correta do intervalo de confiança: "Se coletarmos múltiplas amostras da mesma população e calcularmos intervalos de confiança de 95% para cada amostra, aproximadamente 95% desses intervalos conterão o verdadeiro valor do parâmetro populacional."

In [None]:
# Simulação para verificar a interpretação de intervalos de confiança
np.random.seed(123)  # Para reprodutibilidade

# Parâmetros da população (desconhecidos na prática)
media_populacional = 100
desvio_populacional = 15

# Parâmetros da simulação
tamanho_amostra = 30
num_amostras = 100
nivel_confianca = 0.95

# Coletar amostras e calcular intervalos de confiança
intervalos = []
contem_media = []

for _ in range(num_amostras):
    # Coletar uma amostra da população
    amostra = np.random.normal(media_populacional, desvio_populacional, tamanho_amostra)
    
    # Calcular intervalo de confiança para esta amostra
    ic_inf, ic_sup = calcular_intervalo_confianca(amostra, nivel_confianca)
    
    # Verificar se o intervalo contém a média populacional verdadeira
    contem = ic_inf <= media_populacional <= ic_sup
    
    intervalos.append((ic_inf, ic_sup))
    contem_media.append(contem)

# Calcular proporção de intervalos que contêm a média populacional
proporcao = sum(contem_media) / num_amostras
print(f"Proporção de intervalos que contêm a média populacional: {proporcao:.4f} ({proporcao*100:.1f}%)")
print(f"Nível de confiança teórico: {nivel_confianca:.4f} ({nivel_confianca*100:.1f}%)")

# Visualizar os resultados
plt.figure(figsize=(12, 6))

# Ordenar os intervalos pela média
medias_amostrais = [(ic_inf + ic_sup) / 2 for ic_inf, ic_sup in intervalos]
indices_ordenados = np.argsort(medias_amostrais)

# Plotar intervalos ordenados
for i, idx in enumerate(indices_ordenados):
    ic_inf, ic_sup = intervalos[idx]
    contem = contem_media[idx]
    color = 'green' if contem else 'red'
    plt.plot([ic_inf, ic_sup], [i, i], '-', color=color, linewidth=1, alpha=0.7)

# Adicionar linha vertical para a média populacional verdadeira
plt.axvline(media_populacional, color='blue', linestyle='--', 
            label=f'Média Populacional Verdadeira: {media_populacional}')

plt.title(f'Intervalos de Confiança de {nivel_confianca*100:.0f}% para {num_amostras} Amostras')
plt.xlabel('Valor')
plt.ylabel('Índice da Amostra')
plt.legend()
plt.grid(True, linestyle=':', alpha=0.3)
plt.tight_layout()
plt.show()

# Legenda explicativa
print("\nLegenda:")
print("Verde: Intervalo contém a média populacional verdadeira")
print("Vermelho: Intervalo não contém a média populacional verdadeira")

# Verificar se a proporção está próxima do nível de confiança
diferenca = abs(proporcao - nivel_confianca)
if diferenca <= 0.05:
    print(f"\nA proporção observada ({proporcao:.4f}) está próxima do nível de confiança teórico ({nivel_confianca})")
    print("Isto confirma empiricamente a interpretação correta do intervalo de confiança.")
else:
    print(f"\nA proporção observada ({proporcao:.4f}) difere do nível de confiança teórico ({nivel_confianca}) em {diferenca:.4f}")
    print("A diferença pode ser devida à variabilidade amostral. Tente aumentar o número de amostras.")

### Exercício 2: Criação de Distribuições Personalizadas

Tente criar suas próprias distribuições de probabilidade! Por exemplo:

1. Uma distribuição uniforme no intervalo [0,1]
2. Uma distribuição exponencial com parâmetro λ diferente
3. Uma distribuição normal com média e variância específicas

Lembre-se que a função deve ser não-negativa e integrar para 1!

In [None]:
# Exemplo: Criação de uma distribuição uniforme no intervalo [0,1]
try:
    # Função de densidade de probabilidade: f(x) = 1 para 0 <= x <= 1, 0 caso contrário
    dist_uniforme = DistribuicaoProbabilidade(
        funcao_str='Piecewise((1, (x >= 0) & (x <= 1)), (0, True))',
        var='x',
        dominio=(0, 1)
    )
    
    # Plotar a distribuição uniforme
    areas = [(0, 0.3), (0.3, 0.7), (0.7, 1)]
    dist_uniforme.plotar_distribuicao(
        titulo='Distribuição Uniforme no intervalo [0,1]',
        areas=areas
    )
    
    # Mostrar estatísticas
    relatorio = dist_uniforme.gerar_relatorio()
    print("Estatísticas da distribuição uniforme:")
    print(f"Média: {relatorio['media']:.4f} (teoricamente 0.5)")
    print(f"Desvio Padrão: {relatorio['desvio_padrao']:.4f} (teoricamente 1/√12 ≈ 0.2887)")
    print(f"Variância: {relatorio['variancia']:.4f} (teoricamente 1/12 ≈ 0.0833)")
    
    # Espaço para você criar suas próprias distribuições:
    # 1. Tente criar uma distribuição exponencial com λ=1
    # 2. Crie uma distribuição normal com média 10 e desvio padrão 2
    # 3. Experimente uma distribuição beta ou outras distribuições interessantes
except Exception as e:
    print(f"Erro ao criar distribuição: {str(e)}")

## Conclusão

Neste tutorial, exploramos conceitos fundamentais de probabilidade e estatística:

1. **Conceitos Básicos de Probabilidade**: Definições clássicas e propriedades fundamentais
2. **Variáveis Aleatórias e Distribuições**: Tipos de variáveis aleatórias e suas distribuições
3. **Distribuição Normal**: Propriedades e aplicações da distribuição normal
4. **Funções Densidade de Probabilidade**: Propriedades matemáticas e exemplos de distribuições contínuas
5. **Intervalos de Confiança**: Cálculo e interpretação correta de intervalos de confiança
6. **Aplicações Práticas**: Análise de dados reais usando conceitos estatísticos
7. **Exercícios Práticos**: Verificação empírica e criação de distribuições personalizadas

Estas ferramentas estatísticas são fundamentais para a análise de dados, tomada de decisões baseadas em evidências e compreensão de fenômenos aleatórios em diversas áreas do conhecimento.

### Próximos Passos

- Testes de hipóteses estatísticas
- Regressão linear e correlação
- Análise de variância (ANOVA)
- Estatística bayesiana
- Processos estocásticos

### Referências

- Casella, G., & Berger, R. L. (2002). *Statistical Inference*. Duxbury Press.
- Montgomery, D. C., & Runger, G. C. (2010). *Applied Statistics and Probability for Engineers*. John Wiley & Sons.
- Wasserman, L. (2004). *All of Statistics: A Concise Course in Statistical Inference*. Springer.
- Documentação de Python, NumPy, SciPy, Matplotlib, SymPy e Pandas.