# Amostragem
### Explicação:
- A função `calcular_tamanho_amostra()` é usada para determinar o tamanho mínimo da amostra necessário com base no nível de confiança, proporção estimada e margem de erro.
- A função `gerar_amostra_dataset()` gera uma amostra do dataset usando o tamanho de amostra calculado. Para garantir que não tentamos amostrar mais do que o número total de observações no dataset, usamos `min(tamanho_amostra, len(dataset))`.
- O `random_state=42` garante que a amostragem seja reproduzível.
Esse código retorna a amostra do dataset com o número de confiança especificado.

In [None]:
# Garantindo que as colunas de valor pago estejam no formato inteiro
join_tables['actual_amount_paid'] = join_tables['actual_amount_paid'].astype(int)
join_tables['actual_amount_paid_transactions_m1'] = join_tables['actual_amount_paid_transactions_m1'].astype(int)


In [None]:
import math
import pandas as pd

# Função para calcular o tamanho mínimo da amostra
def calcular_tamanho_amostra(Z, p, E):
    n = (Z**2 * p * (1 - p)) / (E**2)
    return math.ceil(n)

# Função para gerar a amostra do dataset
def gerar_amostra_dataset(dataset, Z, p, E):
    # Calcular o tamanho da amostra
    tamanho_amostra = calcular_tamanho_amostra(Z, p, E)
    # Garantir que o tamanho da amostra não seja maior que o dataset original
    tamanho_amostra = min(tamanho_amostra, len(dataset))
    # Gerar a amostra
    amostra = dataset.sample(n=tamanho_amostra, random_state=42)
    return amostra

# Parâmetros de confiança
Z = 1.96  # 95% de nível de confiança
p = 0.5   # Proporção populacional estimada
E = 0.05  # Margem de erro de 5%

# Gerar a amostra
amostra = gerar_amostra_dataset(join_tables, Z, p, E)

In [None]:
# Verificando o tamanho da amostra gerada
amostra.head()

In [None]:
# Verificando o tamanho da amostra gerada
print("Tamanho da amostra:", len(amostra))
