## Código para geração de dados simulados

Neste código, foi utilizada uma técnica para garantir que "Uísque" e "Água de Coco" aparecessem juntos na maioria das observações geradas. Se ambos os produtos estiverem presentes na lista de produtos comprados, "Energético" será adicionado à lista. Isso pode ser visto na linha onde é feita a verificação if "Uísque" in produtos_comprados and "Água de Coco" in produtos_comprados:


Cada vez que você executar o código, o resultado será diferente devido à geração aleatória de compras. Os produtos comprados em cada simulação são selecionados aleatoriamente com base em probabilidades predefinidas. Isso significa que, mesmo que você execute o código com os mesmos parâmetros, como o número de compras simuladas, as compras individuais variarão a cada execução.


Você pode garantir que o resultado seja reproduzível definindo uma semente (seed) para o gerador de números aleatórios. Isso garantirá que, mesmo que o código envolva elementos aleatórios, os resultados sejam os mesmos sempre que a semente for a mesma. Por exemplo, você pode definir uma semente antes de começar a geração de números aleatórios usando a função random.seed(). Assim, todas as vezes que você executar o código com a mesma semente, obterá os mesmos resultados.

In [40]:
import openpyxl 
import random

# Definição das categorias de produtos
categorias = {
    "Bebidas Alcoólicas": ["Vinho", "Uísque", "Vodka", "Martini", "Cachaça", "Cerveja"],
    "Bebidas Não Alcoólicas": ["Coca-Cola", "Suco de Frutas", "Água", "Energético", "Milkshake", "Refrigerante", "Água de Coco"]
}

# Lista de todos os produtos
produtos = [produto for sublist in categorias.values() for produto in sublist]

# Cria uma nova planilha
wb = openpyxl.Workbook()
ws = wb.active

# Define os cabeçalhos da planilha
for idx, produto in enumerate(produtos, start=1):
    ws.cell(row=1, column=idx).value = produto

# Gera dados simulados
for i in range(1000):
    # Seleciona produtos aleatórios
    produtos_comprados = []
    for categoria, produtos_categoria in categorias.items():
        if random.random() < 0.8:  # Probabilidade de 80% de comprar da categoria
            produtos_comprados.extend(random.sample(produtos_categoria, random.randint(1, len(produtos_categoria))))

    # Verifica se "Uísque" e "Água de Coco" estão na lista de produtos e os adiciona juntos
    if "Uísque" in produtos_comprados and "Água de Coco" in produtos_comprados:
        produtos_comprados.append("Energético")

    # Escreve os dados na planilha
    row = i + 2
    for produto in produtos:
        if produto in produtos_comprados:
            ws.cell(row=row, column=produtos.index(produto) + 1).value = 1
        else:
            ws.cell(row=row, column=produtos.index(produto) + 1).value = 0

# Salva a planilha
wb.save("dados_simulados.xlsx")
