# 🧩 1️⃣ Importação das bibliotecas

Nesta etapa, importamos as bibliotecas que serão utilizadas para gerar os dados:
- **pandas:** para manipulação e estruturação dos dados em formato de tabela.  
- **random:** para gerar valores aleatórios (como produtos, cidades e preços).  
- **datetime/timedelta:** para criar datas de venda realistas ao longo do último ano.


In [5]:
import pandas as pd
import random
from datetime import datetime, timedelta


# 🛍️ 2️⃣ Criação das listas de referência

Aqui definimos listas com possíveis valores para cada categoria:
- **Produtos** vendidos (ex: Camisa, Tênis, Jaqueta...)  
- **Cidades** onde as vendas ocorreram  
- **Vendedores** responsáveis pelas vendas  

Essas listas servirão de base para gerar os dados de forma aleatória.


In [6]:
# Gerando dados simulados
nomes_produtos = ["Camisa", "Calça", "Tênis", "Jaqueta", "Bolsa", "Relógio", "Boné", "Vestido"]
cidades = ["São Paulo", "Rio de Janeiro", "Belo Horizonte", "Curitiba", "Porto Alegre", "Salvador", "Fortaleza"]
vendedores = ["Marcos", "Ana", "João", "Carla", "Paulo", "Fernanda", "Lucas", "Patrícia"]

# 📊 3️⃣ Geração dos dados de vendas

Nesta etapa, criamos um loop que gera **100 registros fictícios de vendas**.
Cada linha representa uma venda com informações sobre:
- Produto, cidade e vendedor
- Quantidade e preço unitário
- Total da venda
- Data da venda (nos últimos 365 dias)

O resultado é armazenado em uma lista chamada `dados`.


In [7]:
# Gerar 100 linhas de vendas fictícias
dados = []
for i in range(100):
    produto = random.choice(nomes_produtos)
    cidade = random.choice(cidades)
    vendedor = random.choice(vendedores)
    quantidade = random.randint(1, 10)
    preco_unitario = round(random.uniform(50, 500), 2)
    total_venda = round(quantidade * preco_unitario, 2)
    data_venda = datetime.now() - timedelta(days=random.randint(1, 365))
    dados.append([produto, cidade, vendedor, quantidade, preco_unitario, total_venda, data_venda.date()])

# 🧱 4️⃣ Criação do DataFrame

Após gerar os dados, transformamos a lista `dados` em um **DataFrame do pandas**.  
Esse formato facilita a visualização, manipulação e exportação dos dados.  

Aqui também definimos o nome de cada coluna, como:
`Produto`, `Cidade`, `Vendedor`, `Quantidade`, `Preco_Unitario`, `Total_Venda`, `Data_Venda`.


In [None]:
# Criar o DataFrame
df = pd.DataFrame(dados, columns=[
    "Produto", "Cidade", "Vendedor", "Quantidade", "Preco_Unitario", "Total_Venda", "Data_Venda"
])

# 💾 5️⃣ Salvando o arquivo CSV

Agora salvamos o DataFrame como um arquivo CSV chamado **`vendas.csv`**.  
- O parâmetro `index=False` evita salvar o índice do pandas.  
- A codificação `utf-8-sig` garante que acentuação e caracteres especiais sejam exibidos corretamente, mesmo no Excel.

Por fim, exibimos as 5 primeiras linhas para confirmar o resultado.


In [None]:
# Salvar em CSV
df.to_csv("vendas.csv", index=False, encoding="utf-8-sig")

# 👀 6️⃣ Visualização final

Exibimos as primeiras linhas do DataFrame para verificar se os dados foram gerados corretamente.
Assim, podemos conferir se as colunas, tipos e valores estão conforme o esperado.


In [None]:
print("✅ Arquivo 'vendas.csv' criado com sucesso!")
df.head()

🧾 O que esse código faz

Gera 100 registros fictícios de vendas;

Inclui colunas úteis para análises futuras: Produto, Cidade, Vendedor, Quantidade, Preço, Total e Data;

Cria o arquivo vendas.csv dentro do ambiente do Colab.