# Criação de dados fictícios

In [1]:
! pip install Faker



In [2]:
# Importação de Bibliotecas
from faker import Faker
import random
import pandas as pd

In [3]:
# Inicializa o Faker e cria uma instância para o Brasil
fake = Faker('pt_BR')

# Campos
lugares_turisticos = ["Marco das Três Fronteiras", "Parque das Aves", "Usina de Itaipu"]
motivos_visita = ["Lazer", "Negócios", "Ecoturismo", "Cultura", "Aventura", "Trilha"]
estado_civil = ["Solteiro(a)", "Casado(a)", "Divorciado(a)", "Viúvo(a)", "Prefiro não responder"]
tipos_deficiencia = ["Não", "Deficiência Visual", "Deficiência Auditiva", "Deficiência Física", "Autismo", "Deficiência Intelectual", "Prefiro não responder"]
acessibilidades = ["Não", "Rampa de Acesso", "Interpretação em Libras","Banheiros Acessíveis", "Guias de áudio","Informações em braille", "Cadeirante", "Acompanhamento/Suporte"]

In [4]:
# Faixa etária de visitantes e faixa etária dos filhos
faixa_etaria = ["18-25", "26-35", "36-45", "46-55", "50+", "Prefiro não responder"]
faixa_etaria_filhos = ["0-5", "6-12", "13-17", "18+"]

# Correspondência de escolaridade com faixa salarial
faixa_salarial_escolaridade = {
    "Até 1 salário mínimo": "Ensino Fundamental",
    "1 a 3 salários mínimos": "Ensino Médio",
    "3 a 5 salários mínimos": "Ensino Superior",
    "Acima de 5 salários mínimos": "Pós-Graduação",
}


In [5]:
# Cidades e estados reais do Brasil (amostra)
cidades_estados = [
    ("São Paulo", "SP"), ("Rio de Janeiro", "RJ"), ("Curitiba", "PR"),
    ("Belo Horizonte", "MG"), ("Porto Alegre", "RS"), ("Salvador", "BA"),
    ("Fortaleza", "CE"), ("Brasília", "DF"), ("Manaus", "AM"),
    ("Recife", "PE"), ("Belém", "PA"), ("Goiânia", "GO"), ("Foz do Iguaçu", "PR")
]

# Lista para armazenar os dados
dados = []


In [6]:
# Gerar dados fictícios
for _ in range(50):
    # Cidade e estado
    cidade, estado = random.choice(cidades_estados)

    # Faixa salarial e escolaridade
    faixa_salarial = random.choice(list(faixa_salarial_escolaridade.keys()))
    nivel_escolaridade = faixa_salarial_escolaridade[faixa_salarial]

    # Visitante tem filhos? Faixa etária dos filhos
    filhos = random.choice(["Sim", "Não"])
    faixa_etaria_filhos_dados = random.choice(faixa_etaria_filhos) if filhos == "Sim" else "Não se aplica"

    # Visitante PCD, tipo de deficiência e acessibilidade necessária
    pcd = random.choice(["Sim", "Não"])
    tipo_deficiencia = random.choice(tipos_deficiencia) if pcd == "Sim" else "Não"
    necessidade_acessibilidade = random.choice(acessibilidades) if pcd == "Sim" else "Não"

    # Avaliação e feedback dos visitantes
    avaliacao = random.randint(0, 5)


# Dados individuais
    visitante = {
        "Data de Visita": fake.date_this_year(),
        "Cidade": cidade,
        "Estado": estado,
        "País": "Brasil",
        "Motivo da Visita": random.choice(motivos_visita),
        "Estado Civil": random.choice(estado_civil),
        "Nível de Escolaridade": nivel_escolaridade,
        "Faixa Salarial": faixa_salarial,
        "Faixa Etária": random.choice(faixa_etaria),
        "Filhos": filhos,
        "Faixa Etária dos Filhos": faixa_etaria_filhos_dados,
        "Local Visitado": random.choice(lugares_turisticos),
        "PCD": pcd,
        "Tipo de Deficiência": tipo_deficiencia,
        "Necessidade de Acessibilidade": necessidade_acessibilidade,
        "Avaliação": avaliacao,
        "Horário da Visita": fake.time(pattern="%H:%M:%S")
    }

    # Adiciona o visitante à lista de dados
    dados.append(visitante)

# Converte para DataFrame para facilitar a visualização e análise
df = pd.DataFrame(dados)



In [7]:
# Passa para CSV
df.to_csv("dados_clientes.csv", index=False)


In [8]:
# Ler os dados
df = pd.read_csv("dados_clientes.csv")
df

Unnamed: 0,Data de Visita,Cidade,Estado,País,Motivo da Visita,Estado Civil,Nível de Escolaridade,Faixa Salarial,Faixa Etária,Filhos,Faixa Etária dos Filhos,Local Visitado,PCD,Tipo de Deficiência,Necessidade de Acessibilidade,Avaliação,Horário da Visita
0,2024-06-27,Rio de Janeiro,RJ,Brasil,Aventura,Solteiro(a),Ensino Fundamental,Até 1 salário mínimo,Prefiro não responder,Não,Não se aplica,Marco das Três Fronteiras,Não,Não,Não,1,03:34:53
1,2024-01-25,São Paulo,SP,Brasil,Cultura,Divorciado(a),Ensino Fundamental,Até 1 salário mínimo,Prefiro não responder,Sim,13-17,Marco das Três Fronteiras,Não,Não,Não,0,20:35:19
2,2024-10-21,Manaus,AM,Brasil,Aventura,Prefiro não responder,Ensino Fundamental,Até 1 salário mínimo,46-55,Sim,0-5,Parque das Aves,Sim,Deficiência Intelectual,Rampa de Acesso,2,23:03:11
3,2024-01-02,Brasília,DF,Brasil,Trilha,Viúvo(a),Pós-Graduação,Acima de 5 salários mínimos,26-35,Não,Não se aplica,Usina de Itaipu,Não,Não,Não,2,00:41:54
4,2024-05-07,Curitiba,PR,Brasil,Trilha,Casado(a),Ensino Médio,1 a 3 salários mínimos,46-55,Não,Não se aplica,Usina de Itaipu,Não,Não,Não,5,12:14:15
5,2024-02-20,Belém,PA,Brasil,Aventura,Viúvo(a),Ensino Médio,1 a 3 salários mínimos,18-25,Sim,0-5,Marco das Três Fronteiras,Sim,Deficiência Visual,Acompanhamento/Suporte,1,07:36:52
6,2024-03-18,Brasília,DF,Brasil,Cultura,Divorciado(a),Ensino Fundamental,Até 1 salário mínimo,36-45,Não,Não se aplica,Parque das Aves,Sim,Deficiência Auditiva,Não,5,21:39:21
7,2024-02-03,Recife,PE,Brasil,Ecoturismo,Viúvo(a),Ensino Médio,1 a 3 salários mínimos,36-45,Não,Não se aplica,Parque das Aves,Não,Não,Não,1,11:17:00
8,2024-06-23,Brasília,DF,Brasil,Trilha,Prefiro não responder,Ensino Médio,1 a 3 salários mínimos,Prefiro não responder,Não,Não se aplica,Parque das Aves,Sim,Deficiência Auditiva,Rampa de Acesso,0,05:22:49
9,2024-10-20,São Paulo,SP,Brasil,Aventura,Solteiro(a),Ensino Fundamental,Até 1 salário mínimo,36-45,Não,Não se aplica,Parque das Aves,Não,Não,Não,0,10:16:53


In [9]:
# Converter o DataFrame para JSON

df.to_json('dados.json', orient='records', force_ascii=False, indent=4)