In [None]:
%pip install pandas faker

In [None]:
# Importação das bibliotecas
import pandas as pd
from faker import Faker
import random
import os

In [None]:
# Inicializa gerador de dados fake em português do Brasil
faker = Faker('pt_BR')

In [None]:
# Caminho do arquivo com cidades e UFs
url_csv = 'https://raw.githubusercontent.com/MarconyLage/Cidades_e_UFs/main/Arquivos%20Gerados/cidades_brasil_completo.csv'

In [None]:
# Carrega os dados de cidades e UFs
df_cidades = pd.read_csv(url_csv)

In [None]:
# Função para gerar dados falsos
def gerar_dados_pessoas(qtd):
    dados = []

    for i in range(1, qtd + 1):
        linha_cidade = df_cidades.sample(1).iloc[0]

        dados.append({
            'ID': i,
            'Nome': faker.name(),
            'Data de Nascimento': faker.date_of_birth(minimum_age=18, maximum_age=90).strftime('%d/%m/%Y'),
            'Cidade': linha_cidade['nome_municipio'],
            'UF': linha_cidade['uf'],
            'País': 'Brasil'
        })

    return pd.DataFrame(dados)

In [None]:
# ======== CONFIGURAÇÕES DE EXPORTAÇÃO ========

# Parâmetros de 

# quantidade de registros
qtd_registros = 20  

# Caminho da pasta de destino
pasta_destino = 'dados_gerados'

# Nome do arquivo sem extensão
nome_arquivo = 'pessoas_fake'

# Formato do arquivo: 'csv' ou 'xlsx'
formato = 'csv'


In [None]:
# Criação da pasta se não existir
os.makedirs(pasta_destino, exist_ok=True)

# Geração dos dados
df_pessoas = gerar_dados_pessoas(qtd_registros)

# Caminho completo do arquivo com base no formato
if formato == 'csv':
    caminho_arquivo = os.path.join(pasta_destino, f'{nome_arquivo}.csv')
    df_pessoas.to_csv(caminho_arquivo, index=False, sep=';', encoding='utf-8-sig')
elif formato == 'xlsx':
    caminho_arquivo = os.path.join(pasta_destino, f'{nome_arquivo}.xlsx')
    df_pessoas.to_excel(caminho_arquivo, index=False)
else:
    raise ValueError("Formato inválido. Use 'csv' ou 'xlsx'.")

# Confirmação
print(f'Arquivo salvo em: {caminho_arquivo}')