#**Faker**

Para iniciar o projeto, vamos usar a biblioteca Faker para gerar dados fictícios do noso projeto social hipotético. Primeiramente vamos instalar o programa.

In [1]:
!pip install Faker

Collecting Faker
  Downloading Faker-30.4.0-py3-none-any.whl.metadata (15 kB)
Downloading Faker-30.4.0-py3-none-any.whl (1.8 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.8/1.8 MB[0m [31m18.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: Faker
Successfully installed Faker-30.4.0


Agora vamos testar algumas de suas funções:

In [2]:
from faker import Faker

# Crie uma instância do Faker
fake = Faker()
# Gere um nome fictício
nome = fake.name()
# Gere um endereço fictício
endereco = fake.address()
# Gere um número de telefone fictício
telefone = fake.phone_number()
# Gere uma data de nascimento fictícia
data_de_nascimento = fake.date_of_birth(minimum_age=18, maximum_age=65)
# Imprima os dados fictícios
print("Nome: ", nome)
print("Endereço: ", endereco)
print("Telefone: ", telefone)
print("Data de Nascimento: ", data_de_nascimento)

Nome:  Kayla Phillips
Endereço:  66050 Marsh Plains
Lake Kevin, AS 13245
Telefone:  +1-361-913-1531x541
Data de Nascimento:  1987-09-08


E aqui o negócio fica sério: vamos gerar o arquivo CSV que vai guiar o nosso dashboard. Definimos que vamos geral mil linhas, pois é um tamanho razoável para cadastrados em um projeto social. Colocamos os nomes de todos os bairros da cidade do Rio de Janeiro e algumas profissões para serem atribuídas.

In [3]:
import datetime
from faker import Faker
import random
import csv

fake = Faker()

# Número de linhas geradas
num_rows = 1000

# Definindo as colunas
headers = ["nascimento", "nome", "gênero", "casado", "idade",  "bairro", "pessoas", "profissão"]

BAIRROS = [
    "São Cristóvão",
    "Benfica",
    "Caju",
    "Catumbi",
    "Centro",
    "Cidade Nova",
    "Estácio",
    "Gamboa",
    "Glória",
    "Lapa",
    "Mangueira",
    "Paquetá",
    "Rio Comprido",
    "Santa Teresa",
    "Santo Cristo",
    "Saúde",
    "Vasco da Gama",
    "Botafogo",
    "Catete",
    "Copacabana",
    "Cosme Velho",
    "Flamengo",
    "Gávea",
    "Humaitá",
    "Ipanema",
    "Jardim Botânico",
    "Lagoa",
    "Laranjeiras",
    "Leblon",
    "Leme",
    "Rocinha",
    "São Conrado",
    "Urca",
    "Vidigal",
    "Anil",
    "Barra da Tijuca",
    "Camorim",
    "Cidade de Deus",
    "Curicica",
    "Freguesia",
    "Gardênia Azul",
    "Grumari",
    "Itanhangá",
    "Jacarepaguá",
    "Joá",
    "Praça Seca",
    "Pechincha",
    "Recreio dos Bandeirantes",
    "Tanque",
    "Taquara",
    "Vargem Grande",
    "Vargem Pequena",
    "Vila Valqueire",
    "Bangu",
    "Deodoro",
    "Gericinó",
    "Jardim Sulacap",
    "Magalhães Bastos",
    "Padre Miguel",
    "Realengo",
    "Santíssimo",
    "Senador Camará",
    "Vila Kennedy",
    "Vila Militar",
    "Barra de Guaratiba",
    "Campo Grande",
    "Cosmos",
    "Guaratiba",
    "Inhoaíba",
    "Paciência",
    "Pedra de Guaratiba",
    "Santa Cruz",
    "Senador Vasconcelos",
    "Sepetiba",
    "Alto da Boa Vista",
    "Andaraí",
    "Grajaú",
    "Maracanã",
    "Praça da Bandeira",
    "Tijuca",
    "Vila Isabel",
    "Abolição",
    "Água Santa",
    "Cachambi",
    "Del Castilho",
    "Encantado",
    "Engenho de Dentro",
    "Engenho Novo",
    "Higienópolis",
    "Jacaré",
    "Jacarezinho",
    "Lins de Vasconcelos",
    "Manguinhos",
    "Maria da Graça",
    "Méier",
    "Piedade",
    "Pilares",
    "Riachuelo",
    "Rocha",
    "Sampaio",
    "São Francisco Xavier",
    "Todos os Santos",
    "Bonsucesso",
    "Bancários",
    "Cacuia",
    "Cidade Universitária",
    "Cocotá",
    "Freguesia",
    "Galeão",
    "Jardim Carioca",
    "Jardim Guanabara",
    "Maré",
    "Moneró",
    "Olaria",
    "Pitangueiras",
    "Portuguesa",
    "Praia da Bandeira",
    "Ramos",
    "Ribeira",
    "Tauá",
    "Zumbi",
    "Acari",
    "Anchieta",
    "Barros Filho",
    "Bento Ribeiro",
    "Brás de Pina",
    "Campinho",
    "Cavalcanti",
    "Cascadura",
    "Coelho Neto",
    "Colégio",
    "Complexo do Alemão",
    "Cordovil",
    "Costa Barros",
    "Engenheiro Leal",
    "Engenho da Rainha",
    "Guadalupe",
    "Honório Gurgel",
    "Inhaúma",
    "Irajá",
    "Jardim América",
    "Madureira",
    "Marechal Hermes",
    "Oswaldo Cruz",
    "Parada de Lucas",
    "Parque Anchieta",
    "Parque Colúmbia",
    "Pavuna",
    "Penha",
    "Penha Circular",
    "Quintino Bocaiuva",
    "Ricardo de Albuquerque",
    "Rocha Miranda",
    "Tomás Coelho",
    "Turiaçu",
    "Vaz Lobo",
    "Vicente de Carvalho",
    "Vigário Geral",
    "Vila da Penha",
    "Vila Kosmos",
    "Vista Alegre",
]


PROFISSÕES = [
    "Engenheiro",
    "Médico",
    "Advogado",
    "Arquiteto",
    "Professor",
    "Cientista",
    "Chef de cozinha",
    "Enfermeiro",
    "Personal trainer",
    "Dentista",
    "Estagiário",
    "Gerente de banco",
    "Cabeleireiro",
    "Entregador",
    "Publicitário",
    "Digital influencer",
    "Auxiliar de serviços gerais",
    "Eletricista",
    "Encanador",
    "Mecânico Automotivo",
    "Arquiteto",
    "Ator",
    "Cantor",
    "Motorista",
    "Funcionário público",
    "Segurança",
    "Químico",
    "Policial",
    "Pedreiro",
    "Bombeiro",
]

# Criando o CSV
with open("cadastro.csv", "w", newline="") as csvfile:
    writer = csv.writer(csvfile)

    # Cabeçalho
    writer.writerow(headers)

    # Gerando dados fake
    for i in range(num_rows):
        # Data de nascimento fake
        nascimento = fake.date_of_birth(minimum_age=18, maximum_age=75)

        # Nome fake
        nome = fake.name()

        # Gênero
        genero = random.choice(["M", "F"])

        # Casado
        casado = random.choice(["S", "N"])

        # Criação da idade
        idade = random.randint(18, 80)

        # Atribuição do bairro
        bairro = random.choice(BAIRROS)

        # Pessoas na casa
        pessoas = random.randint(1, 7)

        # Atribuição da profissão
        profissao = random.choice(PROFISSÕES)

        # Gera o CSV
        writer.writerow([nascimento, nome, genero, casado, idade, bairro, pessoas, profissao])

##Legendas

**nascimento:** Data de nascimento gerada, pretendo utilizar uma fórmula que calcule automaticamente a idade

**nome:** Nome gerado, mas é apenas a título de curiosidade mesmo, não será usado nas apresentações

**genero:** Coloquei apenas M e F justamente para facilitar a análise

**casado:** Saber se é casado(a) ou não

**idade:** Vai ser útil para analisar a faixa etária das pessoas

**bairro:** Aqui vai ser interessante para fazer a análise territorial

**pessoas:** Quesito crucial pois nos diz quantas pessoas são, de fato, impactadas pelas ações

**profissao:** Também importante para saber a ocupação das pessoas impactadas