In [9]:
import pandas as pd
import numpy as np
from typing import List, Dict
from faker import Faker
import random
import datetime

In [5]:

def create_dataframe(size: int = 10)-> pd.DataFrame:
    """
    Cria um dataframe com dados fakes de acordo com o tamanho passado como argumento.
    :param size: int: Tamanho do dataframe a ser criado (padrão é 10)
    :return: pd.DataFrame: Dataframe com dados fakes
    """

    fake = Faker()

    # Cria um dataframe com dados de 10 pessoas
    df = pd.DataFrame({
        "name": [fake.name() for _ in range(size)],
        "age": [fake.random_int(min=18, max=80, step=1) for _ in range(size)],
        "location": [random.choice(["interior", "cidade", "rural"]) for _ in range(size)]
    })
    return df


In [10]:

def gerar_faturas(
        clientes: List[str],
        n_faturas_min: int = 20,
        n_faturas_max: int = 60,
        valor_minimo: float = 60,
        valor_maximo: float = 500,
        sd_min: float = 2,
        sd_max: float = 1
)-> pd.DataFrame:
    """Gera faturamento de clientes de forma aleatória.
    
    :param clientes: List[str]: Lista com os nomes dos clientes.
    :param n_faturas_min: int: Número mínimo de faturas a serem geradas para cada cliente.
    :param n_faturas_max: int: Número máximo de faturas a serem geradas para cada cliente.
    :param valor_minimo: float: Valor mínimo das faturas.
    :param valor_maximo: float: Valor máximo das faturas.
    :param sd_min: float: Desvio padrão mínimo.
    :param sd_max: float: Desvio padrão máximo.

    :return: pd.DataFrame: Tabela com as faturas geradas.
    """
    dados_faturas = []

    for cliente in clientes:
        num_faturas = np.random.randint(n_faturas_min, n_faturas_max+1)  # Entre 20 e 60 faturas

        media_fatura = np.random.uniform(valor_minimo, valor_maximo)  
        desvio_padrao = np.random.uniform(sd_min, sd_max)  # Desvio padrão entre 2 e 5

        valores_faturas = np.random.normal(media_fatura, desvio_padrao, num_faturas)

        for valor in valores_faturas:
            dados_faturas.append([cliente, valor])

    df_faturas = pd.DataFrame(dados_faturas, columns=['Cliente', 'Valor da Fatura'])

    df_faturas['Número da Fatura'] = df_faturas.groupby('Cliente').cumcount() + 1

    return df_faturas
