In [92]:
import random
import pandas as pd

## Configurações

In [93]:
quantidade_cpfs = 64
quantidade_cnpjs = 36
caminho = r"base\base_cpf_cnpj.xlsx"

## Função para gerar um CPF válido

In [94]:
def gerar_cpf():
    def calcular_digito(verificadores):
        soma = sum([verificadores[i] * (len(verificadores) + 1 - i) for i in range(len(verificadores))])
        resto = soma % 11
        return 0 if resto < 2 else 11 - resto

    cpf = [random.randint(0, 9) for _ in range(9)]
    cpf.append(calcular_digito(cpf))
    cpf.append(calcular_digito(cpf))
    return ''.join(map(str, cpf))

## Função para gerar um CNPJ válido

In [95]:
def gerar_cnpj():
    def calcular_digito(base):
        pesos = [6, 5, 4, 3, 2, 9, 8, 7, 6, 5, 4, 3, 2]
        soma = sum(base[i] * pesos[i + len(pesos) - len(base)] for i in range(len(base)))
        resto = soma % 11
        return 0 if resto < 2 else 11 - resto

    cnpj = [random.randint(0, 9) for _ in range(8)] + [0, 0, 0, 1]
    cnpj.append(calcular_digito(cnpj))
    cnpj.append(calcular_digito(cnpj))
    return ''.join(map(str, cnpj))

## Função para gerar CPFs e CNPJs

In [96]:
def gerar_cpfs_cnpjs(qtd_cpfs, qtd_cnpjs):
    cpfs = [{'tipo': 'CPF', 'cpf_cnpj': gerar_cpf()} for _ in range(qtd_cpfs)]
    cnpjs = [{'tipo': 'CNPJ', 'cpf_cnpj': gerar_cnpj()} for _ in range(qtd_cnpjs)]
    dados = cpfs + cnpjs
    random.shuffle(dados)
    return dados

## Uso

In [97]:
dados = gerar_cpfs_cnpjs(quantidade_cpfs, quantidade_cnpjs)

df = pd.DataFrame(dados)
df['tamanho'] = df['cpf_cnpj'].apply(len)
df.to_excel(caminho, index=False)

df

Unnamed: 0,tipo,cpf_cnpj,tamanho
0,CPF,22536471284,11
1,CPF,41209745372,11
2,CPF,41512145343,11
3,CPF,64287054270,11
4,CNPJ,69346060000167,14
...,...,...,...
95,CPF,78555617308,11
96,CPF,43366442921,11
97,CNPJ,27557118000171,14
98,CPF,44881186582,11


In [98]:
df['tipo'].value_counts()

tipo
CPF     64
CNPJ    36
Name: count, dtype: int64

In [99]:
df['tamanho'].value_counts()

tamanho
11    64
14    36
Name: count, dtype: int64