In [1]:
#Biblioteca
import pandas as pd
import numpy as np
import random
from datetime import datetime, timedelta

In [2]:
# Configurar seed para que os dados sejam variados
np.random.seed(42)
random.seed(42)

In [3]:
# Função para criar o dataframe de exportação
def criar_dados_exportacao(n_registros=4000):

    # Países de destino
    paises_destino = {
        'US': 0.25,     # Estados Unidos
        'CN': 0.20,     # China
        'AR': 0.12,     # Argentina
        'DE': 0.08,     # Alemanha
        'NL': 0.06,     # Holanda
        'JP': 0.05,     # Japão
        'IT': 0.04,     # Itália
        'FR': 0.04,     # França
        'ES': 0.03,     # Espanha
        'MX': 0.03,     # México
        'GB': 0.03,     # Reino Unido
        'CL': 0.02,     # Chile
        'CA': 0.02,     # Canadá
        'BE': 0.02,     # Bélgica
        'KR': 0.01      # Coreia do Sul
    }

    # Cidades de destino por país
    cidades_por_pais = {
        'US': ['New York', 'Los Angeles', 'Miami', 'Houston', 'Chicago', 'Atlanta'],
        'CN': ['Shanghai', 'Beijing', 'Guangzhou', 'Shenzhen', 'Tianjin'],
        'AR': ['Buenos Aires', 'Córdoba', 'Rosario', 'Mendoza'],
        'DE': ['Hamburg', 'Bremen', 'Frankfurt', 'Munich', 'Berlin'],
        'NL': ['Rotterdam', 'Amsterdam', 'Utrecht'],
        'JP': ['Tokyo', 'Osaka', 'Yokohama', 'Kobe'],
        'IT': ['Milan', 'Rome', 'Naples', 'Genoa'],
        'FR': ['Paris', 'Marseille', 'Lyon', 'Le Havre'],
        'ES': ['Madrid', 'Barcelona', 'Valencia', 'Bilbao'],
        'MX': ['Mexico City', 'Guadalajara', 'Monterrey'],
        'GB': ['London', 'Manchester', 'Liverpool'],
        'CL': ['Santiago', 'Valparaíso'],
        'CA': ['Toronto', 'Vancouver', 'Montreal'],
        'BE': ['Antwerp', 'Brussels'],
        'KR': ['Seoul', 'Busan']
    }

    # Operadores logísticos com distribuições realistas
    operadores = {
        'Lufthansa': 0.30,
        'Fast Airways': 0.25,
        'Next Airlines': 0.20,
        'DKL Express': 0.15,
        'LM Logistics': 0.10
    }

    # IDs dos operadores
    ids_operadores = {
        'Lufthansa': 1146,
        'Next Airlines': 1147,
        'Fast Airways': 1148,
        'DKL Express': 4089,
        'LM Logistics': 4090
    }

    # Tipo de modal com distribuição realística
    tipos_modal = ['Aéreo', 'Marítimo']
    prob_modal = [0.35, 0.65]

    # Códigos de exceção com distribuições realistas (maioria sem problemas)
    codigos_excecao = {
        '': 0.75,
        'E01': 0.08,
        'E02': 0.06,
        'E03': 0.04,
        'E04': 0.03,
        'E05': 0.03,
        'E06': 0.01
    }

    # Status de entrega
    status_entrega = ['No Prazo', 'Atraso']
    prob_status = [0.82, 0.18]

    # Gerar dados
    dados = []

    for i in range(n_registros):
        # Escolher país e cidade
        pais = np.random.choice(list(paises_destino.keys()),
                               p=list(paises_destino.values()))
        cidade = random.choice(cidades_por_pais[pais])

        # Escolher operador
        operador = np.random.choice(list(operadores.keys()),
                                   p=list(operadores.values()))
        id_operador = ids_operadores[operador]

        # Escolher modal
        modal = np.random.choice(tipos_modal, p=prob_modal)

        # Código de exceção
        cod_excecao = np.random.choice(list(codigos_excecao.keys()),
                                      p=list(codigos_excecao.values()))

        # Status de entrega
        status = np.random.choice(status_entrega, p=prob_status)

        # Gerar datas
        data_base = datetime(2023, 1, 1)
        dias_aleatorios = random.randint(0, 364)
        data_coleta = data_base + timedelta(days=dias_aleatorios)

        # Data de entrega baseada no modal
        if modal == 'Aéreo':
            dias_transporte = np.random.normal(5, 2)  # Média 5 dias, desvio 2
        else:  # Marítimo
            dias_transporte = np.random.normal(25, 8)  # Média 25 dias, desvio 8

        dias_transporte = max(1, int(dias_transporte))
        data_entrega = data_coleta + timedelta(days=dias_transporte)

        # Gerar invoice number
        invoice_num = 980000 + i + random.randint(1, 1000)

        # Gerar peso
        if modal == 'Aéreo':
            peso = np.random.lognormal(np.log(500), 1.2)
        else:
            peso = np.random.lognormal(np.log(2000), 1.5)
        peso = max(1, int(peso))

        # Volume baseado no peso (aproximadamente)
        densidade = np.random.uniform(150, 400)  # kg/m³
        volume = max(1, int(peso / densidade))

        # Documento de embarque
        if modal == 'Aéreo':
            doc_embarque = f"AWB-{random.randint(100000, 999999)}"
        else:
            doc_embarque = f"BL-{random.randint(100000, 999999)}"

        # Prazo realizado vs contratado
        if status == 'No Prazo':
            prazo_realizado = np.random.randint(1, 4)  # 1-3 dias antes
            prazo_contratado = prazo_realizado + np.random.randint(0, 3)
        else:
            prazo_contratado = np.random.randint(3, 7)
            prazo_realizado = prazo_contratado + np.random.randint(1, 8)  # Atraso

        # Criar registro
        registro = {
            'Operação': 'Exportação',
            'Tipo': modal,
            'No. Invoice': invoice_num,
            'Incoterm': np.random.choice(['FOB', 'CIF', 'EXW', 'DDP'],
                                       p=[0.4, 0.3, 0.2, 0.1]),
            'ID País Origem': 'BR',
            'País Origem': 'Brazil',
            'ID País Destino': pais,
            'Local Destino': cidade,
            'ID Operador Logístico': id_operador,
            'Doc. Embarque (AWB / BL)': doc_embarque,
            'Peso (kg)': peso,
            'Volume (cbm)': volume,
            'Tipo de serviço': np.random.choice(['STANDARD', 'EXPRESS', 'ECONOMY'],
                                              p=[0.7, 0.2, 0.1]),
            'Data da Coleta': data_coleta.strftime('%A, %d de %B de %Y').replace('Monday', 'segunda-feira').replace('Tuesday', 'terça-feira').replace('Wednesday', 'quarta-feira').replace('Thursday', 'quinta-feira').replace('Friday', 'sexta-feira').replace('Saturday', 'sábado').replace('Sunday', 'domingo').replace('January', 'janeiro').replace('February', 'fevereiro').replace('March', 'março').replace('April', 'abril').replace('May', 'maio').replace('June', 'junho').replace('July', 'julho').replace('August', 'agosto').replace('September', 'setembro').replace('October', 'outubro').replace('November', 'novembro').replace('December', 'dezembro'),
            'Data da Entrega': data_entrega.strftime('%A, %d de %B de %Y').replace('Monday', 'segunda-feira').replace('Tuesday', 'terça-feira').replace('Wednesday', 'quarta-feira').replace('Thursday', 'quinta-feira').replace('Friday', 'sexta-feira').replace('Saturday', 'sábado').replace('Sunday', 'domingo').replace('January', 'janeiro').replace('February', 'fevereiro').replace('March', 'março').replace('April', 'abril').replace('May', 'maio').replace('June', 'junho').replace('July', 'julho').replace('August', 'agosto').replace('September', 'setembro').replace('October', 'outubro').replace('November', 'novembro').replace('December', 'dezembro'),
            'Prazo Realizado': prazo_realizado,
            'Prazo Contratado': prazo_contratado,
            'Status Entrega': status,
            'Cód. Exceção': cod_excecao
        }

        dados.append(registro)

    return pd.DataFrame(dados)

In [4]:
# Gerar os dados
df_exportacao = criar_dados_exportacao(4000)

In [5]:
# Salvar o arquivo
df_exportacao.to_csv('dados_exportacao_ficticios.csv', index=False, encoding='utf-8')
print(f"\n✅ Arquivo 'dados_exportacao_ficticios.csv' criado com {len(df_exportacao)} registros!")


✅ Arquivo 'dados_exportacao_ficticios.csv' criado com 4000 registros!


In [8]:
df_exportacao.head()

Unnamed: 0,Operação,Tipo,No. Invoice,Incoterm,ID País Origem,País Origem,ID País Destino,Local Destino,ID Operador Logístico,Doc. Embarque (AWB / BL),Peso (kg),Volume (cbm),Tipo de serviço,Data da Coleta,Data da Entrega,Prazo Realizado,Prazo Contratado,Status Entrega,Cód. Exceção
0,Exportação,Marítimo,980760,DDP,BR,Brazil,CN,Shanghai,4090,BL-388389,9105,27,EXPRESS,"sexta-feira, 13 de janeiro de 2023","quinta-feira, 09 de fevereiro de 2023",2,2,No Prazo,
1,Exportação,Aéreo,980144,CIF,BR,Brazil,US,Los Angeles,1146,AWB-872246,254,1,EXPRESS,"terça-feira, 25 de abril de 2023","quarta-feira, 26 de abril de 2023",2,4,No Prazo,
2,Exportação,Marítimo,980761,CIF,BR,Brazil,US,New York,1148,BL-671858,8283,47,EXPRESS,"quarta-feira, 13 de dezembro de 2023","terça-feira, 02 de janeiro de 2024",3,5,No Prazo,
3,Exportação,Aéreo,980436,CIF,BR,Brazil,US,New York,1148,AWB-133326,93,1,STANDARD,"segunda-feira, 30 de outubro de 2023","sábado, 04 de novembro de 2023",2,3,No Prazo,E01
4,Exportação,Aéreo,980228,FOB,BR,Brazil,GB,London,1147,AWB-343962,3585,12,EXPRESS,"sexta-feira, 17 de fevereiro de 2023","quarta-feira, 22 de fevereiro de 2023",1,1,No Prazo,
