# 🚗🚙🚘🛻 Geração de Clientes pelo eVED
Este notebook gera os clientes para os testes de aprendizado federado a partir dos dados do [eVED](https://huggingface.co/datasets/jwsouza13/eVED-train-test)

In [2]:
import os
import json
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from datasets import load_dataset

⚠️ Se tiver rodado o arquivo `eVED-train-test-generator.py`, carregue (*substituindo 40 e 42 pelos valores testados*):

In [2]:
eved_train = load_dataset("eVED_train_test_FRAC-TEST_40_STATE_42", split="train")
eved_test = load_dataset("eVED_train_test_FRAC-TEST_40_STATE_42", split="test")

Generating train split: 0 examples [00:00, ? examples/s]

Generating test split: 0 examples [00:00, ? examples/s]

🤗 Se quiser testar com os datasets já carregados do HF🤗:

In [None]:
#eved_train = load_dataset("jwsouza13/eVED-train-test", split="train")
#eved_test = load_dataset("jwsouza13/eVED-train-test", split="test")

# 🧑‍🦲👩‍🦳👳‍♀️👨‍🦲👩‍🦱👶 CLIENTES  🚓🚗🚕🛺🚙🚛

In [None]:
df_train = eved_train.to_pandas()
clients_train = eved_train.unique("VehId")
i = 0
print("Processando TREINO...")
for id in clients_train:
    folder_path = f"EVED_Clients/train/client_{i}"
    os.makedirs(folder_path, exist_ok=True) # exist_ok=True é mais seguro
    
    df_client = df_train[df_train.VehId == id].copy()
    
    # Salvar Metadados (Treino)
    veh_type = 'Unknown'

    # EngineType (EV, PHEV)
    if 'EngineType' in df_client.columns and pd.notna(df_client['EngineType'].iloc[0]):
        type_from_col = df_client['EngineType'].iloc[0]
        if type_from_col in ('EV', 'PHEV'):
            veh_type = type_from_col

    # Se não for, checar Vehicle Type (ICE, HEV)
    elif 'Vehicle Type' in df_client.columns and pd.notna(df_client['Vehicle Type'].iloc[0]):
        type_from_col = df_client['Vehicle Type'].iloc[0]
        if type_from_col in ('ICE', 'HEV'):
            veh_type = type_from_col

    metadata = {
        'VehId': id, # O ID real do veículo
        'ClientIndex': i, # O índice da pasta (client_i)
        'VehicleType': veh_type # O tipo determinado
    }
    
    with open(os.path.join(folder_path, 'metadata.json'), 'w') as f:
        json.dump(metadata, f, indent=4)

    for trip in df_client.Trip.unique():
        df_trip = df_client[df_client.Trip == trip].copy()
        df_trip.to_parquet(os.path.join(folder_path, f"trip_{trip}.parquet"))
        
    del df_client
    i += 1

print("Processando TESTE...")
df_test = eved_test.to_pandas()
clients_test = eved_test.unique("VehId")
i = 0
for id in clients_test:
    folder_path = f"EVED_Clients/test/client_{i}"
    os.makedirs(folder_path, exist_ok=True)
    
    df_client = df_test[df_test.VehId == id].copy()
    
    # Salvar Metadados (Teste)
    veh_type = 'Unknown'
    if 'EngineType' in df_client.columns and pd.notna(df_client['EngineType'].iloc[0]):
        type_from_col = df_client['EngineType'].iloc[0]
        if type_from_col in ('EV', 'PHEV'):
            veh_type = type_from_col
    elif 'Vehicle Type' in df_client.columns and pd.notna(df_client['Vehicle Type'].iloc[0]):
        type_from_col = df_client['Vehicle Type'].iloc[0]
        if type_from_col in ('ICE', 'HEV'):
            veh_type = type_from_col
            
    metadata = {
        'VehId': id,
        'ClientIndex': i,
        'VehicleType': veh_type
    }
    
    with open(os.path.join(folder_path, 'metadata.json'), 'w') as f:
        json.dump(metadata, f, indent=4)
    
    for trip in df_client.Trip.unique():
        df_trip = df_client[df_client.Trip == trip].copy()
        df_trip.to_parquet(os.path.join(folder_path, f"trip_{trip}.parquet"))
        
    del df_client
    i += 1

print("Finalizado com sucesso!")

Carregando datasets...
Processando Treino...
Processando Teste...
Processamento de dados concluído com metadados!


---

## Para ver algumas Trips 🛣️🚗

In [None]:
from eVED_Vizu import EVEDVisualizer, visualize_trip

In [None]:
viz = EVEDVisualizer()
trips = viz.get_available_trips(0, 'train')
print(trips)  # [706.0, 707.0, 708.0, 730.0, ...]

visualize_trip(client_id=0, trip_id=707)
visualize_trip(client_id=0, trip_id=706)

[706.0, 707.0, 708.0, 730.0, 734.0, 743.0, 746.0, 755.0, 771.0, 786.0, 789.0, 802.0, 805.0, 811.0, 838.0, 840.0, 854.0, 855.0, 867.0, 878.0, 891.0, 893.0, 894.0, 896.0, 897.0, 898.0, 902.0, 906.0, 907.0, 909.0, 925.0, 940.0, 942.0, 948.0, 952.0, 954.0, 960.0, 968.0, 978.0, 980.0, 982.0, 988.0, 990.0, 1006.0, 1014.0, 1035.0, 1039.0, 1073.0, 1077.0, 1091.0, 1097.0, 1120.0, 1123.0]
Carregando dados do cliente 0...
Tipo de veículo: Combustão
Total de pontos: 279

✅ Mapa animado salvo em: trip_client_0_trip_707.html
📍 Trip ID: 707.0
🎯 Total de pontos: 279

🌐 Abra o arquivo no navegador - A animação inicia automaticamente!
Carregando dados do cliente 0...
Tipo de veículo: Combustão
Total de pontos: 137

✅ Mapa animado salvo em: trip_client_0_trip_706.html
📍 Trip ID: 706.0
🎯 Total de pontos: 137

🌐 Abra o arquivo no navegador - A animação inicia automaticamente!
ℹ️  Usando trip 706.0 (primeira disponível)
Carregando dados do cliente 0...
Tipo de veículo: Combustão
Total de pontos: 137

✅ Mapa