# Transformações Relevantes

## 1. Importação Bibliotecas

In [None]:
import pandas as pd

## 2. Scripts

In [None]:
def transformar_data(data, coluna):
    """
    Transforma uma coluna datetime em colunas separadas de ano, mês e dia.

    Parâmetros:
    - df (pd.DataFrame): DataFrame original.
    - coluna (str): Nome da coluna com dados no formato datetime.

    Retorna:
    - pd.DataFrame: DataFrame com as colunas 'ano', 'mes' e 'dia' adicionadas.
    """
    # garante que a coluna tá no formato datetime
    data[coluna] = pd.to_datetime(data[coluna], errors='coerce')
    
    # cria as colunas de ano, mês e dia
    data['ano'] = data[coluna].dt.year
    data['mes'] = data[coluna].dt.month
    data['dia'] = data[coluna].dt.day
    
    # remove a coluna original (opcional)
    data = data.drop(columns=[coluna])
    
    return data

---

In [None]:
def transformar_colunas_categoricas_dataset_teste(dataset_teste, mappings):
    """
    Aplica o mapeamento de target encoding no DataFrame de teste.
    
    Args:
        dataset_teste (pd.DataFrame): DataFrame de teste.
        mappings (dict): Dicionário com os mapeamentos do treinamento.
    
    Returns:
        pd.DataFrame: DataFrame de teste com as colunas encodadas.
    """

    for col, mapping in mappings.items():
        if col in dataset_teste.columns:
            # substitui os valores originais pelos valores encodados
            dataset_teste[col] = dataset_teste[col].map(mapping)
            
            # lida com valores não encontrados no mapeamento
            dataset_teste[col].fillna(-1, inplace=True)  
    
    return dataset_teste