# Código 

## Importações

In [None]:
import pandas as pd
import numpy as np
import sklearn
from imblearn.over_sampling import SMOTE
from imblearn.under_sampling import RandomUnderSampler
from imblearn.pipeline import Pipeline

## Visualização do Dataset

In [None]:
df = pd.read_csv()
df.head()

In [None]:
df.describe()

## Contagem de dados nulos

In [None]:

def encontrar_dados_nulos(dataset):
    # Calcula a quantidade de valores nulos por coluna
    quantidade_nulos = dataset.isnull().sum()

    # Calcula a porcentagem de valores nulos por coluna
    porcentagem_nulos = (dataset.isnull().sum() / len(dataset)) * 100

    # Cria um DataFrame para exibir os resultados
    dados_nulos = pd.DataFrame({
        'Quantidade de Nulos': quantidade_nulos,
        'Porcentagem de Nulos': porcentagem_nulos
    })

    return dados_nulos

encontrar_dados_nulos(df)


## Balanceamento do dataset

In [None]:
def balancear_dataset(dataset, target_column):
    # Verifica a distribuição das classes
    class_distribution = dataset[target_column].value_counts()
    print("Distribuição das classes antes do balanceamento:")
    print(class_distribution)
    
    # Define as técnicas de oversampling e undersampling
    over = SMOTE(sampling_strategy=0.5)
    under = RandomUnderSampler(sampling_strategy=0.8)
    
    # Cria o pipeline de balanceamento
    steps = [('o', over), ('u', under)]
    pipeline = Pipeline(steps=steps)
    
    # Separa as features e a variável alvo
    X = dataset.drop(columns=[target_column])
    y = dataset[target_column]
    
    # Aplica o balanceamento
    X_bal, y_bal = pipeline.fit_resample(X, y)
    
    # Cria o dataset balanceado
    dataset_bal = pd.concat([X_bal, y_bal], axis=1)
    
    # Verifica a nova distribuição das classes
    class_distribution_bal = dataset_bal[target_column].value_counts()
    print("Distribuição das classes após o balanceamento:")
    print(class_distribution_bal)
    
    return dataset_bal


df_balanceado = balancear_dataset(df, 'nome_da_coluna_alvo')