In [1]:
import numpy as np
import pandas as pd

data = {
    'Idade': [25, 35, 45, np.nan, 55, 65, 75, np.nan, 85, 95],
    'Gênero': ['F', 'M', 'F', 'F', 'M', 'M', 'F', 'M', 'F', 'M'],
    'Colesterol': [190, np.nan, 240, 225, 210, np.nan, 180, 195, 220, np.nan],
    'Pressão Sanguínea': [70, 80, 78, 75, 72, 130, 60, 85, 90, 77],
    'Fumante': ['Não', 'Sim', 'Não', 'Não', 'Sim', 'Não', 'Sim', 'Não', 'Não', 'Sim'],
    'Risco': ['baixo', 'médio', 'alto', 'baixo', 'alto', 'médio', 'baixo', 'médio', 'baixo', 'alto']
}

df = pd.DataFrame(data)


In [2]:
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.linear_model import LogisticRegression

# Definição do pré-processador para o ColumnTransformer
preprocessor = ColumnTransformer(
    transformers=[
        ('num', Pipeline(steps=[
            ('imputer', SimpleImputer(strategy='mean')),  # Preenchendo valores ausentes
            ('scaler', StandardScaler())]),               # Escalonando as características numéricas
        ['Idade', 'Colesterol', 'Pressão Sanguínea']),
        ('cat', OneHotEncoder(), ['Gênero', 'Fumante'])  # Convertendo as características categóricas
    ]
)

# Criação do pipeline completo com o ColumnTransformer e o modelo
pipeline = Pipeline(steps=[
    ('preprocessor', preprocessor),
    ('classifier', LogisticRegression())  # Modelo final que será treinado
])

# Separando as features e o target
X = df.drop('Risco', axis=1)
y = df['Risco']

# Treinando o pipeline completo
pipeline.fit(X, y)


In [3]:
# Suponha que você tenha novos dados em um DataFrame chamado 'new_data'
new_data = pd.DataFrame({
    'Idade': [30, 40, 50],
    'Gênero': ['M', 'F', 'M'],
    'Colesterol': [200, 180, 220],
    'Pressão Sanguínea': [120, 110, 130],
    'Fumante': ['Não', 'Sim', 'Não']
})

# Fazendo previsões usando o pipeline treinado
predictions = pipeline.predict(new_data)

# Imprimindo as previsões
print(predictions)

['médio' 'médio' 'médio']
