In [14]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB
from sklearn.preprocessing import LabelEncoder

# Dados fornecidos
data = {
    'SITUAÇÃO': ['H', 'H', 'M', 'M', 'M', 'M', 'M', 'H', 'H', 'M', 'H', 'M', 'M', 'M'],
    'HISTÓRICO': ['Solteiro', 'Solteiro', 'Divorciada', 'Solteira', 'Solteira', 'Solteira',
                  'Divorciada', 'Solteiro', 'Solteiro', 'Solteira', 'Solteiro', 'Divorciada',
                  'Divorciada', 'Solteira'],
    'EMPREGO': ['Existe', 'Existe', 'Existe', 'Sem Dívidas', 'Crítico', 'Crítico',
                'Crítico', 'Sem Dívidas', 'Crítico', 'Sem Dívidas', 'Sem Dívidas',
                'Existe', 'Sem Dívidas', 'Sem Dívidas'],
    'CASA': ['Dívidas <= 2 anos', 'Dívidas <= 2 anos', 'Dívidas <= 2 anos',
             'Dívidas <= 2 anos', 'Dívidas > 2 anos', 'Dívidas > 2 anos',
             'Dívidas > 2 anos', 'Dívidas <= 2 anos', 'Dívidas > 2 anos',
             'Dívidas > 2 anos', 'Dívidas <= 2 anos', 'Dívidas > 2 anos',
             'Dívidas <= 2 anos', 'Dívidas <= 2 anos'],
    'RISCO': ['Ruim', 'Ruim', 'Bom', 'Bom', 'Bom', 'Ruim', 'Bom', 'Ruim',
              'Bom', 'Bom', 'Bom', 'Bom', 'Ruim', 'Ruim']
}

# Criando DataFrame
df = pd.DataFrame(data)

df

Unnamed: 0,SITUAÇÃO,HISTÓRICO,EMPREGO,CASA,RISCO
0,H,Solteiro,Existe,Dívidas <= 2 anos,Ruim
1,H,Solteiro,Existe,Dívidas <= 2 anos,Ruim
2,M,Divorciada,Existe,Dívidas <= 2 anos,Bom
3,M,Solteira,Sem Dívidas,Dívidas <= 2 anos,Bom
4,M,Solteira,Crítico,Dívidas > 2 anos,Bom
5,M,Solteira,Crítico,Dívidas > 2 anos,Ruim
6,M,Divorciada,Crítico,Dívidas > 2 anos,Bom
7,H,Solteiro,Sem Dívidas,Dívidas <= 2 anos,Ruim
8,H,Solteiro,Crítico,Dívidas > 2 anos,Bom
9,M,Solteira,Sem Dívidas,Dívidas > 2 anos,Bom


In [15]:
# Encoding labels
label_encoders = {}
for column in df.columns:
    le = LabelEncoder()
    df[column] = le.fit_transform(df[column])
    label_encoders[column] = le

# Separando variáveis independentes (X) e dependentes (y)
X = df.drop('RISCO', axis=1)
y = df['RISCO']

# Dividindo o conjunto de dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criando o modelo Naive Bayes
model = GaussianNB()
model.fit(X_train, y_train)

# Prevendo o risco para a nova situação
new_data = pd.DataFrame({
    'SITUAÇÃO': [label_encoders['SITUAÇÃO'].transform(['H'])[0]],
    'HISTÓRICO': [label_encoders['HISTÓRICO'].transform(['Solteiro'])[0]],
    'EMPREGO': [label_encoders['EMPREGO'].transform(['Sem Dívidas'])[0]],
    'CASA': [label_encoders['CASA'].transform(['Dívidas <= 2 anos'])[0]]
})

predicted_risk = model.predict(new_data)

# Decodificando a previsão
predicted_risk_label = label_encoders['RISCO'].inverse_transform(predicted_risk)

print(f"O risco de conceder o empréstimo para LINHA 0 é: {predicted_risk_label[0]} ")

# Acurácia do modelo
accuracy = model.score(X_test, y_test)
print(f"Acurácia do modelo: {accuracy * 100:.2f}%")

O risco de conceder o empréstimo para LINHA 0 é: Ruim 
Acurácia do modelo: 100.00%
