In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline  # Importe o Pipeline aqui

# Carregar os dados
data = pd.read_csv('base_clientes.csv')

# Dividir os dados em treinamento e teste
X = data.drop('default', axis=1)
y = data['default']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Definir colunas categóricas e numéricas (como mencionado anteriormente)

categorical_cols = ['sexo', 'escolaridade', 'estado_civil', 'salario_anual', 'tipo_cartao']
numeric_cols = ['idade', 'dependentes', 'meses_de_relacionamento', 'qtd_produtos', 'iteracoes_12m',
                'meses_inativo_12m', 'limite_credito', 'valor_transacoes_12m', 'qtd_transacoes_12m']

# Definir transformadores para colunas categóricas e numéricas
categorical_transformer = Pipeline(steps=[
    ('onehot', OneHotEncoder(handle_unknown='ignore'))
])

numeric_transformer = Pipeline(steps=[
    ('scaler', StandardScaler())
])

# Combina os transformadores
preprocessor = ColumnTransformer(
    transformers=[
        ('num', numeric_transformer, numeric_cols),
        ('cat', categorical_transformer, categorical_cols)
    ])

# Definir o pipeline completo com pré-processamento e modelo
model = Pipeline(steps=[('preprocessor', preprocessor),
                        ('classifier', RandomForestClassifier(n_estimators=100, random_state=42))
                        ])

# Treinar o modelo
model.fit(X_train, y_train)

# Fazer previsões de probabilidades
y_prob = model.predict_proba(X_test)

# 'y_prob' agora contém as probabilidades das classes (0 e 1) para cada entrada nos dados de teste
# y_prob[:, 1] contém a probabilidade da classe positiva (inadimplência) para cada entrada

# Calcular a probabilidade média de inadimplência para todo o conjunto de teste
probabilidade_media_inadimplencia = y_prob[:, 1].mean()
print(f'Probabilidade Média de Inadimplência para o Conjunto de Teste: {probabilidade_media_inadimplencia * 100:.2f}%')


Probabilidade Média de Inadimplência para o Conjunto de Teste: 15.44%


In [10]:
import pandas as pd

# Criar um DataFrame para o novo cliente
user_ad = pd.DataFrame({
    'idade': [35],
    'sexo': ['M'],
    'dependentes': [2],
    'escolaridade': ['ensino medio'],
    'estado_civil': ['casado'],
    'salario_anual': ['$60K - $80K'],
    'tipo_cartao': ['blue'],
    'meses_de_relacionamento': [30],
    'qtd_produtos': [4],
    'iteracoes_12m': [2],
    'meses_inativo_12m': [1],
    'limite_credito': [10000],
    'valor_transacoes_12m': [5000],
    'qtd_transacoes_12m': [20]
})

user_inad = pd.DataFrame({
    'idade': [43],
    'sexo': ['F'],
    'dependentes': [2],
    'escolaridade': ['mestrado'],
    'estado_civil': ['casado'],
    'salario_anual': ['menos que $40K'],
    'tipo_cartao': ['silver'],
    'meses_de_relacionamento': [25],
    'qtd_produtos': [6],
    'iteracoes_12m': [4],
    'meses_inativo_12m': [2],
    'limite_credito': [10388.80],
    'valor_transacoes_12m': [10294.96],
    'qtd_transacoes_12m': [61]
})



# Certifique-se de que as colunas correspondam às do seu conjunto de dados original

# Fazer previsão para o novo cliente
new_prediction = model.predict(new_data_ad)

# A variável 'new_prediction' agora conterá a previsão de inadimplência para o novo cliente (0 para adimplente, 1 para inadimplente)
print(f'Previsão de Inadimplência: {new_prediction[0]}')

Previsão de Inadimplência: 0


In [6]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, OneHotEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline  # Importe o Pipeline aqui

# Carregar os dados
data = pd.read_csv('base_clientes.csv')
data = data.drop('meses_de_relacionamento', axis=1)
data = data.drop('qtd_produtos', axis=1)
data = data.drop('iteracoes_12m', axis=1)
data = data.drop('meses_inativo_12m', axis=1)
data = data.drop('valor_transacoes_12m', axis=1)
data = data.drop('qtd_transacoes_12m', axis=1)
# data = data.drop('tipo_cartao', axis=1)


# Dividir os dados em treinamento e teste
X = data.drop('default', axis=1)
y = data['default']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Definir colunas categóricas e numéricas (como mencionado anteriormente)

categorical_cols = [
    'sexo', 
    'escolaridade', 
    'estado_civil', 
    'salario_anual', 
    'tipo_cartao'
]
numeric_cols = [
    'idade', 
    'dependentes', 
    # 'meses_de_relacionamento', 
    # 'qtd_produtos', 
    # 'iteracoes_12m',
    # 'meses_inativo_12m', 
    # 'limite_credito', 
    # 'valor_transacoes_12m', 
    # 'qtd_transacoes_12m'
]

# Definir transformadores para colunas categóricas e numéricas
categorical_transformer = Pipeline(steps=[
    ('onehot', OneHotEncoder(handle_unknown='ignore'))
])

numeric_transformer = Pipeline(steps=[
    ('scaler', StandardScaler())
])

# Combina os transformadores
preprocessor = ColumnTransformer(
    transformers=[
        ('num', numeric_transformer, numeric_cols),
        ('cat', categorical_transformer, categorical_cols)
    ])

# Definir o pipeline completo com pré-processamento e modelo
model = Pipeline(steps=[('preprocessor', preprocessor),
                        ('classifier', RandomForestClassifier(n_estimators=100, random_state=42))
                        ])

# Treinar o modelo
model.fit(X_train, y_train)

user_ad = pd.DataFrame({
    'idade': [35],
    'sexo': ['M'],
    'dependentes': [2],
    'escolaridade': ['ensino medio'],
    'estado_civil': ['casado'],
    'salario_anual': ['$60K - $80K'],
    'tipo_cartao': ['blue'],
    # 'meses_de_relacionamento': [30],
    # 'qtd_produtos': [4],
    # 'iteracoes_12m': [2],
    # 'meses_inativo_12m': [1],
    # 'limite_credito': [10000],
    # 'valor_transacoes_12m': [5000],
    # 'qtd_transacoes_12m': [20]
})

user_inad = pd.DataFrame({
    'idade': [43],
    'sexo': ['F'],
    'dependentes': [2],
    'escolaridade': ['mestrado'],
    'estado_civil': ['casado'],
    'salario_anual': ['menos que $40K'],
    'tipo_cartao': ['silver'],
    # 'meses_de_relacionamento': [25],
    # 'qtd_produtos': [6],
    # 'iteracoes_12m': [4],
    # 'meses_inativo_12m': [2],
    # 'limite_credito': [10388.80],
    # 'valor_transacoes_12m': [10294.96],
    # 'qtd_transacoes_12m': [61]
})



# Certifique-se de que as colunas correspondam às do seu conjunto de dados original

# Fazer previsão para o novo cliente
new_prediction_ad = model.predict(user_ad)
new_prediction_inad = model.predict(user_inad)

# A variável 'new_prediction' agora conterá a previsão de inadimplência para o novo cliente (0 para adimplente, 1 para inadimplente)
print(f'Previsão de adimplente 0: {new_prediction_ad[0]}')
print(f'Previsão de inadimplente 1: {new_prediction_inad[0]}')



Previsão de adimplente 0: 0
Previsão de inadimplente 1: 1


In [4]:
from flask import Flask, request, render_template

app = Flask(__name__)

@app.route('/predict', methods=['POST'])
def predict():
    # Receba os dados do formulário
    idade = int(request.form['idade'])
    # Aqui você pode pegar os valores dos outros campos do formulário também

    # Faça previsões com base nos dados
    # Substitua isso pelo código real para fazer previsões com seu modelo

    resultado = "Aqui vem o resultado da previsão."

    return render_template('resultado.html', resultado=resultado)

if __name__ == '__main__':
    app.run(debug=True)

 * Serving Flask app '__main__'
 * Debug mode: on


 * Running on http://127.0.0.1:5000
Press CTRL+C to quit
 * Restarting with stat


SystemExit: 1

  warn("To exit: use 'exit', 'quit', or Ctrl-D.", stacklevel=1)
