Aqui está um código simples com sklearn para testar a execução de Python no Codespace com uma Decision Tree:

In [3]:
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import xgboost as xgb

# Carregar o conjunto de dados MNIST
digits = load_digits()

# Separar os dados em características (X) e rótulos (y)
X, y = digits.data, digits.target

# Dividir o conjunto de dados em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Dividir o conjunto de treinamento em treinamento e validação
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=42)

# Configuração dos hiperparâmetros do modelo XGBoost
params = {
    'objective': 'multi:softmax',
    'num_class': 10,
    'eta': 0.1,
    'max_depth': 6,
    'subsample': 0.8,
    'colsample_bytree': 0.8,
    'eval_metric': 'merror'
}

# Criar DMatrix para treinamento e validação
dtrain = xgb.DMatrix(X_train, label=y_train)
dval = xgb.DMatrix(X_val, label=y_val)
dtest = xgb.DMatrix(X_test, label=y_test)

# Treinamento do modelo
evallist = [(dtrain, 'train'), (dval, 'eval')]
num_round = 50
bst = xgb.train(params, dtrain, num_round, evallist, early_stopping_rounds=10)

# Fazer previsões no conjunto de teste
y_pred = bst.predict(dtest)

# Avaliar a acurácia do modelo
accuracy = accuracy_score(y_test, y_pred)
print(f'Acurácia no conjunto de teste: {accuracy * 100:.2f}%')



[0]	train-merror:0.05135	eval-merror:0.15625
[1]	train-merror:0.02611	eval-merror:0.12153
[2]	train-merror:0.01828	eval-merror:0.10764
[3]	train-merror:0.01044	eval-merror:0.06944
[4]	train-merror:0.00870	eval-merror:0.05208
[5]	train-merror:0.00783	eval-merror:0.05556
[6]	train-merror:0.00609	eval-merror:0.05208
[7]	train-merror:0.00696	eval-merror:0.03819
[8]	train-merror:0.00522	eval-merror:0.04167
[9]	train-merror:0.00522	eval-merror:0.04861
[10]	train-merror:0.00522	eval-merror:0.04514
[11]	train-merror:0.00435	eval-merror:0.04167
[12]	train-merror:0.00435	eval-merror:0.04167
[13]	train-merror:0.00348	eval-merror:0.04167
[14]	train-merror:0.00261	eval-merror:0.04167
[15]	train-merror:0.00261	eval-merror:0.04167
[16]	train-merror:0.00261	eval-merror:0.04167
Acurácia no conjunto de teste: 95.56%




In [None]:
### Passo 1: Treinar um Modelo de Árvore de Decisão Simples

In [4]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# Treinar o modelo de árvore de decisão simples
decision_tree = DecisionTreeClassifier(random_state=42)
decision_tree.fit(X_train, y_train)

# Fazer previsões no conjunto de teste
y_pred_tree = decision_tree.predict(X_test)

# Avaliar a acurácia do modelo de árvore de decisão
accuracy_tree = accuracy_score(y_test, y_pred_tree)
print(f'Acurácia do modelo de árvore de decisão: {accuracy_tree * 100:.2f}%')


Acurácia do modelo de árvore de decisão: 87.50%


In [None]:
### Passo 2: Treinar Modelos Ensemble

In [5]:
from sklearn.ensemble import RandomForestClassifier

# Treinar o modelo Random Forest
random_forest = RandomForestClassifier(n_estimators=100, random_state=42)
random_forest.fit(X_train, y_train)

# Fazer previsões no conjunto de teste
y_pred_rf = random_forest.predict(X_test)

# Avaliar a acurácia do modelo Random Forest
accuracy_rf = accuracy_score(y_test, y_pred_rf)
print(f'Acurácia do modelo Random Forest: {accuracy_rf * 100:.2f}%')


Acurácia do modelo Random Forest: 96.67%


In [None]:
### XGBoost

In [6]:
import xgboost as xgb

# Configuração dos hiperparâmetros do modelo XGBoost
params = {
    'objective': 'multi:softmax',
    'num_class': 10,
    'eta': 0.1,
    'max_depth': 6,
    'subsample': 0.8,
    'colsample_bytree': 0.8,
    'eval_metric': 'merror'
}

# Criar DMatrix para treinamento e teste
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# Treinamento do modelo XGBoost
num_round = 50
bst = xgb.train(params, dtrain, num_round)

# Fazer previsões no conjunto de teste
y_pred_xgb = bst.predict(dtest)

# Avaliar a acurácia do modelo XGBoost
accuracy_xgb = accuracy_score(y_test, y_pred_xgb)
print(f'Acurácia do modelo XGBoost: {accuracy_xgb * 100:.2f}%')


Acurácia do modelo XGBoost: 96.39%
