Aqui está um código simples com sklearn para testar a execução de Python no Codespace com uma Decision Tree:

In [1]:
import numpy as np
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split

# Carregar o dataset Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividir o dataset em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar uma Decision Tree
clf = DecisionTreeClassifier(random_state=42)

# Treinar a Decision Tree
clf.fit(X_train, y_train)

# Prever as classes para o conjunto de teste
y_pred = clf.predict(X_test)

# Imprimir a precisão da Decision Tree
print("Precisão:", clf.score(X_test, y_test))

Precisão: 1.0


In [2]:

import numpy as np
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split

# Carregar o dataset MNIST
digits = load_digits(n_class=10)
X = digits.data
y = digits.target

# Dividir o dataset em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=30)

# Criar uma Decision Tree
clf = DecisionTreeClassifier(random_state=30)

# Treinar a Decision Tree
clf.fit(X_train, y_train)

# Prever as classes para o conjunto de teste
y_pred = clf.predict(X_test)

# Imprimir a precisão da Decision Tree
print("Precisão:", clf.score(X_test, y_test))

Precisão: 0.8555555555555555


In [4]:
import numpy as np
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split

# Carregar o dataset Digits
digits = load_digits(n_class=10)
X = digits.data
y = digits.target

# Dividir o dataset em treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=30)

# Criar uma Decision Tree com parâmetros personalizados
clf = DecisionTreeClassifier(
    max_depth=12,              # Tente aumentar ou diminuir
    min_samples_split=40,      # Aumente para evitar overfitting
    min_samples_leaf=10,       # Aumente para garantir generalização
    max_features=None,         # Pode tentar valores como 'sqrt' ou um número fixo
    random_state=30
)

# Treinar a Decision Tree
clf.fit(X_train, y_train)

# Prever as classes para o conjunto de teste
y_pred = clf.predict(X_test)

# Imprimir a precisão da Decision Tree
print("Precisão ajustada:", clf.score(X_test, y_test))


from sklearn.model_selection import GridSearchCV

# Definindo o espaço de parâmetros para testar
param_grid = {
    'max_depth': [None, 10, 20, 30],
    'min_samples_split': [2, 20, 40],
    'min_samples_leaf': [1, 5, 10],
    'max_features': [None, 'sqrt', 'log2']
}

# Criando o GridSearchCV para encontrar os melhores parâmetros
grid_search = GridSearchCV(DecisionTreeClassifier(random_state=30), param_grid, cv=5, scoring='accuracy')
grid_search.fit(X_train, y_train)

# Melhores parâmetros encontrados
print("Melhores parâmetros:", grid_search.best_params_)

# Treinando e avaliando o modelo com os melhores parâmetros
best_clf = grid_search.best_estimator_
print("Precisão ajustada com melhores parâmetros:", best_clf.score(X_test, y_test))

Precisão ajustada: 0.8138888888888889
Melhores parâmetros: {'max_depth': None, 'max_features': None, 'min_samples_leaf': 1, 'min_samples_split': 2}
Precisão ajustada com melhores parâmetros: 0.8555555555555555


In [5]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split

# Carregar o dataset
digits = load_digits()
X = digits.data
y = digits.target

# Dividir o dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=30)

# Criar o modelo RandomForest
random_forest_clf = RandomForestClassifier(n_estimators=100, random_state=30)

# Treinar o modelo
random_forest_clf.fit(X_train, y_train)

# Avaliar o modelo
accuracy_rf = random_forest_clf.score(X_test, y_test)
print("Precisão do RandomForest:", accuracy_rf)

Precisão do RandomForest: 0.9833333333333333


In [6]:
import xgboost as xgb
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregar o dataset
digits = load_digits()
X = digits.data
y = digits.target

# Dividir o dataset
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=30)

# Criar o modelo XGBoost
xgb_clf = xgb.XGBClassifier(use_label_encoder=False, eval_metric='mlogloss')

# Treinar o modelo
xgb_clf.fit(X_train, y_train)

# Prever as classes para o conjunto de teste
y_pred = xgb_clf.predict(X_test)

# Avaliar o modelo
accuracy_xgb = accuracy_score(y_test, y_pred)
print("Precisão do XGBoost:", accuracy_xgb)

Parameters: { "use_label_encoder" } are not used.



Precisão do XGBoost: 0.9722222222222222


In [4]:
!git add .

In [5]:
!git commit -m "Atualizacoes"

[main 0a0ac41] Atualizacoes
 1 file changed, 81 insertions(+), 1 deletion(-)


In [6]:
!git push

Enumerating objects: 7, done.
Counting objects: 100% (7/7), done.
Delta compression using up to 2 threads
Compressing objects: 100% (4/4), done.
Writing objects: 100% (4/4), 1.44 KiB | 1.44 MiB/s, done.
Total 4 (delta 1), reused 0 (delta 0), pack-reused 0 (from 0)
remote: Resolving deltas: 100% (1/1), completed with 1 local object.[K
To https://github.com/GodoyNat/mba-deeplearning-iad-006-2024-public
   fb8fbaf..0a0ac41  main -> main
