In [None]:
## Exercício 1 - Dataset Digits do sklearn

# Acesso: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_digits.html#sklearn.datasets.load_digits

# 1) Importar o pacote "sklearn.datasets" e o "load_digits"
from sklearn.datasets import load_digits
# 2) Carregar o dataset através do método: load_digits()
digits = load_digits()
# 3) Observe as keys do dataset usando o método "keys"
print(digits.keys())
# 4) A chave "data" são as features e a chave "target" é o y. Separe os dados em 2 variáveis diferentes
data = digits.data
target = digits.target
# 5) Verificar a dimensionalidade das features através da variável shape
shape = data.shape
print(shape)
# 6) Separe o conjunto de dados em treinamento e teste usando o método: "train_test_split"
from sklearn.model_selection import train_test_split
train_x, test_x, train_y, test_y = train_test_split(data, target, test_size=0.2)
# 7) Treinar MLP (2 topologias diferentes)
from sklearn.neural_network import MLPClassifier
mlp1 = MLPClassifier(hidden_layer_sizes=(100, 50), max_iter=1000)
mlp1.fit(train_x, train_y)
mlp2 = MLPClassifier(hidden_layer_sizes=(100, 100), max_iter=1000)
mlp2.fit(train_x, train_y)
# 8) Treinar Árvore de Decisão (com Entropia e Gini)
from sklearn.tree import DecisionTreeClassifier
tree1 = DecisionTreeClassifier(criterion='entropy')
tree1.fit(train_x, train_y)
tree2 = DecisionTreeClassifier(criterion='gini')
tree2.fit(train_x, train_y)
# 9) Treinar Árvore de Decisão com max_depth = 2
tree3 = DecisionTreeClassifier(criterion='entropy', max_depth=2)
tree3.fit(train_x, train_y)
# 10) Treinar KNN (com duas características diferentes)
from sklearn.neighbors import KNeighborsClassifier
knn1 = KNeighborsClassifier(n_neighbors=3)
knn1.fit(train_x, train_y)
# 11) Mostrar a taxa de acerto de todos os modelos
from sklearn.metrics import accuracy_score
print("Acurácia MLP1: %.2f" % accuracy_score(test_y, mlp1.predict(test_x)))
print("Acurácia MLP2: %.2f" % accuracy_score(test_y, mlp2.predict(test_x)))
print("Acurácia Árvore1: %.2f" % accuracy_score(test_y, tree1.predict(test_x)))
print("Acurácia Árvore2: %.2f" % accuracy_score(test_y, tree2.predict(test_x)))
print("Acurácia Árvore3: %.2f" % accuracy_score(test_y, tree3.predict(test_x)))
print("Acurácia KNN1: %.2f" % accuracy_score(test_y, knn1.predict(test_x)))

dict_keys(['data', 'target', 'frame', 'feature_names', 'target_names', 'images', 'DESCR'])
(1797, 64)
Acurácia MLP1: 0.97
Acurácia MLP2: 0.98
Acurácia Árvore1: 0.89
Acurácia Árvore2: 0.88
Acurácia Árvore3: 0.34
Acurácia KNN1: 0.98


In [None]:
## Exercício 2 - Dataset Diabetes do sklearn (Base de Dados de Regressão)

# Acesso: https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_diabetes.html#sklearn.datasets.load_diabetes

# 1) Importar o pacote "sklearn.datasets" e o "load_diabetes"
from sklearn.datasets import load_diabetes
# 2) Carregar o dataset através do método: load_diabetes()
diabetes = load_diabetes()
# 3) Observe as keys do dataset usando o método "keys"
print(diabetes.keys())
# 4) A chave "data" são as features e a chave "target" é o y. Separe os dados em 2 variáveis diferentes
data = diabetes.data
target = diabetes.target
# 5) Verificar a dimensionalidade das features através da variável shape
shape = data.shape
print(shape)
# 6) Separe o conjunto de dados em treinamento e teste usando o método: "train_test_split"
from sklearn.model_selection import train_test_split
train_x, test_x, train_y, test_y = train_test_split(data, target, test_size=0.2)
# 7) Treinar MLP (2 topologias diferentes) - MLPRegressor()
from sklearn.neural_network import MLPRegressor
mlp1 = MLPRegressor(hidden_layer_sizes=(10, 5), max_iter=10)
mlp1.fit(train_x, train_y)
# 8) Treinar Árvore de Decisão - DecisionTreeRegressor()
from sklearn.tree import DecisionTreeRegressor
tree1 = DecisionTreeRegressor()
tree1.fit(train_x, train_y)
# 9) Treinar Árvore de Decisão com max_depth = 2 - DecisionTreeRegressor()
tree2 = DecisionTreeRegressor(max_depth=2)
tree2.fit(train_x, train_y)
# 10) Treinar KNN (com duas características diferentes) - KNeighborsRegressor()
from sklearn.neighbors import KNeighborsRegressor
knn1 = KNeighborsRegressor(n_neighbors=3)
knn1.fit(train_x, train_y)
# 11) Treinar o modelo de Regressão Linear - LinearRegression()
from sklearn.linear_model import LinearRegression
lr = LinearRegression()
lr.fit(train_x, train_y)
# 12) Usar o MSE (Mean Squared Error) pra avaliar os modelos:
from sklearn.metrics import mean_squared_error
print("MSE MLP1: %.2f" % mean_squared_error(test_y, mlp1.predict(test_x)))
print("MSE Árvore1: %.2f" % mean_squared_error(test_y, tree1.predict(test_x)))
print("MSE Árvore2: %.2f" % mean_squared_error(test_y, tree2.predict(test_x)))
print("MSE KNN1: %.2f" % mean_squared_error(test_y, knn1.predict(test_x)))
print("MSE LR: %.2f" % mean_squared_error(test_y, lr.predict(test_x)))
# Exemplo: print("MSE: %.2f" % mean_squared_error(teste_y, prediction))

dict_keys(['data', 'target', 'frame', 'DESCR', 'feature_names', 'data_filename', 'target_filename', 'data_module'])
(442, 10)
MSE MLP1: 28787.40
MSE Árvore1: 4886.28
MSE Árvore2: 3500.25
MSE KNN1: 3101.21
MSE LR: 2484.86


