# <font color='blue'>Python para Ciência de Dados</font>
# <font color='blue'>Capítulo 13</font>


In [1]:
# Versão da Linguagem Python
from platform import python_version
print('Versão da Linguagem Python usada neste Jupyter Notebook:', python_version())

Versão da Linguagem Python usada neste Jupyter Notebook: 3.10.12


# Introdução Machine Learning

## Regressão

### Regressão Linear Simples

In [1]:
from sklearn.linear_model import LinearRegression

# Dados de exemplo
X = [[1], [2], [3], [4], [5]]
y = [2, 4, 5, 4, 5]

# Criar e treinar o modelo
modelo = LinearRegression()
modelo.fit(X, y)

# Prever novos valores
novos_valores = [[6], [7]]
predicoes = modelo.predict(novos_valores)
print(predicoes)

[5.8 6.4]


### Regressão Linear Múltipla

In [2]:
# Dados de exemplo
X = [[1, 2], [2, 3], [3, 4], [4, 5], [5, 6]]
y = [2, 4, 5, 4, 5]

# Criar e treinar o modelo
modelo = LinearRegression()
modelo.fit(X, y)

# Prever novos valores
novos_valores = [[6, 7], [7, 8]]
predicoes = modelo.predict(novos_valores)
print(predicoes)

[5.8 6.4]


### Regressão Ridge

In [3]:
from sklearn.linear_model import Ridge

# Dados de exemplo
X = [[1], [2], [3], [4], [5]]
y = [2, 4, 5, 4, 5]

# Criar e treinar o modelo
modelo = Ridge(alpha=0.1) # Alpha é o parâmetro de regularização
modelo.fit(X, y)

# Prever novos valores
novos_valores = [[6], [7]]
predicoes = modelo.predict(novos_valores)
print(predicoes)


[5.78217822 6.37623762]


### Regressão Lasso

In [4]:
from sklearn.linear_model import Lasso

# Dados de exemplo
X = [[1], [2], [3], [4], [5]]
y = [2, 4, 5, 4, 5]

# Criar e treinar o modelo
modelo = Lasso(alpha=0.1) # Alpha é o parâmetro de regularização
modelo.fit(X, y)

# Prever novos valores
novos_valores = [[6], [7]]
predicoes = modelo.predict(novos_valores)
print(predicoes)


[5.65 6.2 ]


## Classificação

### Naive Bayes

In [20]:
from sklearn.naive_bayes import GaussianNB
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregar conjunto de dados de exemplo
iris = load_iris()
X = iris.data
y = iris.target

# Dividir dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# Criar e treinar o modelo
modelo = GaussianNB()
modelo.fit(X_train, y_train)

# Fazer previsões
predicoes = modelo.predict(X_test)

# Avaliar a precisão do modelo
precisao = accuracy_score(y_test, predicoes)
print("Precisão:", precisao)

Precisão: 0.9666666666666667


In [None]:
### Árvores de Decisão

In [26]:
from sklearn.tree import DecisionTreeClassifier

# Criar e treinar o modelo
modelo = DecisionTreeClassifier()

modelo.fit(X_train, y_train)

# Fazer previsões
predicoes = modelo.predict(X_test)

# Avaliar a precisão do modelo
precisao = accuracy_score(y_test, predicoes)
print("Precisão:", precisao)

Precisão: 1.0


### Random Forest

In [27]:
from sklearn.ensemble import RandomForestClassifier

# Criar e treinar o modelo
modelo = RandomForestClassifier()
modelo.fit(X_train, y_train)

# Fazer previsões
predicoes = modelo.predict(X_test)

# Avaliar a precisão do modelo
precisao = accuracy_score(y_test, predicoes)
print("Precisão:", precisao)

Precisão: 0.9666666666666667


### Gradient Boosting

In [34]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.ensemble import GradientBoostingClassifier

# Carregar o conjunto de dados
iris = load_iris()
X = iris.data
y = iris.target

# Dividir o conjunto de dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar e treinar o modelo Gradient Boosting
modelo = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, max_depth=3, random_state=42)
modelo.fit(X_train, y_train)

# Fazer previsões
previsoes = modelo.predict(X_test)

# Calcular a precisão do modelo
precisao = accuracy_score(y_test, previsoes)
print("Precisão:", precisao)

Precisão: 1.0


### XGBoost (Extreme Gradient Boosting) 

In [36]:
# Instalando a biblioteca xgboost
#!pip install xgboost

Defaulting to user installation because normal site-packages is not writeable
Collecting xgboost
  Downloading xgboost-2.0.3-py3-none-manylinux2014_x86_64.whl (297.1 MB)
[2K     [38;2;114;156;31m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m297.1/297.1 MB[0m [31m2.1 MB/s[0m eta [36m0:00:00[0mm eta [36m0:00:01[0m[36m0:00:01[0m
Installing collected packages: xgboost
Successfully installed xgboost-2.0.3

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip available: [0m[31;49m22.3.1[0m[39;49m -> [0m[32;49m24.0[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49m/usr/bin/python3 -m pip install --upgrade pip[0m


In [37]:
import xgboost as xgb
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregar o conjunto de dados
iris = load_iris()
X = iris.data
y = iris.target

# Dividir o conjunto de dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar o objeto DMatrix (necessário para o XGBoost)
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# Definir os parâmetros do modelo
parametros = {
 'max_depth': 3, # Profundidade máxima da árvore
 'eta': 0.3, # Taxa de aprendizado
 'objective': 'multi:softmax', # Função de perda para problemas de classificação multiclasse
 'num_class': 3 # Número de classes no conjunto de dados
}

# Treinar o modelo
num_round = 100
modelo = xgb.train(parametros, dtrain, num_round)

# Fazer previsões
previsoes = modelo.predict(dtest)

# Calcular a precisão do modelo
precisao = accuracy_score(y_test, previsoes)
print("Precisão:", precisao)

Precisão: 1.0


### Support Vector Machine (SVM)

In [38]:
from sklearn.svm import SVC

# Criar e treinar o modelo
modelo = SVC()
modelo.fit(X_train, y_train)

# Fazer previsões
predicoes = modelo.predict(X_test)

# Avaliar a precisão do modelo
precisao = accuracy_score(y_test, predicoes)
print("Precisão:", precisao)

Precisão: 1.0


### K-Nearest Neighbors (KNN)

In [39]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# Carregar o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividir os dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Criar e treinar o modelo KNN
modelo = KNeighborsClassifier(n_neighbors=5)  # k=5 (por exemplo)
modelo.fit(X_train, y_train)

# Fazer previsões
previsoes = modelo.predict(X_test)

# Calcular a precisão do modelo
precisao = accuracy_score(y_test, previsoes)
print("Precisão:", precisao)

Precisão: 1.0


### Rede Neural Artificial (ANN)

In [40]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Carregar o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

# Dividir os dados em conjunto de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Pré-processamento dos dados: normalização
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Criar e treinar o modelo de rede neural
modelo = MLPClassifier(hidden_layer_sizes=(10, 5), activation='relu', max_iter=1000, random_state=42)
modelo.fit(X_train_scaled, y_train)

# Fazer previsões
previsoes = modelo.predict(X_test_scaled)

# Calcular a precisão do modelo
precisao = accuracy_score(y_test, previsoes)
print("Precisão:", precisao)


Precisão: 1.0


## Fim