<h1 align='center'>Guia para aprendizagem supervisionada com scikit-learn<h1/>

Data Scientist Jr.: Karina Gonçalves Soares

Links de estudo:

* [Guide to Supervised learning with scikit-learn (Part 3)](https://medium.com/@Coursesteach/guide-to-supervised-learning-with-scikit-learn-part-3-c31b01c547f9)

### Classificação usando Scikit-Learn

**Introdução:**

Scikit-Learn é uma biblioteca popular de aprendizado de máquina em Python que fornece uma variedade de algoritmos de classificação. Para usar o Scikit-Learn para classificação, você pode seguir estas etapas:

1. Importe as bibliotecas necessárias.
2. Carregue os dados.
3. Divida os dados em um conjunto de treinamento e um conjunto de teste.
4. Escolha um algoritmo de classificação.
5. Treine o modelo no conjunto de treinamento.
6. Avalie o modelo no conjunto de teste.
7. Faça previsões sobre novos dados.

![image.png](attachment:image.png)

![image.png](attachment:image.png)

**1. Logistic regression / Regressão logística**

Descrição : A regressão logística é um algoritmo de aprendizado de máquina supervisionado que pode ser usado para tarefas de classificação. É um caso especial de regressão linear onde a variável alvo é categórica. A regressão logística prevê a probabilidade de um ponto de dados pertencer a uma classe específica

In [13]:
import warnings
warnings.filterwarnings("ignore")

In [16]:
import numpy as np 
import pandas as pd 
from sklearn.datasets import load_iris 

from sklearn.linear_model import LogisticRegression 

from sklearn.model_selection import train_test_split


# Carregue o conjunto de dados iris
iris = load_iris() 

# Divida os dados em um conjunto de treinamento e um conjunto de teste
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size= 0.25 ) 
clf = LogisticRegression(C= 1.0 , solver= 'lbfgs' , multi_class= 'ovr' ) 

# Treine o modelo no conjunto de treinamento
clf.fit(X_train, y_train)

# Avalie o modelo no conjunto de teste
score = clf.score(X_test, y_test) 
print ( "Accuracy:" , score) 

# Faça previsões sobre novos dados
X_new = np.array([[ 5.1 , 3.5 , 1.4 , 0.2 ]] ) 
previsão = clf.predict(X_new) 
print ( "Predição:" , previsão)

Accuracy: 0.9473684210526315
Predição: [0]


**2. Artificial neural networks / Redes neurais artificiais (ANN)**

Redes neurais podem ser usadas no Scikit-Learn usando a MLPClassifierclasse. Esta classe implementa um perceptron multicamadas (MLP), que é um tipo de rede neural artificial. Os MLPs podem ser usados ​​para tarefas de classificação e regressão.

In [20]:
from sklearn.neural_network import MLPClassifier

# Carregue o conjunto de dados da íris
iris = load_iris()

# Divida os dados em um conjunto de treinamento e um conjunto de teste
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size= 0.25 )

# Crie um modelo MLPClassifier
clf = MLPClassifier(hidden_layer_sizes=( 10 , 10 ), activation= 'relu' , solver= 'adam' , alpha=0.0001 , learning_rate= 'constant' )

# Treine o modelo no conjunto de treinamento
clf.fit(X_train, y_train)

# Avalie o modelo no conjunto de teste
score = clf.score(X_test, y_test) 
print ( "Accuracy:" , score )

# Faça previsões sobre novos dados
X_new = np.array([[ 5.1 , 3.5 , 1.4 , 0.2 ]]) 
previsão = clf.predict(X_new) 
print ( "Predição:" , previsão)

Accuracy: 0.9473684210526315
Predição: [0]


**3. Support Vector Machine / Máquina de vetores de suporte (SVM)**

máquinas de vetores de suporte (SVMs) podem ser usadas no Scikit-Learn usando a SVCclasse. Esta classe implementa um classificador de máquina de vetores de suporte, que é uma ferramenta poderosa para tarefas de classificação. SVMs podem ser usados ​​para classificação binária e multiclasse.

In [9]:
from sklearn.svm import SVC

# carregue o dataset iris
iris = load_iris()

# Divida os dados em um conjunto de treinamento e um conjunto de teste
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.25)

## Crie um modelo SVC
clf = SVC(kernel='linear', C=1.0, gamma='auto', decision_function_shape='ovr')

# Treine o modelo no conjunto de treinamento
clf.fit(X_train, y_train)

# Avalie o modelo no conjunto de teste
score = clf.score(X_test, y_test)
print("Accuracy:", score)


# Faça previsões sobre novos dados
X_new = np.array([[5.1, 3.5, 1.4, 0.2]])
prediction = clf.predict(X_new)
print("Prediction:", prediction)

Accuracy: 0.9473684210526315
Prediction: [0]


**4. Naive Bayes (NB)**

Naive Bayes é um algoritmo de aprendizado de máquina simples, mas poderoso, que pode ser usado para tarefas de classificação. É baseado no teorema de Bayes, que afirma que a probabilidade de um evento A ocorrer, dado que o evento B já ocorreu, é igual à probabilidade de o evento A ocorrer vezes a probabilidade de o evento B ocorrer, dado que o evento A já ocorreu. , dividido pela probabilidade de ocorrência do evento B.

In [21]:
from sklearn.naive_bayes import GaussianNB

# Divida os dados em um conjunto de treinamento e um conjunto de teste
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.25)

# Crie um classificador Naive Bayes
classifier = GaussianNB()

# Treine o modelo no classificador do conjunto de treinamento.
classifier. fit(X_train, y_train)

# Avalia o modelo no conjunto de teste
score = classifier.score(X_test, y_test)

print("Accuracy:", score)

# Faça previsões sobre novos dados
X_new = np.array([[5.1, 3.5, 1.4, 0.2]])
prediction = classifier.predict(X_new)
print("Prediction:", prediction)

Accuracy: 0.9210526315789473
Prediction: [0]


**5. KNN (K-Nearest Neighbors / K-vizinhos mais próximos)**

KNN (K-Nearest Neighbors) é um algoritmo simples de aprendizado de máquina supervisionado que pode ser usado para tarefas de classificação e regressão. Ele funciona encontrando os k exemplos de treinamento mais semelhantes a um novo ponto de dados e, em seguida, prevendo o rótulo do novo ponto de dados com base nos rótulos dos k vizinhos mais próximos.

In [22]:
from sklearn.neighbors import KNeighborsClassifier

# Divida os dados em um conjunto de treinamento e um conjunto de teste
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.25)

# Crie um classificador KNN
classifier = KNeighborsClassifier(n_neighbors=5)


# Treine o modelo no  classificador do conjunto de treinamento
classifier. fit(X_train, y_train)
# Avalia o modelo no conjunto de teste
score = classifier.score(X_test, y_test)

print("Accuracy:", score)


# Faça previsões sobre novos dados
X_new = np.array([[5.1, 3.5, 1.4, 0.2]])
prediction = classifier.predict(X_new)
print("Prediction:", prediction)

Accuracy: 1.0
Prediction: [0]
