# Usando Scikit-learn

### *`Scikit-learn`* é uma biblioteca popular de aprendizado de máquina em Python.

### 1. Carregando um conjunto de dados

#### Antes de começar com o aprendizado de máquina, precisamos carregar os dados:

In [1]:
# Importando o conjunto de dados Iris
from sklearn.datasets import load_iris

# Carregando o conjunto de dados Iris
iris = load_iris()

# Exibindo os dados
print(iris.data[:10])

[[5.1 3.5 1.4 0.2]
 [4.9 3.  1.4 0.2]
 [4.7 3.2 1.3 0.2]
 [4.6 3.1 1.5 0.2]
 [5.  3.6 1.4 0.2]
 [5.4 3.9 1.7 0.4]
 [4.6 3.4 1.4 0.3]
 [5.  3.4 1.5 0.2]
 [4.4 2.9 1.4 0.2]
 [4.9 3.1 1.5 0.1]]


### 2. Dividindo os dados

#### Depois de carregar o conjunto de dados, é necessário dividir os dados em dois conjuntos separados de treinamento e teste. O conjunto de treinamento é usado para ajustar o modelo e o conjunto de teste é usado para avaliar o modelo.

In [2]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42)

# Exibindo o número de amostras no conjunto de treinamento e teste
print("Número de amostras no conjunto de treinamento: ", X_train.shape[0])
print("Número de amostras no conjunto de teste: ", X_test.shape[0])

Número de amostras no conjunto de treinamento:  105
Número de amostras no conjunto de teste:  45


### 3. Treinando um modelo

#### Depois de dividir o conjunto de dados, é hora de treinar o modelo. Scikit-learn oferece vários algoritmos que podem ser usados para treinar o modelo.

In [3]:
from sklearn.tree import DecisionTreeClassifier

# Criando o modelo Decision Tree
clf = DecisionTreeClassifier()

# Treinando o modelo usando o conjunto de treinamento
clf.fit(X_train, y_train)

DecisionTreeClassifier()

### 4. Fazendo previsões

#### Depois de treinar o modelo, podemos fazer previsões no conjunto de teste. Podemos usar a função "predict" do modelo treinado para fazer previsões.

In [4]:
# Fazendo previsões no conjunto de teste
y_pred = clf.predict(X_test)

# Exibindo as previsões
print("Previsões:", y_pred)

# Exibindo os dados esperados de teste
print("Esperado:", y_test)

Previsões: [1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0 0 0 1 0 0 2 1
 0 0 0 2 1 1 0 0]
Esperado: [1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0 0 0 1 0 0 2 1
 0 0 0 2 1 1 0 0]


### 5. Avaliando o modelo

#### Após fazer as previsões, é hora de avaliar o modelo. Scikit-learn oferece várias métricas de avaliação que podem ser usadas para avaliar o desempenho do modelo.

In [5]:
from sklearn.metrics import accuracy_score

# Avaliando a precisão do modelo
accuracy = accuracy_score(y_test, y_pred)

# Exibindo a precisão do modelo
print("Precisão do modelo: ", accuracy)

Precisão do modelo:  1.0
