In [2]:
# Importando bibliotecas
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression, LinearRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.cluster import KMeans
from sklearn.metrics import accuracy_score, mean_squared_error, mean_absolute_error
import matplotlib.pyplot as plt
import numpy as np

In [None]:
## SUPERVISIONADO

import numpy as np

# Exemplo simples: tamanho da casa (m²) vs preço
X = np.array([[50],[70],[100],[120]]) #area
y = np.array([150000, 200000, 300000, 350000]) #valor

modelo = LinearRegression().fit(X, y)

previsao = modelo.predict([[80]])[0]
print(f"Preço previsto para 80m²: {previsao:.2f}")


In [None]:
## NÃO SUPERVISIONADO

from sklearn.cluster import KMeans
import numpy as np
#             a=idade, b=gasto mensal
X = np.array([[20,200],[21,220],[23,250],[41,200],[40,300],[43,310]])
kmeans = KMeans(n_clusters=2, random_state=42).fit(X)
print("Grupos:", kmeans.labels_)


In [None]:
## NÃO SUPERVISIONADO

import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
import numpy as np

# Dados
X = np.array([[1,2],[1,4],[1,0],[10,2],[10,4],[10,0]])

# KMeans com 2 grupos
kmeans = KMeans(n_clusters=2, random_state=42)
kmeans.fit(X)

# Resultados
labels = kmeans.labels_
centros = kmeans.cluster_centers_

print("Grupos:", labels)
print("Centros dos clusters:\n", centros)

# Visualização
plt.scatter(X[:,0], X[:,1], c=labels, cmap="viridis", s=100)
plt.scatter(centros[:,0], centros[:,1], c="red", marker="X", s=200)
plt.xlabel("Eixo X")
plt.ylabel("Eixo Y")
plt.title("KMeans - Agrupamento em 2 clusters")
plt.show()


In [46]:
import random

# O agente tenta adivinhar um número "correto"
meta = 3
for tentativa in range(5):
    acao = random.randint(1,5)
    recompensa = 1 if acao == meta else -1
    print(f"Ação: {acao}, Recompensa: {recompensa}")


Ação: 3, Recompensa: 1
Ação: 4, Recompensa: -1
Ação: 1, Recompensa: -1
Ação: 4, Recompensa: -1
Ação: 4, Recompensa: -1


In [None]:
from sklearn.datasets import load_iris
import pandas as pd

# Carregando dataset Iris
iris = load_iris(as_frame=True)
df = iris.frame

# Visualizando primeiras linhas
df.head()


In [None]:
# Separando features e target
X = df.drop(columns='target')  # entradas
y = df['target']               # saída conhecida

# Dividindo treino/teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Treinando modelo de classificação supervisionado
clf = DecisionTreeClassifier(random_state=42)
clf.fit(X_train, y_train)

# Fazendo previsões
y_pred = clf.predict(X_test)

# Métrica de erro: acurácia
acc = accuracy_score(y_test, y_pred)
print(f"Acurácia Teste: {acc:.2f}")


In [None]:
# Usando KMeans para agrupar flores em 3 clusters
kmeans = KMeans(n_clusters=3, random_state=42)
kmeans.fit(X)

# Adicionando labels dos clusters ao DataFrame
df['cluster'] = kmeans.labels_

# Visualizando clusters x espécies reais
print(df.groupby(['target','cluster']).size())

# Plot 2D para visualizar clusters (usando apenas 2 features)
plt.scatter(df['petal length (cm)'], df['petal width (cm)'], c=df['cluster'], cmap='viridis')
plt.xlabel('Petal Length')
plt.ylabel('Petal Width')
plt.title('Clusters Iris (não supervisionado)')
plt.show()


In [None]:
# Previsões de treino e teste
y_train_pred = clf.predict(X_train)
y_test_pred = clf.predict(X_test)

# Métricas
train_acc = accuracy_score(y_train, y_train_pred)
test_acc = accuracy_score(y_test, y_test_pred)

print(f"Acurácia Treino: {train_acc:.2f}")
print(f"Acurácia Teste: {test_acc:.2f}")


In [None]:
# Árvore muito profunda → overfitting
clf_deep = DecisionTreeClassifier(max_depth=10, random_state=42)
clf_deep.fit(X_train, y_train)

y_train_pred_deep = clf_deep.predict(X_train)
y_test_pred_deep = clf_deep.predict(X_test)

print("Árvore profunda (overfit)")
print(f"Acurácia Treino: {accuracy_score(y_train, y_train_pred_deep):.2f}")
print(f"Acurácia Teste: {accuracy_score(y_test, y_test_pred_deep):.2f}")


In [None]:
# Regressão simples: prever petal length usando petal width
X_reg = df[['petal width (cm)']]
y_reg = df['petal length (cm)']

X_train_r, X_test_r, y_train_r, y_test_r = train_test_split(X_reg, y_reg, test_size=0.3, random_state=42)
reg = LinearRegression()
reg.fit(X_train_r, y_train_r)
y_pred_r = reg.predict(X_test_r)

# Certificando que são arrays NumPy
y_test_r_array = np.array(y_test_r)
y_pred_r_array = np.array(y_pred_r)

mae = mean_absolute_error(y_test_r_array, y_pred_r_array)
mse = mean_squared_error(y_test_r_array, y_pred_r_array)
rmse = np.sqrt(mse)

print(f"MAE: {mae:.2f}, MSE: {mse:.2f}, RMSE: {rmse:.2f}")


# Métricas de erro
mse = mean_squared_error(y_test_r, y_pred_r)
mae = mean_absolute_error(y_test_r, y_pred_r)
rmse = np.sqrt(mse)

print(f"MSE: {mse:.2f}, MAE: {mae:.2f}, RMSE: {rmse:.2f}")
