In [None]:
# 📊 ATIVIDADE PRÁTICA DE MACHINE LEARNING PARA INICIANTES
# Tema: Prevendo Salários com Regressão Linear Simples
# Base de dados: salarios_experiencia.csv

# -------------------------------------
# 1. Importar bibliotecas
# -------------------------------------
import pandas as pd  # Biblioteca para manipulação de dados em formato de tabelas (DataFrames)
import numpy as np  # Biblioteca para cálculos numéricos
import matplotlib.pyplot as plt  # Biblioteca para criação de gráficos
from sklearn.linear_model import LinearRegression  # Importa o modelo de regressão linear
from sklearn.model_selection import train_test_split  # Função para dividir dados em treino e teste
from sklearn.metrics import mean_squared_error, r2_score  # Funções para avaliar o modelo


In [None]:
# -------------------------------------
# 2. Carregar os dados
# -------------------------------------
df = pd.read_csv("salarios_experiencia.csv")  # Lê o arquivo CSV e armazena em um DataFrame
df.head()  # Mostra as 5 primeiras linhas da tabela

In [None]:
# -------------------------------------
# 3. Separar os dados em X e y
# -------------------------------------
X = df[["Experiencia"]]  # Seleciona a coluna 'Experiencia' como entrada (precisa ser 2D)
y = df["Salario"]  # Seleciona a coluna 'Salario' como saída

In [None]:
# -------------------------------------
# 4. Dividir os dados em treino e teste
# -------------------------------------
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [None]:
# -------------------------------------
# 5. Criar e treinar o modelo
# -------------------------------------
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [None]:
# -------------------------------------
# 6. Fazer previsões
# -------------------------------------
y_pred = modelo.predict(X_test)

In [None]:
# -------------------------------------
# 7. Avaliar o modelo
# -------------------------------------
mse = mean_squared_error(y_test, y_pred)
rmse = np.sqrt(mse)
r2 = r2_score(y_test, y_pred)

print(f"\nErro médio quadrático (MSE): {mse:.2f}")
print(f"Raiz do erro médio quadrático (RMSE): {rmse:.2f}")
print(f"Coeficiente de determinação (R²): {r2:.2f}")

In [None]:
# -------------------------------------
# 8. Fazer previsão para um novo valor
# -------------------------------------
experiencia_teste = [[6.5]]
salario_previsto = modelo.predict(experiencia_teste)
print(f"\nPara 6.5 anos de experiência, o salário previsto é: R${salario_previsto[0]:.2f}")

In [None]:
# -------------------------------------
# 9. Visualizar a reta de regressão
# -------------------------------------
plt.figure(figsize=(8, 5))
plt.scatter(X, y, color="blue", label="Dados reais")
plt.plot(X, modelo.predict(X), color="red", label="Reta de regressão")
plt.xlabel("Anos de Experiência")
plt.ylabel("Salário (R$)")
plt.title("Regressão Linear Simples")
plt.legend()
plt.grid(True)
plt.show()