In [1]:
import pandas as pd
from sklearn.linear_model import LinearRegression
import numpy as np

# 1. Carregar o arquivo
df = pd.read_csv('RankingT.csv')

# 2. Converter a coluna 'data' para datetime
df['data'] = pd.to_datetime(df['data'])

# 3. Calcular a data inicial
data_inicial = df['data'].min()

# 4. Criar a variável 'dias_desde_inicio'
df['dias_desde_inicio'] = (df['data'] - data_inicial).dt.days

# --- REGRESSÃO LINEAR MÚLTIPLA ---

# 5. Definir X e Y
# Agora usamos DUAS variáveis preditoras
X = df[['posicao', 'dias_desde_inicio']]
Y = df['nota']

# 6. Criar e treinar o modelo
modelo = LinearRegression()
modelo.fit(X, Y)

# 7. Exibir resultados
coeficientes = modelo.coef_
intercepto = modelo.intercept_
r_quadrado = modelo.score(X, Y)

print("\n--- Resultados da Regressão Linear Múltipla ---")
print("Variáveis Independentes (X): posicao e dias_desde_inicio")
print("Variável Dependente (Y): nota")
print("-" * 50)

print(f"Coeficiente da POSIÇÃO: {coeficientes[0]:.4f}")
print(f"Coeficiente dos DIAS: {coeficientes[1]:.4f}")
print(f"Intercepto: {intercepto:.4f}")
print(f"R-quadrado do modelo: {r_quadrado:.4f}")

# 8. Exemplo de previsão:
# Posição = 5 | Dias desde o início = 30
nova_previsao = np.array([[5, 30]])
predicao = modelo.predict(nova_previsao)

print("\nExemplo de previsão:")
print(f"Nota prevista para posição 5 e 30 dias: {predicao[0]:.4f}")



--- Resultados da Regressão Linear Múltipla ---
Variáveis Independentes (X): posicao e dias_desde_inicio
Variável Dependente (Y): nota
--------------------------------------------------
Coeficiente da POSIÇÃO: -0.4025
Coeficiente dos DIAS: 0.0284
Intercepto: 9.3989
R-quadrado do modelo: 0.8990

Exemplo de previsão:
Nota prevista para posição 5 e 30 dias: 8.2372


