In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split

# Carregar e preparar dados
df = pd.read_csv('sensor_temp_umid.csv', parse_dates=['timestamp'])
df.set_index('timestamp', inplace=True)
df = df.resample('1H').mean().dropna()
df.head()


In [None]:
# Criar coluna com temperatura 1 hora no futuro
df['temp_futuro'] = df['temperatura'].shift(-1)

# Remover linhas com valores nulos
df = df.dropna()

# Features e target
X = df[['temperatura', 'umidade']]
y = df['temp_futuro']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [None]:
modelo = LinearRegression()
modelo.fit(X_train, y_train)
y_pred = modelo.predict(X_test)

mse = mean_squared_error(y_test, y_pred)
print(f'MSE: {mse:.2f}')

# Comparação visual
plt.plot(y_test.values[:50], label='Real')
plt.plot(y_pred[:50], label='Previsto')
plt.title('Previsão de Temperatura - 1h à frente')
plt.legend()
plt.show()


### 🔧 Extensões possíveis para o projeto final

- Adicionar variáveis de tempo (hora do dia, dia da semana).
- Usar médias móveis como features.
- Aplicar outros algoritmos de regressão (Árvore de Decisão, SVR, etc).
- Mudar o alvo para umidade ou outra variável.
- Testar previsões com diferentes janelas de tempo.
- Usar clusterização para identificar padrões antes da regressão.
