In [22]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import LabelEncoder

# Função para carregar os dados
def carregar_dados(caminho_arquivo):
    return pd.read_csv(caminho_arquivo)

# Função para processar os dados (conversão de colunas categóricas para numéricas)
def processar_dados(df):
    # Convertendo colunas categóricas para numéricas
    label_encoder_dia = LabelEncoder()
    
    # Convertendo "Dia" para numérico
    df["Dia"] = label_encoder_dia.fit_transform(df["Dia"])
    
    # Garantir que "Hora de início" é uma string
    df["Hora de início"] = df["Hora de início"].astype(str)
    
    # Convertendo "Hora de início" para numérico (extraindo a hora do horário)
    df["Hora de início"] = df["Hora de início"].str.split(':').str[0].astype(int)
    
    return df, label_encoder_dia

# Função para treinar o modelo
def treinar_modelo(df):
    X = df[["Dia", "Hora de início"]]  # Features
    y = df["Impressões"]  # Target
    
    # Dividir os dados em treino e teste
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    
    # Treinar o modelo
    modelo = LinearRegression()
    modelo.fit(X_train, y_train)
    
    return modelo

# Função para prever dados futuros
def prever_futuros_dados(modelo, label_encoder_dia, dia_futuro, horario_futuro):
    # Converte os valores de "Dia" para numéricos
    dia_futuro_encoded = label_encoder_dia.transform([dia_futuro])[0]
    
    # Converte o horário para numérico (extraindo a hora do horário)
    horario_futuro_encoded = int(horario_futuro.split(':')[0])
    
    # Cria um DataFrame com os novos dados
    dados_futuros = pd.DataFrame({
        "Dia": [dia_futuro_encoded],
        "Hora de início": [horario_futuro_encoded]
    })
    
    # Fazer previsões
    previsao_futura = modelo.predict(dados_futuros)
    
    return previsao_futura

# Exemplo de uso
if __name__ == "__main__":
    # Caminho do arquivo
    caminho_arquivo = "../Dados/DiaHora.csv"
    
    # Carregar os dados
    df = carregar_dados(caminho_arquivo)
    
    # Processar os dados (converter "Dia" e "Hora de início" em numérico)
    df, label_encoder_dia = processar_dados(df)
    
    # Treinar o modelo
    modelo = treinar_modelo(df)
    
    # Prever impressões futuras para um novo "Dia" e "Hora de início"
    dia_futuro = "Terça-feira"  # Exemplo de dia futuro
    horario_futuro = "14:00"  # Exemplo de hora futura
    
    previsao_futura = prever_futuros_dados(modelo, label_encoder_dia, dia_futuro, horario_futuro)
    
    print(f"Previsão de impressões para {dia_futuro} às {horario_futuro}: {previsao_futura[0]:.0f}")


Previsão de impressões para Terça-feira às 14:00: 228
