In [None]:
# Importação das bibliotecas necessárias
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import mean_absolute_error, accuracy_score, classification_report

# Leitura dos dados fictícios
def load_data():
    # Substitua por código para ler seus dados reais
    oportunidades_df = pd.DataFrame({
        'id_oportunidade': [1, 2],
        'nome_empresa': ['Empresa A', 'Empresa B'],
        'setor': ['Tecnologia', 'Saúde'],
        'preco_atual': [120.00, 85.00],
        'preco_historico_1m': [115.00, 80.00],
        'preco_historico_6m': [110.00, 75.00],
        'preco_historico_1a': [100.00, 70.00],
        'volume_negociacao': [500000, 300000],
        'dividend_yield': [2.5, 1.8],
        'rating': ['A', 'B']
    })
    
    indicadores_df = pd.DataFrame({
        'data': ['2024-07-01', '2024-06-01'],
        'PIB': [2.5, 2.6],
        'inflação': [4.2, 4.1],
        'taxa_juros': [5.0, 5.1],
        'desemprego': [6.1, 6.0]
    })

    return oportunidades_df, indicadores_df

# Pré-processamento dos dados
def preprocess_data(oportunidades_df, indicadores_df):
    # Convertendo a data para datetime
    indicadores_df['data'] = pd.to_datetime(indicadores_df['data'])
    
    # Merge de dados fictícios com base na data (ajustar conforme necessidade)
    oportunidades_df['data'] = pd.to_datetime('2024-07-01')  # Atribuindo data fictícia para exemplo
    data_merged_df = pd.merge(oportunidades_df, indicadores_df, on='data', how='left')
    
    # Criação de variáveis
    data_merged_df['var_preco_1m'] = (data_merged_df['preco_atual'] - data_merged_df['preco_historico_1m']) / data_merged_df['preco_historico_1m']
    data_merged_df['var_preco_6m'] = (data_merged_df['preco_atual'] - data_merged_df['preco_historico_6m']) / data_merged_df['preco_historico_6m']
    data_merged_df['var_preco_1a'] = (data_merged_df['preco_atual'] - data_merged_df['preco_historico_1a']) / data_merged_df['preco_historico_1a']
    
    # Convertendo categóricos para numéricos
    data_merged_df = pd.get_dummies(data_merged_df, columns=['setor', 'rating'])
    
    return data_merged_df

# Construção do modelo de regressão linear e modelo de classificação
def build_models(data_merged_df):
    # Definindo variáveis independentes e dependentes
    X = data_merged_df.drop(['id_oportunidade', 'nome_empresa', 'preco_atual', 'data'], axis=1)
    y = (data_merged_df['preco_atual'] > 100).astype(int)  # Exemplo de variável dependente para classificação

    # Dividindo os dados
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

    # Modelo de Regressão Linear
    lin_reg = LinearRegression()
    lin_reg.fit(X_train, y_train)
    y_pred_reg = lin_reg.predict(X_test)
    print("Mean Absolute Error (Regressão Linear):", mean_absolute_error(y_test, y_pred_reg))
    
    # Modelo de Classificação
    clf = RandomForestClassifier(random_state=42)
    clf.fit(X_train, y_train)
    y_pred_clf = clf.predict(X_test)
    print("Accuracy Score (Classificação):", accuracy_score(y_test, y_pred_clf))
    print("Classification Report (Classificação):\n", classification_report(y_test, y_pred_clf))

# Execução do código
oportunidades_df, indicadores_df = load_data()
data_merged_df = preprocess_data(oportunidades_df, indicadores_df)
build_models(data_merged_df)
