In [None]:
'''
Objetivo é treinar um modelo de regressão linear para fazer previsões de preços das empresa Sony, Microsoft, Ubisoft, Nintendo, Eletronic Arts

'''

In [2]:
#Bibliotecas utilizadas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
import datetime as dt

In [3]:
#Carregamento dos dados

dados =  pd.read_excel(r"C:\Users\dante\OneDrive\Documentos\9. Meus Projetos\Projetos Power Bi\Mercado de Ações\Dados\Agrupado.xlsx")

df = pd.DataFrame(dados)

In [None]:
#Visão Geral

print(df.shape)
print(df.columns)
print(df.head())
df.info()

#A coluna 'Date' será a variavel preditora
#As colunas 'Close/Last', 'Volume', 'Open', 'High', 'Low' serão as colunas alvos

In [5]:
#Salvando uma cópia do dataset

df_original = df.copy()

In [None]:
#Conversão de objeto para data
df['Date'] = pd.to_datetime(df['Date'], errors='coerce', format=None)
#conferindo as informações
print(df['Date'].dtypes)
print(df['Date'].head())



In [None]:
#tipos das colunas

tipos = df.dtypes
print(tipos)

In [None]:
#Análise Exploratória - Resumo Estatístico

valores_ausentes = df.isnull().sum()
print(valores_ausentes)


In [None]:
#Tirando o cifrão do número

df['Open'] = df['Open'].str.replace("$", '')
df['Close/Last'] = df['Close/Last'].str.replace("$", '')
df['High'] = df['High'].str.replace("$", '')
df['Low'] = df['Low'].str.replace("$", '')

print(df['Open'].head())
print(df['Close/Last'].head())
print(df['High'].head())
print(df['Low'].head())

In [None]:
#Mudando o tipo de objeto para float
df['Open'] = df['Open'].astype(float)
df['Close/Last'] = df['Close/Last'].astype(float)
df['High'] = df['High'].astype(float)
df['Low'] = df['Low'].astype(float)
df['Volume'] = df['Volume'].astype(float)
print(df.dtypes)

In [None]:

descricao_vol = df['Volume'].describe().round()
descricao_open = df['Open'].describe().round()
descricao_high = df['High'].describe().round()
descricao_low = df['Low'].describe().round()
descricao_close = df['Close/Last'].describe().round()
print(descricao_vol)

In [None]:
print(df['Date'].head())

In [None]:
#verificando primeiro valor da coluna 'Date'

primeiro_linha = df.sort_values('Date').iloc[0]
print(primeiro_linha)

In [14]:
#transformando a coluna 'Empresa' do tipo string
df['Empresa'] = df['Empresa'].astype(str)

In [15]:
#filtrando as empresas

empresa = df['Empresa'].unique()

sony_dados = df[df['Empresa'] == 'Sony Corporation']
micro_dados = df[df['Empresa'] == 'Microsoft Corporation']
ubi_dados = df[df['Empresa'] == 'Ubsoft Entertainment']
dados_EA = df[df['Empresa'] == 'Eletronic Arts']


In [None]:
#SONY
#pegando a data de inicio
min_data = sony_dados['Date'].min()

sony_dados['dias_desde_inicio'] = (sony_dados['Date'] - min_data).dt.days

print(sony_dados['dias_desde_inicio'].head())



In [19]:
#SONY
#Criação das variaveis features e Targets
X_sony = sony_dados[['dias_desde_inicio', 'High', 'Low', 'Open']] 
y_sony = sony_dados['Close/Last']


In [20]:
#SONY
# Treinando o Modelo

x_train, x_test, y_train, y_test = train_test_split(X_sony, y_sony, test_size=0.2, random_state=42)

In [None]:
#SONY
# Treinar o modelo de regressão linear
modelo = LinearRegression()
modelo.fit(x_train, y_train)

In [None]:
#SONY
#SALVAR ESTA VARIAVEL
# Fazer previsões
y_pred = modelo.predict(x_test)

In [25]:
# Avaliar o modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

In [None]:
#Microsoft

min_data_micro = micro_dados['Date'].min()

micro_dados['data_inicio'] = (micro_dados['Date'] - min_data_micro).dt.days

print(micro_dados['data_inicio'].head())


In [None]:
#Microsoft Target

#Criação das variaveis features e Targets
X_micro = micro_dados[['data_inicio', 'High', 'Low', 'Open']] 
y_micro = micro_dados['Close/Last']

In [30]:
#Microsoft
# Treinando o Modelo

x_train_micro, x_test_micro, y_train_micro, y_test_micro = train_test_split(X_micro, y_micro, test_size=0.2, random_state=42)

In [None]:
#Microsoft
# Treinar o modelo de regressão linear
modelo_micro = LinearRegression()
modelo_micro.fit(x_train_micro, y_train_micro)

In [None]:
#Microsoft
#SALVAR ESTA VARIAVEL
# Fazer previsões
y_pred_micro = modelo_micro.predict(x_test_micro)

print(y_pred_micro)

In [None]:
#Ubisoft
min_data_ubi = ubi_dados['Date'].min()

ubi_dados['data_inicio_ubi'] = (ubi_dados['Date'] - min_data_ubi).dt.days

In [None]:
#Ubisoft targe

#Criação das variaveis features e Targets
X_ubi = ubi_dados[['data_inicio_ubi', 'High', 'Low', 'Open']] 
y_ubi = ubi_dados['Close/Last']

In [40]:
#Ubisoft
# Treinando o Modelo

x_train_ubi, x_test_ubi, y_train_ubi, y_test_ubi = train_test_split(X_ubi, y_ubi, test_size=0.2, random_state=42)

In [None]:
#Ubisoft
# Treinar o modelo de regressão linear
modelo_ubi = LinearRegression()
modelo_ubi.fit(x_train_ubi, y_train_ubi)

In [None]:
#Ubisoft
#SALVAR ESTA VARIAVEL
# Fazer previsões
y_pred_ubi = modelo_ubi.predict(x_test_ubi)

print(y_pred_ubi)

In [None]:
#Electronic Arts dados_EA

min_data_EA = dados_EA['Date'].min()

dados_EA['data_inicio_EA'] = (dados_EA['Date'] - min_data_EA).dt.days

In [46]:
#Electronic Arts target

#Criação das variaveis features e Targets
X_EA = dados_EA[['data_inicio_EA', 'High', 'Low', 'Open']] 
y_EA = dados_EA['Close/Last']

In [47]:
#Electronic Arts
# Treinando o Modelo

x_train_EA, x_test_EA, y_train_EA, y_test_EA = train_test_split(X_EA, y_EA, test_size=0.2, random_state=42)

In [None]:
#Electronic Arts
# Treinar o modelo de regressão linear
modelo_EA = LinearRegression()
modelo_EA.fit(x_train_EA, y_train_EA)

In [None]:
#Electronic Arts
#SALVAR ESTA VARIAVEL
# Fazer previsões
y_pred_EA = modelo_EA.predict(x_test_EA)

print(y_pred_EA)