# Introdução : 

Este notebook apresenta a utilização de um modelo de regressão linear 
múltipla para prever o preço das ações da empresa Apple. Utilizamos uma base de dados que contém informações de (1980 - 2020) com o preço de abertura, o preço máximo e mínimo alcançados diariamente, o volume negociado no dia e o preço de fechamento ajustado.


A regressão linear múltipla é uma técnica estatística que busca estabelecer uma relação entre uma variável dependente (neste caso, o preço das ações) e várias variáveis independentes (abertura, máximo, mínimo, volume e preço de fechamento ajustado). Essas variáveis independentes são usadas como recursos para prever o valor da variável dependente.

Ao utilizar essa abordagem, podemos explorar a influência conjunta dessas variáveis independentes no preço das ações da Apple. O preço de abertura pode fornecer insights sobre o sentimento do mercado no início do dia, enquanto o preço máximo e mínimo alcançados diariamente podem indicar a volatilidade do mercado. O volume negociado no dia pode refletir o interesse e a participação dos investidores, enquanto o preço de fechamento ajustado leva em consideração eventos corporativos que podem afetar o preço das ações.


---





#  Este código é para concender acesso ao google drive



In [41]:
from google.colab import drive
drive.mount('/content/drive', force_remount=True)

Mounted at /content/drive


#Esse código importa as bibliotecas necessárias para o funcionamento do modelo , e para e medir seus resultados eo o endereço do arquivo que será nossa base de dados.

In [42]:
# Importar bibliotecas necessárias
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt
# Carregar dados históricos de preços de ações
df = pd.read_csv('/content/drive/MyDrive/Projetos Python /Projetos Machine Learn /Regreção linear/AAPL.csv')

#A linha de código abaixo é somente para mostrar a tabela onde com  os dados.

In [43]:
df.head()

Unnamed: 0,Date,Open,High,Low,Close,Adj Close,Volume
0,1980-12-12,0.513393,0.515625,0.513393,0.513393,0.406782,117258400
1,1980-12-15,0.488839,0.488839,0.486607,0.486607,0.385558,43971200
2,1980-12-16,0.453125,0.453125,0.450893,0.450893,0.35726,26432000
3,1980-12-17,0.462054,0.464286,0.462054,0.462054,0.366103,21610400
4,1980-12-18,0.475446,0.477679,0.475446,0.475446,0.376715,18362400


# Nesta parte selecionamos as variáveis independentes (X) , e a variável dependente (y) , e dividimos os dados em conjuntos de treinamento e teste onde 70% dos dados são para teste e 30% para treinamento.

In [None]:
# Selecionar atributos relevantes para a previsão
X = df[['Volume','Open']]
y = df['Close']

# Dividir dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.7, random_state=55)

# Nessa parte do código implementa o treinamento de um modelo de regressão linear utilizando os dados de treinamento (X_train e y_train). Em seguida, ele faz previsões no conjunto de teste (X_test) usando o modelo treinado e armazena as previsões na variável y_pred.

In [None]:
# Treinar o modelo de regressão linear
reg = LinearRegression()
reg.fit(X_train, y_train)

# Fazer previsões no conjunto de teste
y_pred = reg.predict(X_test)

#Esse trecho de código calcula o desvio padrão dos resíduos do modelo de regressão linear, cria um DataFrame com os valores reais, as previsões e o desvio padrão, e em seguida, salva esse DataFrame em um arquivo CSV. Essas informações são úteis para avaliar a precisão do modelo e comparar os valores previstos com os valores reais.

In [44]:
# Calcula o desvio padrão , para medir a acertividade do modelo
desvio_padrao = np.std(y_test - y_pred)
desvio_padrao = round(desvio_padrao, 3)

# Criando um DataFrame com os dados reais, previstos e porcentagem de acertos
df = pd.DataFrame({'Dados Reais': y_test, 'Dados Previstos': y_pred, 'Desvio': desvio_padrao})

# Salvando o DataFrame como um arquivo CSV
df.to_csv('tabela_comparativa.csv', index=False)