In [None]:
# instalar a biblioteca Yahoo Finance
!pip install yfinance

In [None]:
# importando o Yahoo Finance e o módulo para análise dos dados
import yfinance as yf
import datetime as dt
from datetime import timedelta
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
def data_entry():
    # as variáveis foram definidas como globais para poderem ser usadas fora da função
    global stock_code, start_date, end_date, data

    #irá rodar este código caso não exista erro:
    while True:
        try:
            print('Código da ação pode ser encontrado neste link: https://br.financas.yahoo.com/')
            stock_code = input("Digite o código da ação (ex: BBDC4.SA): ").upper()
            start_date = input("Digite a data de início no formato YYYY-MM-DD: ")
            end_date = input("Digite a data de fim no formato YYYY-MM-DD: ")

            # strptime: "String To Parse Time" - transforma string para datetime
            # O código dt.datetime.strptime é usado para converter uma string que representa uma data e hora em um objeto datetime.
            # modulo yfinance end diminui 1 dia do dado input, para consertar isso usa-se o timedelta e adiciona-se 1 dia de volta
            end_date_adjusted = dt.datetime.strptime(end_date, '%Y-%m-%d') + timedelta(days=1)
            # criação e exibição de um dataframe
            # yf.download aceita tanto strings quanto objetos datetime como parâmetros de start e end.
            data = yf.download(stock_code, start=start_date, end=end_date_adjusted )
            display(data)
            break

        # irá rodar estas mensagens caso exista um erro
        except Exception as e:
          print(f"\nErro: {e}")
          print('''
          Siga esta padrão para entrada de dados. Exemplo:
          Digite o código da ação (ex: BBDC4.SA):BBDC4.SA
          Digite a data de início no formato YYYY-MM-DD: 2008-01-01
          Digite a data de fim no formato YYYY-MM-DD: 2023-01-01
          ''')

data_entry()

In [None]:
data.info()

In [None]:
# valores estatísticos da ação na fechamento
#round formatará para ficar com duas casas decimais

arr_stock_close = np.array(data.Close)

minimum = np.min(arr_stock_close)
print(f"Valor mínimo da ação {stock_code} no fechamento:", round(minimum,2))

maximum = np.max(arr_stock_close)
print(f"Valor máximo da ação {stock_code} no fechamento:", round(maximum,2))

mean = np.mean(arr_stock_close)
print(f"Valor médio da ação {stock_code} no fechamento:", round(mean,2))

median = np.median(arr_stock_close)
print(f"Mediana da ação {stock_code} no fechamento:", round(median,2))

standart_deviation = np.std(arr_stock_close)
print(f"O desvio padrão dos valores de {stock_code} no fechamento:", round(standart_deviation,2))


In [None]:
# Encontrar os índices dos valores NaN
missing_values = np.isnan(data.Close).sum()
print(f"NaN encontrados: {missing_values}")
# Tratando os valores ausentes (substituindo pela média, por exemplo)
if missing_values > 0:
    data['Close'].fillna(mean, inplace=True)

In [None]:
# criação da coluna variação percentual: preço de fechamento (Close) de um dia para o outro no DataFrame
# O método pct_change() calcula a variação percentual entre o valor atual e um valor anterior.
# Multiplicar por 100 transforma a variação em porcentagem.
data['Variação Percentual'] = data['Close'].pct_change() * 100

# dados mensais da coluna ‘Variação Percentual’.
# O método resample('M') é usado para reamostrar os dados em uma frequência mensal.
# O método agg() é então usado para calcular a média (mean) e a mediana (median) da variação percentual para cada mês.
monthly_summary = data.resample('M').agg({'Variação Percentual': ['mean', 'median']})

print(monthly_summary)


In [None]:
plt.figure(figsize=(10, 6))
# gráfico de linha da ação
plt.plot(data.index, data["Close"])
plt.xlabel('Data')     # rótulo do eixo X
plt.ylabel('Preço')   # rótulo do eixo Y
plt.title('Evolução do Preço da Ação')  # Título do Gráfico
plt.grid(True)        # Linhas de grades no gráfico
plt.show()            # Exibe o Gráfico

In [None]:
plt.figure(figsize=(12, 6))
# Reamostragem de 'Volume' por mês e soma dos valores
monthly_volume = data['Volume'].resample('M').sum()
monthly_volume.plot(kind='bar', title=f'Volume de Negociações por Mês ({stock_code})', xlabel='Mês', ylabel='Volume')
# Rotacionar as etiquetas do eixo x e as mostra de 6 em 6 meses para melhor legibilidade
# strftime: "String From Time" - transforma datetime em string
# date.strftime('%Y-%m') formata a data correspondente(date) mostrando o ano e o mês
# i, date in enumerate descompacta cada elemento da enumeração, onde i é a posição do índice e date é o valor correspondente do índice
# if i % 6 verifica se o índice atual(i) é um múltiplo de 6.
# ha='right' alinhamento dos xticks à direita
plt.xticks(range(0, len(monthly_volume.index), 6), [date.strftime('%Y-%m') for i, date in enumerate(monthly_volume.index) if i % 6 == 0], rotation=45, ha='right')
plt.tight_layout()
plt.show()

In [None]:
# print(data['Volume'])

from sklearn.preprocessing import StandardScaler

# normalização dos valores
scaler = StandardScaler()
open_norm = scaler.fit_transform(data['Open'].values.reshape(-1, 1))
volume_norm = scaler.fit_transform(data['Volume'].values.reshape(-1, 1))

plt.figure(figsize=(10, 6))


# Cria o o grafico de Volume
plt.scatter(data.index, volume_norm, label='Volume', color='red', alpha=.7)
# Cria o o grafico de Open
plt.scatter(data.index, open_norm, label='Preço abertura', color='blue', alpha=.7)

plt.xlabel('Preço de abertura Padronizado')
plt.ylabel('Volume de vendas Padronizado')
plt.title(f'Correlação entre preço de abertura e volume de vendas da {stock_code}') # Título do Gráfico
plt.legend()
plt.show()