## **Questão 1**

#### **Explicando alguns termos**


##### **1) Backtest**

Backtest é o processo de testar uma estrátegia de investimentos ou modelo de trading usando dados históricos. O objetivo de um backtest é
avaliar como a estratégia elaborada teria se comportado no passado para, a partir disso, inferir como pode ser o potencial futuro dessa
estratégia.

##### **2) Dividendos**

Dividendos são pagamentos distribuidos por uma certa empresa a seus acionistas como uma parcela do lucro da empresa. Eles são uma forma de retorno de investimento para os acionistas e podem ser pagos em dinheiro ou em ações adicionais.

##### **3) Split**

Um split, ou split de ações, é um evento corporativo onde uma certa empresa decide dividir suas ações existentes em um número maior de ações. Isso geralmente é feito para tornar o preço dessas ações mais acessível aos investidores, sem alterar o valor total da empresa.

##### **4) Reverse split**

Um reverse split é um evento corporativo em que uma empresa reduz o número de suas ações em circulação ao consolidar várias ações existentes em uma única ação nova. Isso acaba resultando em um aumento no preço das ações de tal empresa, sem alterar o valor total de mercado da mesma.

##### **5) Spin-off**

Um spin-off é um evento corporativo em que uma empresa cria uma nova empresa independente, separando uma parte de seus negócios. Em tal evento, os acionistas da empresa original geralmente recebem ações da nova empresa, proporcionais a sua participação na empresa original.

##### **6) Adjustment close**

O adjustment close é basicamente o preço de uma ação ajustado a ocorrência de eventos corporativos como dividendos, splits, reverse splits e spin-offs. Esse tipo de ajuste é feito para fornecer uma visão mais precisa do desempenho de uma ação ao longo do tempo, levando em conta as mudanças que afetam o preço.

#### **Resolução da questão**

##### **Instalação de bibliotecas**

In [2]:
# Instala a bibliotecas que ser utilizada para a importação dos dados necessários para a resolução das questões abaixo.
%pip install yfinance

Defaulting to user installation because normal site-packages is not writeable
Note: you may need to restart the kernel to use updated packages.


##### **Importação de bibliotecas**

In [3]:
# Importa as bibliotecas que serão utilizadas na resolução das questões abaixo.
import yfinance as yf
# Importa a biblioteca que será utilizada para a manipulação de DataFrames.
import pandas as pd
# Importa a biblioteca que será utilizada em operações que envolvam aleatoriedade.
import random
# Importa a biblioteca que será utilizada para a manipulação de datas.
from datetime import datetime
# Importa as bibliotecas que serão utilizadas para a criação de gráficos.
import plotly.graph_objects as go
import matplotlib.pyplot as plt
import seaborn as sns


##### **Setup**

In [4]:
# Cria uma variável de configuração que conterá dados úteis na resolução das questões abaixo.
setup = {
    "start_date": datetime(2018,1,1).date(),
    "end_date": datetime(2022,12,31).date(),
    "tickers": {
        "Vale":"VALE3.SA",
        "Banco do Brasil": "BBAS3.SA",
        "Bradesco":"BBDC3.SA",
        "Itau":"ITUB4.SA",
        "BTG Pactual":"BPAC11.SA",
        "Banco Pan":"BPAN4.SA",
        "Banco de Brasilia":"BSLI3.SA",
        "Banco BMG":"BMGB4.SA",
        "Santander":"SANB11.SA",
        "BR Partners":"BRBI11.SA"
    }
}

##### **Questão 1 - a)** 

*Obtenha os dados diários das ações da Vale (VALE3)*

In [5]:
def get_ticker_data(ticker, start_date, end_date):
    '''
        Description: Essa função é responsável por obter alguns dados sobre as ações de uma determinada empresa em um certo período.
        
        Args:
            ticker (string): Identificador da empresa que se deseja obter os dados.
            start_date (string): Primeira data em que se deseja obter os dados sobre as ações da empresa.
            end_date (string): última data em que se deseja obter os dados sobre as ações da empesa.
        
        Return:
            data (pandas.DataFrame): DataFrame que contém alguns dados sobre as ações da empresa em questão.
    '''
    try:
        # Obtem o DataFrame que contém alguns dados sobre as ações da empresa solicitada.
        data = yf.download(ticker, start_date, end_date)
    except Exception as e:
        print(f"Erro ao baixar os dados do ticker {ticker}: {e}")
    
    # Retorna o DataFrame que contém os dados obtidos.
    return data

In [6]:
# Salva em uma variável o DataFrame que contém os dados obtidos.
VALE_data = get_ticker_data(setup["tickers"]["Vale"], setup["start_date"], setup["end_date"])

[*********************100%%**********************]  1 of 1 completed


In [7]:
# Exibo os dados obtidos.
VALE_data

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2018-01-02,40.439999,41.740002,40.439999,41.720001,26.179441,14156500
2018-01-03,41.830002,41.880001,41.299999,41.470001,26.022562,12744200
2018-01-04,41.810001,42.369999,41.520000,41.639999,26.129232,18433000
2018-01-05,41.570000,42.290001,41.310001,42.290001,26.537111,15251300
2018-01-08,42.400002,43.230000,42.400002,43.230000,27.126966,14542800
...,...,...,...,...,...,...
2022-12-23,85.279999,86.519997,85.080002,86.320000,77.709404,18656500
2022-12-26,86.419998,87.540001,86.330002,87.110001,78.420609,18407500
2022-12-27,88.000000,89.650002,87.470001,89.190002,80.293121,26720300
2022-12-28,89.190002,90.209999,88.699997,88.989998,80.113068,23314500


##### **Questão 1 - b)**
*Obtenha dados diários de um conjunto de 10 ações da B3 (inclua a VALE3 e escolha as outras 9); agrupe-as da forma que preferir. Depois, filtre para obter um dataframe apenas com o preço de fechamento ajustado*

In [8]:
def get_tickers_adjusted_close_price(tickers_list, start_date, end_date):
    '''
        Description: ...
        
        Args:
            tickers_list (list): Lista contendo as strings que representam os tickers das empresas cujos dados das ações serão obtidos.
            start_date (datetime.date()): Data inicial do intervalo onde os dados serão extraidos.
            end_date (datetime.date()): Data final do intervalo onde os dados serão extraidos.
        
        Return:
            result (pd.DataFrame): DataFrame contendo os preços de fechamento ajustado durante o período compreendido entre "start_date"
            e "end_date" de todas as empresas cujo ticker esta em "tickers_list".       
            
        Obs: Pode ocorrer que alguma das empresas cujo ticker esta em "tickers_list" tenha sido listada na B3 após a data "start_date", caso isso
        ocorra, o preço de fechamento ajustado de tal empresa será setado como 0 em todas as datas a partir de "start_date" até a data em que 
        essa empresa foi listada na B3.
    '''
    
    # Por conta da variável "index_union" que será criada mais abaixo, trataremos o download dos dados do primeiro ticker de forma separada.
    # Obtem os dados do primeiro ticker.
    first_ticket = yf.download(tickers_list[0], start_date, end_date)
    # Cria uma variável que conterá a união (no sentido de conjuntos) de todos os índices de cada um dos tickers pertencentes a "ticker_list".
    # Ou seja, essa variável guardará os índices (que são as datas onde ocorreu negociação na B3) do ticker pertencente a "ticker_list" que foi
    # listado primeiro na B3. Faremos isso visando a padronização citada na observação da docstring dessa função.
    index_union = first_ticket.index
    # Cria uma lista para guardar as séries que representam o "Adj Close" de cada um dos tickers em "ticker_list".
    series_list = []
    # Adiciona a série "Adj Close" do primeiro ticker em "ticker_list" a lista "series_list".
    series_list.append(first_ticket['Adj Close'])
    
    # Percorre todos os tickers em ticker_list com exceção do primeiro.
    for ticker in tickers_list[1:]:
        try:
            # Faz o download dos dados ticker em questão no período compreendido entre "start_date" e "end_date".
            ticker_data = yf.download(ticker, start_date, end_date)
        except Exception as e:
            print(f"Erro ao baixar os dados do ticker {ticker}: {e}")
            continue
        # Faz a união dos índices do ticker em questão com todos os índices dos tickers que foram unidos até então.
        index_union = index_union.union(ticker_data.index)
        # Adiciona a série "Adj Close" do ticker em questão a lista "series_list".
        series_list.append(ticker_data['Adj Close'])
        
    # Reindexa todas as séries contidas em "series_list" levando em conta os índices em "index_union" e preenche eventuais valores faltantes
    # como zero.
    reindexed_serie_list = [serie.reindex(index_union, fill_value = 0) for serie in series_list]
    
    # Concatena todas as séries que foram reindexadas acima em um único DataFrame e usa o ticker de cada uma das séries como chave para
    # criar níveis superiores.
    result = pd.concat(reindexed_serie_list, axis=1, keys=tickers_list)
    
    # Retorna o DataFrame criado acima.
    return result

In [9]:
# Cria uma lista que contém todos os tickers que estão na variável de configuração "setup".
tickers_list = list(setup["tickers"].values())
# Obtem alguns dados relacionados as ações de cada um dos tickers presentes na "tickers_list" criada acima.
tickers_data = get_tickers_adjusted_close_price(tickers_list, setup['start_date'], setup['end_date'])

[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed


In [10]:
# Exibe os dados obtidos.
tickers_data

Unnamed: 0_level_0,VALE3.SA,BBAS3.SA,BBDC3.SA,ITUB4.SA,BPAC11.SA,BPAN4.SA,BSLI3.SA,BMGB4.SA,SANB11.SA,BRBI11.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2018-01-02,26.179441,10.871191,13.208990,21.503372,3.830502,1.526437,2.797653,0.000000,20.632023,0.000000
2018-01-03,26.022562,11.009848,13.265182,21.650379,3.866983,1.542590,2.797653,0.000000,20.461819,0.000000
2018-01-04,26.129232,11.115493,13.506750,22.101231,3.881171,1.518360,2.797653,0.000000,20.707664,0.000000
2018-01-05,26.537111,11.115493,13.510840,22.164938,3.945339,1.558742,2.797653,0.000000,20.928297,0.000000
2018-01-08,27.126966,11.141901,13.510840,22.091429,3.993685,1.582971,2.797653,0.000000,21.333410,0.000000
...,...,...,...,...,...,...,...,...,...,...
2022-12-23,77.709404,15.713291,11.602370,22.846006,23.483845,6.044343,17.366064,1.824207,25.461121,9.580054
2022-12-26,78.420609,15.691021,11.333155,22.392534,22.899145,5.927240,17.366064,1.798753,25.172199,9.486879
2022-12-27,80.293121,15.169917,11.402630,22.265566,22.362371,5.862934,17.366064,1.798753,25.253456,9.275118
2022-12-28,80.113068,15.441605,11.750007,22.719030,23.474260,6.039875,17.710436,1.832692,25.641695,9.529232


##### **Questão 1 - c)**

*Faça um único gráfico contendo a série temporal do preço de fechamento ajustado de cada uma das 10 ações que você escolheu no item anterior.*

In [11]:
def plot_all_adjusted_close_prices(data):
    '''
        Description:
            Esta função plota ao longo do tempo os preços de fechamento ajustados das ações presentes no DataFrame "data".
        Args:
            data (pandas.DataFrame): DataFrame contendo os preços de fechamento ajustado das ações. Tal DataFrame deve ter datas como índices e
            deve ter cada uma de suas colunas representando os preços de fechamento ajustados de um certo ticket.
        Return:
            None: A função exibe o gráfico gerado, mas não retorna nenhum valor.
    '''    
    
    # Cria uma lista de timestamps que representará o eixo x do gráfico que será plotado.
    x_axis = data.index.tolist()
    # Cria a figura onde será plotado o gráfico.
    fig = go.Figure()

    # Adiciona cada série temporal ao gráfico.
    for ticker in data.columns:
        # Cria uma lista com os preços de fechamento ajustados das ações do ticker em questão.
        y_axis = data[ticker].values
        # Plota o gráfico (Data x Valor da Ação) do ticker em questão.
        fig.add_trace(go.Scatter(x=x_axis, y=y_axis, mode="lines", name=ticker))
    
    # Atualiza o layout para permitir destaque ao clicar na legenda.
    fig.update_layout(
        title='Série temporal do preço de fechamento ajustado de algumas ações',
        xaxis_title='Data',
        yaxis_title='Valor da Ação',
        legend_title='Ações',
        hovermode='x unified',
        clickmode='event+select'
    )

    # Callback para destacar a linha ao clicar na legenda.
    fig.update_traces(
        marker=dict(size=12),
        selector=dict(mode='markers')
    )

    # Exibe o gráfico criado.
    fig.show()

In [12]:
# Plota os gráficos (Data x Valor da Ação) de cada uma das empresas cujo ticker está presente em "tickers_data".
plot_all_adjusted_close_prices(tickers_data)

##### **Questão 1 - d)**

*Escolha uma das 10 ações e faça um gráfico contendo a média móvel dos últimos 20 dias do preço de fechamento, mais as bandas de Bollinger (dois desvios para cima e dois desvios para baixo). O que a média móvel representa e porque usar as bandas de Bollinger?*

In [13]:
def get_serie_moving_average(serie, interval):
    '''
        Description:
            Essa função calcula as médias móveis dos dados de uma pd.Series "serie" em uma janela de tempo "interval".
        Args:
            serie (pd.Series): Série (coluna) contendo os dados que serão utilizados para o cálculo.
            interval (int): Janela de dias em que as médias móveis serão calculadas.
        Return:
            result (pd.Series): Série (coluna) contendo as médias móveis de "interval" dias dos dados da série fornecida.
    '''
    
    # Calcula as médias móveis dos dados da pd.Series "serie" na janela de tempo "interval" e guarda os resultados na variável "result".
    result = serie.rolling(window=interval).mean()
    
    # Lembre que, pela definição de média móvel, se tivermos um conjunto de x dados e quisermos calcular a média móvel desses dados em uma janela 
    # de tempo t, então teremos (x - t + 1) pontos da média móvel como resultado. Por conta disso, existarão algumas linhas da variável "result"
    # que serão nulas. 
    
    # Remove as linhas nulas da variável "result".
    result = result.dropna()
    
    return result

In [14]:
def get_serie_moving_std(serie, interval):
    '''
        Description:
            Essa função calcula os desvios padrões móveis dos dados de uma pd.Series "serie" em uma janela de tempo "interval".
        Args:
            serie (pd.Series): Série (coluna) contendo os dados que serão utilizados para o cálculo.
            interval (int): Janela de dias em que os desvios padrões móveis serão calculados.
        Return:
            result (pd.Series): Série (coluna) contendo os desvios padrões móveis de "interval" dias dos dados da série fornecida.
    '''
    
    # Calcula os desvios padrões móveis dos dados da pd.Series "serie" na janela de tempo "interval" e guarda os resultados na variável "result".
    result = serie.rolling(window=interval).std()
    
    # Lembre que, pela definição de desvio padrão móvel, se tivermos um conjunto de x dados e quisermos calcular os desvios padrões móveis desses
    # dados em uma janela de tempo t, então teremos (x - t + 1) pontos de desvio padrão móvel como resultado. Por conta disso, existarão algumas
    # linhas da variável "result" que serão nulas. 
    
    # Remove as linhas nulas da variável "result".
    result = result.dropna()
    
    return result

In [39]:
def plot_serie_moving_average_with_boillinger_bands(serie, interval, ticker=""):
    '''
        Description:
            Essa função plota as médias móveis dos dados da serie temporal "serie", juntamente das bandas de bollinger de tais médias moveis. 
            Para tal plot, os índices da serie temporal "serie" são usados como eixo x. Por conta disso, é esperado que tais índices sejam
            objetos do tipo datetime ou similares.
        Args:
            serie (pd.Series): Série (coluna) contendo os dados que serão utilizados para o plot.
            interval (int): Intervalo cujas estatísticas móveis serão calculadas.
            ticker (string) [opcional]: String contendo o nome do ticker cujos dados serão plotados no gráfico.
        Return:
            A função exibe o gráfico gerado, mas não retorna nenhum valor.
    '''
    
    # Calcula a média móvel de "interval" dias para a série temporal recebida como parâmetro.
    serie_moving_average = get_serie_moving_average(serie, interval)
    # Calcula o desvio padrão móvel de "interval" dias para a série temporal recebida como parâmetro.
    serie_moving_std = get_serie_moving_std(serie, interval)
    
    # Cria uma lista de timestamps que representará o eixo x do gráfico que será plotado.
    x_axis = serie.index.tolist()
    
    # Calcula as bandas superior e inferior de Bollinger.
    aux = 2*serie_moving_std.values
    upper_band = serie_moving_average.values + aux
    lower_band = serie_moving_average.values - aux
    
    # Cria a figura onde será plotado o gráfico.
    fig = go.Figure()

    # Adiciona a série temporal do preço no plot.
    fig.add_trace(go.Scatter(x=x_axis, y=serie.values, mode="lines", name=f"Preço de fechamento do ativo",line=dict(color="black",width=2)))
    # Adiciona a série temporal da média móvel no plot.
    fig.add_trace(go.Scatter(x=x_axis, y=serie_moving_average.values, mode="lines", name=f"Média móvel de {interval} dias",line=dict(color="red",width=2)))
    # Adiciona as séries temporais das bandas superior e inferior de Bollinger no plot.
    fig.add_trace(go.Scatter(x=x_axis, y=upper_band, mode="lines", name=f"Banda de Bollinger superior", line=dict(color="blue", width=2)))
    fig.add_trace(go.Scatter(x=x_axis, y=lower_band, mode="lines", name=f"Banda de Bollinger inferior", line=dict(color="blue", width=2)))
    
    # Adiciona legendas aos eixos do gráfico.
    fig.update_layout(
        title=f"Evolução temporal do preço do ativo {ticker}",
        xaxis_title='Data',
        yaxis_title='Valor',
    )

    # Exibe o gráfico criado.
    fig.show()

In [75]:
# Seleciona aleatoriamente um dos tickers existentes na variável de configuração "setup".
ticker = random.choice(tickers_list)

# Obtem os preços de fechamento ajustado do ticker selecionado.
ticker_data = get_ticker_data(ticker, setup['start_date'], setup['end_date'])['Adj Close']

[*********************100%%**********************]  1 of 1 completed


In [76]:
plot_serie_moving_average_with_boillinger_bands(ticker_data, 20, ticker)

**O que a média móvel representa e porque usar as bandas de Bollinger?**

*A média móvel é uma técnica estatística utilizada para suavizar dados ao calcular a média de um conjunto de valores dentro de um intervalo específico de tempo. Isso reduz o impacto de flutuações e ruídos, permitindo uma melhor visualização de tendências e padrões na série temporal. Além disso, a média móvel é frequentemente utilizada para identificar sinais de compra e venda em análise técnica.*

*As Bandas de Bollinger são um indicador técnico que mede a volatilidade de uma série temporal. Elas são compostas por uma média móvel e duas bandas situadas dois desvios padrão acima e abaixo dessa média móvel. A ideia é que, em uma distribuição normal, aproximadamente 95% dos dados estão dentro desse intervalo. Isso permite aos analistas identificar condições de sobrecompra ou sobrevenda, além de ajudar a entender a volatilidade do mercado.*

##### **Questão 1 - e)**
*Faça um único gráfico contendo o preço de fechamento da ação escolhida e seu Volume (negociado no dia)*

##### **Questão 1 - f)**

*Faça um gráfico de dispersão (do preço de fechamento ajustado) entre o ativo escolhido anteriormente e outro de sua escolha. Qual sua interpretação?*

**Interpretação do gráfico de dispersão acima**

*Resposta aqui*

##### **Desafio: Faça um gráfico candle stick da ação escolhida.**