##### **Instalação de bibliotecas**

In [60]:
# Instala a bibliotecas que ser utilizada para a importação dos dados necessários para a resolução das questões abaixo.
%pip install yfinance

Defaulting to user installation because normal site-packages is not writeable
Note: you may need to restart the kernel to use updated packages.


##### **Importação de bibliotecas**

In [103]:
# Importa as bibliotecas que serão utilizadas na resolução das questões abaixo.
import yfinance as yf
# Importa a biblioteca que será utilizada para a manipulação de DataFrames.
import pandas as pd
# Importa a biblioteca que será utilizada em operações que envolvam aleatoriedade.
import random
# Importa a biblioteca que será utilizada para a manipulação de datas.
from datetime import datetime
# Importa as bibliotecas que serão utilizadas para a criação de gráficos.
import plotly.graph_objects as go
import matplotlib.pyplot as plt
import seaborn as sns
# Importa a biblioteca que será utilizada para gerar alguns iteradores.
import itertools
# Importa a biblioteca que será utilizada para lidar com funções matemáticas.
import math


##### **Setup**

In [62]:
# Cria uma variável de configuração que conterá dados úteis na resolução das questões abaixo.
setup = {
    "start_date": datetime(2018,1,1).date(),
    "end_date": datetime(2022,12,31).date(),
    "tickers": {
        "Vale":"VALE3.SA",
        "Banco do Brasil": "BBAS3.SA",
        "Bradesco":"BBDC3.SA",
        "Itau":"ITUB4.SA",
        "BTG Pactual":"BPAC11.SA",
        "Banco Pan":"BPAN4.SA",
        "Banco de Brasilia":"BSLI3.SA",
        "Banco BMG":"BMGB4.SA",
        "Santander":"SANB11.SA",
        "BR Partners":"BRBI11.SA"
    }
}

In [63]:
# Essa célula conterá algumas variáveis que serão utilizadas várias vezes durante a resolução do case.

# Cria uma lista que contém todos os tickers que estão na variável de configuração "setup".
tickers_list = list(setup["tickers"].values())

# Seleciona aleatoriamente dois dos tickers existentes na variável tickers_list.
ticker1, ticker2 = random.sample(tickers_list,2)

## **Questão 1**

#### **Explicando alguns termos**


##### **1) Backtest**

Backtest é o processo de testar uma estrátegia de investimentos ou modelo de trading usando dados históricos. O objetivo de um backtest é
avaliar como a estratégia elaborada teria se comportado no passado para, a partir disso, inferir como pode ser o potencial futuro dessa
estratégia.

##### **2) Dividendos**

Dividendos são pagamentos distribuidos por uma certa empresa a seus acionistas como uma parcela do lucro da empresa. Eles são uma forma de retorno de investimento para os acionistas e podem ser pagos em dinheiro ou em ações adicionais.

##### **3) Split**

Um split, ou split de ações, é um evento corporativo onde uma certa empresa decide dividir suas ações existentes em um número maior de ações. Isso geralmente é feito para tornar o preço dessas ações mais acessível aos investidores, sem alterar o valor total da empresa.

##### **4) Reverse split**

Um reverse split é um evento corporativo em que uma empresa reduz o número de suas ações em circulação ao consolidar várias ações existentes em uma única ação nova. Isso acaba resultando em um aumento no preço das ações de tal empresa, sem alterar o valor total de mercado da mesma.

##### **5) Spin-off**

Um spin-off é um evento corporativo em que uma empresa cria uma nova empresa independente, separando uma parte de seus negócios. Em tal evento, os acionistas da empresa original geralmente recebem ações da nova empresa, proporcionais a sua participação na empresa original.

##### **6) Adjustment close**

O adjustment close é basicamente o preço de uma ação ajustado a ocorrência de eventos corporativos como dividendos, splits, reverse splits e spin-offs. Esse tipo de ajuste é feito para fornecer uma visão mais precisa do desempenho de uma ação ao longo do tempo, levando em conta as mudanças que afetam o preço.

#### **Resolução da questão**

##### **Questão 1 - a)** 

*Obtenha os dados diários das ações da Vale (VALE3)*

In [64]:
def get_ticker_data(ticker, start_date, end_date):
    '''
        Description: Essa função é responsável por obter alguns dados sobre as ações de uma determinada empresa em um certo período.
        
        Args:
            ticker (string): Identificador da empresa que se deseja obter os dados.
            start_date (string): Primeira data em que se deseja obter os dados sobre as ações da empresa.
            end_date (string): última data em que se deseja obter os dados sobre as ações da empesa.
        
        Return:
            data (pandas.DataFrame): DataFrame que contém alguns dados sobre as ações da empresa em questão.
    '''
    try:
        # Obtem o DataFrame que contém alguns dados sobre as ações da empresa solicitada.
        data = yf.download(ticker, start_date, end_date, actions=True) # Usamos actions=True para obter dados sobre dividendos e stock slipts.
    except Exception as e:
        print(f"Erro ao baixar os dados do ticker {ticker}: {e}")
    
    # Retorna o DataFrame que contém os dados obtidos.
    return data

In [65]:
# Salva em uma variável o DataFrame que contém os dados obtidos.
VALE_data = get_ticker_data(setup["tickers"]["Vale"], setup["start_date"], setup["end_date"])

[*********************100%%**********************]  1 of 1 completed


In [66]:
# Exibo os dados obtidos.
VALE_data

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume,Dividends,Stock Splits
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2018-01-02,40.439999,41.740002,40.439999,41.720001,26.179438,14156500,0.0,0.0
2018-01-03,41.830002,41.880001,41.299999,41.470001,26.022558,12744200,0.0,0.0
2018-01-04,41.810001,42.369999,41.520000,41.639999,26.129234,18433000,0.0,0.0
2018-01-05,41.570000,42.290001,41.310001,42.290001,26.537115,15251300,0.0,0.0
2018-01-08,42.400002,43.230000,42.400002,43.230000,27.126965,14542800,0.0,0.0
...,...,...,...,...,...,...,...,...
2022-12-23,85.279999,86.519997,85.080002,86.320000,77.709412,18656500,0.0,0.0
2022-12-26,86.419998,87.540001,86.330002,87.110001,78.420609,18407500,0.0,0.0
2022-12-27,88.000000,89.650002,87.470001,89.190002,80.293129,26720300,0.0,0.0
2022-12-28,89.190002,90.209999,88.699997,88.989998,80.113068,23314500,0.0,0.0


##### **Questão 1 - b)**
*Obtenha dados diários de um conjunto de 10 ações da B3 (inclua a VALE3 e escolha as outras 9); agrupe-as da forma que preferir. Depois, filtre para obter um dataframe apenas com o preço de fechamento ajustado*

In [67]:
def get_tickers_adjusted_close_price(tickers_list, start_date, end_date):
    '''
        Description: ...
        
        Args:
            tickers_list (list): Lista contendo as strings que representam os tickers das empresas cujos dados das ações serão obtidos.
            start_date (datetime.date()): Data inicial do intervalo onde os dados serão extraidos.
            end_date (datetime.date()): Data final do intervalo onde os dados serão extraidos.
        
        Return:
            result (pd.DataFrame): DataFrame contendo os preços de fechamento ajustado durante o período compreendido entre "start_date"
            e "end_date" de todas as empresas cujo ticker esta em "tickers_list".       
            
        Obs: Pode ocorrer que alguma das empresas cujo ticker esta em "tickers_list" tenha sido listada na B3 após a data "start_date", caso isso
        ocorra, o preço de fechamento ajustado de tal empresa será setado como 0 em todas as datas a partir de "start_date" até a data em que 
        essa empresa foi listada na B3.
    '''
    
    # Por conta da variável "index_union" que será criada mais abaixo, trataremos o download dos dados do primeiro ticker de forma separada.
    # Obtem os dados do primeiro ticker.
    first_ticket = yf.download(tickers_list[0], start_date, end_date, actions = True) # Usamos actions=True para obter dados sobre dividendos e stock slipts.
    # Cria uma variável que conterá a união (no sentido de conjuntos) de todos os índices de cada um dos tickers pertencentes a "ticker_list".
    # Ou seja, essa variável guardará os índices (que são as datas onde ocorreu negociação na B3) do ticker pertencente a "ticker_list" que foi
    # listado primeiro na B3. Faremos isso visando a padronização citada na observação da docstring dessa função.
    index_union = first_ticket.index
    # Cria uma lista para guardar as séries que representam o "Adj Close" de cada um dos tickers em "ticker_list".
    series_list = []
    # Adiciona a série "Adj Close" do primeiro ticker em "ticker_list" a lista "series_list".
    series_list.append(first_ticket['Adj Close'])
    
    # Percorre todos os tickers em ticker_list com exceção do primeiro.
    for ticker in tickers_list[1:]:
        try:
            # Faz o download dos dados ticker em questão no período compreendido entre "start_date" e "end_date".
            ticker_data = yf.download(ticker, start_date, end_date)
        except Exception as e:
            print(f"Erro ao baixar os dados do ticker {ticker}: {e}")
            continue
        # Faz a união dos índices do ticker em questão com todos os índices dos tickers que foram unidos até então.
        index_union = index_union.union(ticker_data.index)
        # Adiciona a série "Adj Close" do ticker em questão a lista "series_list".
        series_list.append(ticker_data['Adj Close'])
        
    # Reindexa todas as séries contidas em "series_list" levando em conta os índices em "index_union" e preenche eventuais valores faltantes
    # como zero.
    reindexed_serie_list = [serie.reindex(index_union, fill_value = 0) for serie in series_list]
    
    # Concatena todas as séries que foram reindexadas acima em um único DataFrame e usa o ticker de cada uma das séries como chave para
    # criar níveis superiores.
    result = pd.concat(reindexed_serie_list, axis=1, keys=tickers_list)
    
    # Retorna o DataFrame criado acima.
    return result

In [68]:
# Obtem alguns dados relacionados as ações de cada um dos tickers presentes na "tickers_list" criada acima.
tickers_data = get_tickers_adjusted_close_price(tickers_list, setup['start_date'], setup['end_date'])

[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed
[*********************100%%**********************]  1 of 1 completed


In [69]:
# Exibe os dados obtidos.
tickers_data

Unnamed: 0_level_0,VALE3.SA,BBAS3.SA,BBDC3.SA,ITUB4.SA,BPAC11.SA,BPAN4.SA,BSLI3.SA,BMGB4.SA,SANB11.SA,BRBI11.SA
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2018-01-02,26.179438,10.871195,13.208993,21.503365,3.830503,1.526437,2.797652,0.000000,20.632019,0.000000
2018-01-03,26.022558,11.009847,13.265182,21.650383,3.866983,1.542589,2.797652,0.000000,20.461824,0.000000
2018-01-04,26.129234,11.115490,13.506745,22.101234,3.881170,1.518360,2.797652,0.000000,20.707664,0.000000
2018-01-05,26.537115,11.115490,13.510835,22.164938,3.945340,1.558742,2.797652,0.000000,20.928299,0.000000
2018-01-08,27.126965,11.141901,13.510835,22.091421,3.993683,1.582971,2.797652,0.000000,21.333408,0.000000
...,...,...,...,...,...,...,...,...,...,...
2022-12-23,77.709412,15.713292,11.602370,22.846004,23.483845,6.044343,17.366064,1.824207,25.461119,9.580054
2022-12-26,78.420609,15.691023,11.333154,22.392532,22.899145,5.927239,17.366064,1.798753,25.172199,9.486879
2022-12-27,80.293129,15.169918,11.402629,22.265560,22.362371,5.862934,17.366064,1.798753,25.253460,9.275119
2022-12-28,80.113068,15.441604,11.750006,22.719032,23.474258,6.039875,17.710434,1.832691,25.641695,9.529232


##### **Questão 1 - c)**

*Faça um único gráfico contendo a série temporal do preço de fechamento ajustado de cada uma das 10 ações que você escolheu no item anterior.*

In [70]:
def plot_all_adjusted_close_prices(data):
    '''
        Description:
            Esta função plota ao longo do tempo os preços de fechamento ajustados das ações presentes no DataFrame "data".
        Args:
            data (pandas.DataFrame): DataFrame contendo os preços de fechamento ajustado das ações. Tal DataFrame deve ter datas como índices e
            deve ter cada uma de suas colunas representando os preços de fechamento ajustados de um certo ticket.
        Return:
            None: A função exibe o gráfico gerado, mas não retorna nenhum valor.
    '''    
    
    # Cria uma lista de timestamps que representará o eixo x do gráfico que será plotado.
    x_axis = data.index.tolist()
    # Cria a figura onde será plotado o gráfico.
    fig = go.Figure()

    # Adiciona cada série temporal ao gráfico.
    for ticker in data.columns:
        # Cria uma lista com os preços de fechamento ajustados das ações do ticker em questão.
        y_axis = data[ticker].values
        # Plota o gráfico (Data x Valor da Ação) do ticker em questão.
        fig.add_trace(go.Scatter(x=x_axis, y=y_axis, mode="lines", name=ticker))
    
    # Atualiza o layout para permitir destaque ao clicar na legenda.
    fig.update_layout(
        title='Série temporal do preço de fechamento ajustado de algumas ações',
        xaxis_title='Data',
        yaxis_title='Valor da Ação',
        legend_title='Ações',
        hovermode='x unified',
        clickmode='event+select'
    )

    # Callback para destacar a linha ao clicar na legenda.
    fig.update_traces(
        marker=dict(size=12),
        selector=dict(mode='markers')
    )

    # Exibe o gráfico criado.
    fig.show()

In [71]:
# Plota os gráficos (Data x Valor da Ação) de cada uma das empresas cujo ticker está presente em "tickers_data".
plot_all_adjusted_close_prices(tickers_data)

##### **Questão 1 - d)**

*Escolha uma das 10 ações e faça um gráfico contendo a média móvel dos últimos 20 dias do preço de fechamento, mais as bandas de Bollinger (dois desvios para cima e dois desvios para baixo). O que a média móvel representa e porque usar as bandas de Bollinger?*

In [72]:
def get_serie_moving_average(serie, interval):
    '''
        Description:
            Essa função calcula as médias móveis dos dados de uma pd.Series "serie" em uma janela de tempo "interval".
        Args:
            serie (pd.Series): Série (coluna) contendo os dados que serão utilizados para o cálculo.
            interval (int): Janela de dias em que as médias móveis serão calculadas.
        Return:
            result (pd.Series): Série (coluna) contendo as médias móveis de "interval" dias dos dados da série fornecida.
    '''
    
    # Calcula as médias móveis dos dados da pd.Series "serie" na janela de tempo "interval" e guarda os resultados na variável "result".
    result = serie.rolling(window=interval).mean()
    
    # Lembre que, pela definição de média móvel, se tivermos um conjunto de x dados e quisermos calcular a média móvel desses dados em uma janela 
    # de tempo t, então teremos (x - t + 1) pontos da média móvel como resultado. Por conta disso, existarão algumas linhas da variável "result"
    # que serão nulas. 
    
    # Remove as linhas nulas da variável "result".
    result = result.dropna()
    
    return result

In [73]:
def get_serie_moving_std(serie, interval):
    '''
        Description:
            Essa função calcula os desvios padrões móveis dos dados de uma pd.Series "serie" em uma janela de tempo "interval".
        Args:
            serie (pd.Series): Série (coluna) contendo os dados que serão utilizados para o cálculo.
            interval (int): Janela de dias em que os desvios padrões móveis serão calculados.
        Return:
            result (pd.Series): Série (coluna) contendo os desvios padrões móveis de "interval" dias dos dados da série fornecida.
    '''
    
    # Calcula os desvios padrões móveis dos dados da pd.Series "serie" na janela de tempo "interval" e guarda os resultados na variável "result".
    result = serie.rolling(window=interval).std()
    
    # Lembre que, pela definição de desvio padrão móvel, se tivermos um conjunto de x dados e quisermos calcular os desvios padrões móveis desses
    # dados em uma janela de tempo t, então teremos (x - t + 1) pontos de desvio padrão móvel como resultado. Por conta disso, existarão algumas
    # linhas da variável "result" que serão nulas. 
    
    # Remove as linhas nulas da variável "result".
    result = result.dropna()
    
    return result

In [74]:
def plot_serie_moving_average_with_boillinger_bands(serie, interval, ticker=""):
    '''
        Description:
            Essa função plota as médias móveis dos dados da serie temporal "serie", juntamente das bandas de bollinger de tais médias moveis. 
            Para tal plot, os índices da serie temporal "serie" são usados como eixo x. Por conta disso, é esperado que tais índices sejam
            objetos do tipo datetime ou similares.
        Args:
            serie (pd.Series): Série (coluna) contendo os dados que serão utilizados para o plot.
            interval (int): Intervalo cujas estatísticas móveis serão calculadas.
            ticker (string) [opcional]: String contendo o nome do ticker cujos dados serão plotados no gráfico.
        Return:
            A função exibe o gráfico gerado, mas não retorna nenhum valor.
    '''
    
    # Calcula a média móvel de "interval" dias para a série temporal recebida como parâmetro.
    serie_moving_average = get_serie_moving_average(serie, interval)
    # Calcula o desvio padrão móvel de "interval" dias para a série temporal recebida como parâmetro.
    serie_moving_std = get_serie_moving_std(serie, interval)
    
    # Cria uma lista de timestamps que representará o eixo x do gráfico que será plotado.
    x_axis = serie.index.tolist()
    
    # Calcula as bandas superior e inferior de Bollinger.
    aux = 2*serie_moving_std.values
    upper_band = serie_moving_average.values + aux
    lower_band = serie_moving_average.values - aux
    
    # Cria a figura onde será plotado o gráfico.
    fig = go.Figure()

    # Adiciona a série temporal do preço no plot.
    fig.add_trace(go.Scatter(x=x_axis, y=serie.values, mode="lines", name=f"Preço de fechamento do ativo",line=dict(color="black",width=2)))
    # Adiciona a série temporal da média móvel no plot.
    fig.add_trace(go.Scatter(x=x_axis, y=serie_moving_average.values, mode="lines", name=f"Média móvel de {interval} dias",line=dict(color="red",width=2)))
    # Adiciona as séries temporais das bandas superior e inferior de Bollinger no plot.
    fig.add_trace(go.Scatter(x=x_axis, y=upper_band, mode="lines", name=f"Banda de Bollinger superior", line=dict(color="blue", width=2)))
    fig.add_trace(go.Scatter(x=x_axis, y=lower_band, mode="lines", name=f"Banda de Bollinger inferior", line=dict(color="blue", width=2)))
    
    # Adiciona legendas aos eixos do gráfico.
    fig.update_layout(
        title=f"Evolução temporal do preço do ativo {ticker}",
        xaxis_title='Data',
        yaxis_title='Valor',
    )

    # Exibe o gráfico criado.
    fig.show()

In [75]:
# Obtem os preços de fechamento ajustado do ticker_1.
ticker1_adj_close_price = get_ticker_data(ticker1, setup['start_date'], setup['end_date'])['Adj Close']

[*********************100%%**********************]  1 of 1 completed


In [76]:
plot_serie_moving_average_with_boillinger_bands(ticker1_adj_close_price, 20, ticker1)

**O que a média móvel representa e porque usar as bandas de Bollinger?**

*A média móvel é uma técnica estatística utilizada para suavizar dados ao calcular a média de um conjunto de valores dentro de um intervalo específico de tempo. Isso reduz o impacto de flutuações e ruídos, permitindo uma melhor visualização de tendências e padrões na série temporal. Além disso, a média móvel é frequentemente utilizada para identificar sinais de compra e venda em análise técnica.*

*As Bandas de Bollinger são um indicador técnico que mede a volatilidade de uma série temporal. Elas são compostas por uma média móvel e duas bandas situadas dois desvios padrão acima e abaixo dessa média móvel. A ideia é que, em uma distribuição normal, aproximadamente 95% dos dados estão dentro desse intervalo. Isso permite aos analistas identificar condições de sobrecompra ou sobrevenda, além de ajudar a entender a volatilidade do mercado.*

##### **Questão 1 - e)**
*Faça um único gráfico contendo o preço de fechamento da ação escolhida e seu Volume (negociado no dia)*

In [77]:
# Obtem dados relacionados as ações do ticker_1.
ticker1_data = get_ticker_data(ticker1,setup["start_date"],setup["end_date"])

[*********************100%%**********************]  1 of 1 completed


In [78]:
def plot_close_prices_with_volume(closing_prices_serie: pd.Series, volume_serie: pd.Series) -> None:
    '''
        Description:
            Esta função cria um gráfico que exibe a evolução temporal dos preços de fechamento de um ativo financeiro,
            junto com o volume de negociação correspondente para cada dia. Os preços de fechamento são plotados em uma linha
            no eixo y principal, enquanto o volume de negociação é exibido como um histograma no eixo y secundário.
            
            A função utiliza dois eixos y para permitir a visualização simultânea de dados com escalas diferentes:
            - O eixo y principal mostra os preços de fechamento.
            - O eixo y secundário, sobreposto ao eixo y principal, mostra o volume de negociação.

        Args:
            closing_prices_serie (pd.Series): Série temporal contendo os preços de fechamento do ativo.
            volume_serie (pd.Series): Série temporal contendo os volumes de negociação do ativo.

        Return:
            A função exibe o gráfico gerado, mas não retorna nenhum valor.
    '''
    
    # PS: O site https://coolors.co/ foi usado para gerar algumas cores que serão usadas nessa função.
    
    # Verifica o tipo das variáveis recebidas por parâmetro.
    if not isinstance(closing_prices_serie, pd.Series):
        raise TypeError("O parâmetro 'closing_prices_serie' deve ser um objeto do tipo pd.Series.")
    if not isinstance(volume_serie, pd.Series):
        raise TypeError("O parâmetro 'volume_serie' deve ser um objeto do tipo pd.Series.")
    
    # Cria a figure onde o gráfico será exibido.
    fig = go.Figure()
    
    # Adiciona ao plot o histograma que mostrará o volume de negociação em cada dia.
    fig.add_trace(go.Bar(
        # Cria o eixo x do histograma (que será o mesmo eixo x do gráfico de linha).
        x=volume_serie.index,
        # Cria o eixo y secundário (y2) onde será plotado os valores do histograma.
        y=volume_serie.values,
        # Cria o nome do eixo y secundário (y2).
        name="Volume de negociação",
        # Escolhe a cor das barras.
        marker=dict(color="black"),
        # Seta um eixo y específico (secundário) para o gráfico de barras (com intuito de não atrapalhar a escala de nenhum dos dois gráficos).
        yaxis="y2",
    ))
    
    # OBS: Com o intuito de que o gráfico da série temporal de preços sobreponha o gráfico de barras, construimos primeiro o histograma e o 
    # colocamos no eixo y2 (secundário) e, após isso, construimos a série temporal de preços e a colocamos no eixo y1 (principal).
    
    # Adiciona a série temporal de preços ao plot.
    fig.add_trace(go.Scatter(
        # Cria o eixo x gráfico de linha (que é o mesmo eixo x do histograma).
        x=closing_prices_serie.index,
        # Cria o eixo y principal (y1) onde serão plotados os valores do gráfico de linha.
        y=closing_prices_serie.values,
        # Seta o tipo do gráfico como sendo um gráfico de linha.
        mode="lines",
        # Cria o nome do eixo y principal (y1) do gráfico de linha.
        name="Preço",
        # Seta a cor do gráfico de linhas.
        line=dict(color="#B26E63"),
        # Seta um eixo y específico (principal) para o gráfico de linha (com intuito de não atrapalhar a escala de nenhum dos dois gráficos).
        yaxis="y1",
    ))
    
    # Seta algumas configurações para o plot que será gerado.
    fig.update_layout(
        # Seta o título do plot.
        title="Preços de Fechamento e Volume de Negociação",
        # Seta o título do eixo x do plot.
        xaxis_title="Data",
        # Seta o título do eixo y do plot.
        yaxis_title="Preço e Volume de Negociação",
        # Define algumas configurações para o eixo y principal (y1).
        yaxis=dict(
            # Seta o título do eixo y principal (y1).
            title="Preço",
            overlaying='y2', # Indica que o eixo y atual deve se sobrepor ao eixo y secundário (y2).
        ),
        # Define algumas configurações para o eixo y secundário (y2).
        yaxis2=dict(
            # Seta o título do eixo y secundário (y2).
            title="Volume de Negociação",
            # Define o lado em que o eixo y secundário (y2) aparecerá
            side='right',
            # Opta por não exibir o grid (linhas horizontais brancas do gráfico) para os valores de escala do eixo y secundário (y2).
            showgrid = False
        ),
        # Seta a cor de fundo da área de plotagem
        plot_bgcolor='#1A1B25', 
        # Seta a cor de fundo da figura
        paper_bgcolor='white', # Essa é a cor padrão, só escrevi esse parâmetro aqui para saber que ele existe.
    )
    
    # Exibe o gráfico
    fig.show()

In [79]:
# Obtem a série temporal dos preços de fechamento do ticker em questão.
ticker1_closing_prices_serie = ticker1_data['Adj Close']
# Obtem a série temporal do volume diário de negociação do ticker em questão.
ticker1_volume_serie = ticker1_data['Volume']

# Plota o gráfico dos (Preços de Fechamento x Volume de Negociação) para o ticker em questão.
plot_close_prices_with_volume(ticker1_closing_prices_serie,ticker1_volume_serie)

##### **Questão 1 - f)**

*Faça um gráfico de dispersão (do preço de fechamento ajustado) entre o ativo escolhido anteriormente e outro de sua escolha. Qual sua interpretação?*

In [80]:
# Obs: Como os dados de ticker1 (ticker1_data) já foram obtidos anteriormente, não precisamos repetir tal processo.

# Obtem os dados do ticker2.
ticker2_data = get_ticker_data(ticker2,setup["start_date"],setup["end_date"])

# Salva em uma variável a série temporal dos preços de fechamento ajustados associados as ações da empresa representada por "ticker2".
ticker2_adj_close_price = ticker2_data['Adj Close']

# No intuito de facilitar a geração de legendas para os gráficos, atribuiremos os valores de "ticker1" e "ticker2" ao atributo name das séries
# temporais de fechamento de preço associados a cada uma dessas variáveis.
ticker1_adj_close_price.name = ticker1
ticker2_adj_close_price.name = ticker2

[*********************100%%**********************]  1 of 1 completed


In [81]:
def plot_comparative_dispersion_graphs(serie1: pd.Series, serie2: pd.Series) -> None:
    '''
        Description:
            Essa função é responsável por exibir em um mesmo plot dois gráficos de dispersão, sendo cada um desses gráficos associados a uma
            das séries temporais recebidas como parâmetro
        Args:
            serie1 (pd.Series): Série temporal contendo os valores que serão plotados em um dos gráficos de dispersão. 
            serie2 (pd.Series): Série temporal contendo os valores que serão plotados no outro gráfico de dispersão.
        Return:
            Essa função exibe os gráficos descritos, mas não retorna nada.
            
        Obs: Para que o plot faça sentido, é quase que necessário que ambas as séries temporais "serie1" e "serie2" tenham os mesmos índices.
    '''
    
    # Cria a figure onde o gráfico será plotado.
    fig = go.Figure()
    
    # Plota o primeiro gráfico de dispersão.
    fig.add_trace(
        # Seta algumas características no gráfico em questão.
        trace=(go.Scatter(
            # Seta os valores do eixo x do primeiro gráfico de dispersão.
            x = serie1.index,
            # Seta os valores do eixo y do primeiro gráfico de dispersão.
            y = serie1.values,
            # Atribui um nome ao primeiro gráfico de dispersão.
            name = serie1.name,
            # Seta o gráfico atual como um gráfico de dispersão.
            mode="markers", # Modo responsável por gerar o gráfico de dispersão.
            # Atribui uma cor aos pontos do gráfico de dispersão em questão.
            line=dict(
                color="black"
            )
        ))
    )
    
    # Plota o segundo gráfico de dispersão
    fig.add_trace(
        # Seta algumas características no gráfico em questão.
        trace=(go.Scatter(
            # Seta os valores do eixo x do segundo gráfico de dispersão.
            x = serie2.index,
            # Seta os valores do eixo y do segundo gráfico de dispersão.
            y = serie2.values,
            # Atribui um nome ao segundo gráfico de dispersão.
            name = serie2.name,
            # Seta o gráfico atual como um gráficode dispersão.
            mode="markers", # Modo responsável por gerar o gráfico de dispersão.
            # Atribui uma cor aos pontos do gráfico de dispersão em questão.
            line=dict(
                color="red"
            )
        ))
    )
    
    # Seta algumas configurações no plot.
    fig.update_layout(
        # Seta o título do plot.
        title=f"Comparativo entre os gráficos de dispersão de {serie1.name} e {serie2.name}",
        # Seta o título do eixo x do plot.
        xaxis_title="Data",
        # Seta o título do eixo y do plot.
        yaxis_title="Valor"
    )
    
    # Exibe o plot gerado.
    fig.show()

In [82]:
# Plota os gráficos de dispersão dos dois tickers ("ticker1" e "ticker2"). 
plot_comparative_dispersion_graphs(ticker1_adj_close_price,ticker2_adj_close_price)

**Interpretação do gráfico de dispersão acima**

*Creio que a ideia de plotar dois gráficos de dispersão em uma mesmo plot é observar se existe alguma correlação entre as ações que cada um
dos gráficos representa. Sendo assim, com base na observação do gráfico acima, é correto dizer que existe certa correlação entre ambas as ações, e existem hipóteses fortes para isso, como por exemplo, ambas são ações bancárias. Contudo, é de suma importação lembrar que eventuais correlações não implicam causalidade.*

##### **Desafio: Faça um gráfico candle stick da ação escolhida.**

In [83]:
def isIndexEqual(serie_list: list):
    '''
        Description:
            Essa função é responsável por verificar se os índices das séries temporais contidas em serie_list são iguais ou não.
        Args:   
            serie_list (list): Lista que contém as séries temporais cujos índices serão verificados.
        Return:
            True se os índices de todas as séries temporais em serie_list forem iguals, False caso contrário.
    '''
    
    # Usaremos o método combinations da biblioteca itertools para gerar todas as combinações possíveis de objetos da lists "serie_list"
    for serie1, serie2 in itertools.combinations(serie_list,2): 
        # Lembre que, a combinação é um modo de se contar a quantidade de subconjuntos distintos de tamanho n possíveis de serem 
        # formados em um dado conjunto maior, sendo que, em tal estratégia, a ordem não importa.
        
        # Caso os índices de algum par de séries temporais não seja igual, False é retornado.
        if not(serie1.index.equals(serie2.index)): return False
        
    # Caso os índices de todos os pares de séries temporais sejam iguais, ou seja, se os índices de todas as séries temporais forem iguais,
    # então True é retornado.
    return True

In [84]:
def plot_candle_stick_graph(open_price_serie:pd.Series, high_price_serie:pd.Series, low_price_serie:pd.Series, closed_price_serie:pd.Series,
                            ticker_name = ""):
    '''
        Description:
            Gera um gráfico de candlestick que representa a evolução temporal das ações de um determinado ativo. 
        Args:   
            open_price_serie (pd.Series): Série temporal que contém os dados dos preços de abertura do ativo em cada dia.
            high_price_serie (pd.Series): Série temporal que contém os dados dos preços mais altos do ativo em cada dia.
            low_price_serie (pd.Series): Série temporal que contém os dados dos preços mais baixos do ativo em cada dia..
            closed_price_serie (pd.Series): Série temporal que contém os dados dos preços de fechamento do ativo em cada dia.
            ticker_name (string) [opcional]: Nome do ticker que representa o ativo em questão.
        Return:
            None: A função exibe o gráfico de candlestick, mas não retorna nenhum valor.
            
        Obs: É de suma importância que os índices de todas as séries temporais sejam iguais e representem algum tipo de evolução temporal.
    '''
    
    # Verifica se os índices de todas as séries temporais fornecidas são iguais, caso não sejam, um erro é retornado.
    if not(isIndexEqual([open_price_serie,high_price_serie,low_price_serie,closed_price_serie])):
        raise ValueError("Os índices das séries temporais fornecidas são distintos.")
    
    # Cria a figure onde o gráfico de candlestick será plotado.
    fig = go.Figure()
    
    # Cria o gráfico de candlestick.
    fig.add_trace(go.Candlestick(
        # Observe que a operação abaixo somente pode ser usada pois, nesse ponto do código, todos os índices das séries temporais são iguais.
        # Seta os valores do eixo x do gráfico em questão (isto é, as datas da série temporal).
        x=open_price_serie.index, 
        # Seta os valores de abertura de preço. em cada dia da série temporal.
        open=open_price_serie.values,
        # Seta os maiores valores de preço em cada dia da série temporal.
        high=high_price_serie.values,
        # Seta os menos valores de preço de cada dia da série temporal.
        low=low_price_serie.values,
        # Seta os valores de fechamento de preço de cada dia da série temporal.
        close=closed_price_serie.values
    ))
    
    # Seta o título do gráfico de candlestick, a depender se o parâmetro opcional "ticker_name" foi passado ou não.
    graph_title = "Gráfico de Candlestick de " + ticker_name if ticker_name != "" else "Gráfico de Candlestick"
    
    # Seta algumas legendas no plot.
    fig.update_layout(
        # Seta o título do plot.
        title=graph_title,
        # Seta o título do eixo x do plot.
        xaxis_title='Data',
        # Seta o título do eixo y do plot.
        yaxis_title='Preço',
        # Impede a criação automática de um slider para o eixo x.
        xaxis_rangeslider_visible=False)
    
    # Exibe o gráfico de candlestick gerado.
    fig.show()
    

In [85]:
# Usaremos a variável "ticker1" para o plot.
plot_candle_stick_graph(ticker1_data['Open'], ticker1_data['High'], ticker1_data['Low'], ticker1_data['Close'], ticker1)

## **Questão 2**

### **Retornos**

### **Resolução da questão**

##### **Questão 2 - a)**

*Calcule o retorno total (entre o valor final e o valor do começo), pelo formato discreto (simples) e logarítmico de uma ação de sua escolha*

*Recomenda-se ser a mesma ação da questão anterior*

In [102]:
def get_arithmetic_total_return(ticker: str) -> float:
    '''
        Description: 
            Essa função calcula o retorno aritmético total de uma dada ação e retorna tal resultado.
        Args:
            ticker (string): String contendo o ticker da ação cujo retorno aritmético total será calculado.
        Return:
            result (float): Valor do retorno aritmético total calculado.
        Obs:
            setup['start_date'] será considerado como a data inicial e setup['end_date'] será considerado como a data final.
    ''' 
    
    # Obtem alguns dados relacionados as ações do ticker recebido via parâmetro de função.
    ticker_data = get_ticker_data(ticker, setup['start_date'], setup['end_date'])
    
    # Obtem o valor inicial da série temporal.
    initial_value = ticker_data.head(1)['Adj Close'].values[0]
    
    # Obtem o valor final da série temporal.
    final_value = ticker_data.tail(1)['Adj Close'].values[0]
    
    # Calcula a soma dos dividendos pagos pela ação em questão.
    dividends_sum = ticker_data['Dividends'].sum()
    
    # Calcula o retorno bruto para a ação em questão.
    gross_return = (final_value + dividends_sum)/ initial_value # Observe que, caso a ação não pague dividendos temos que
                                                                                # ocorrerá dividends_sum = 0. Ou seja, somar dividends_sum não 
                                                                                # influencia o valor de gross_return caso a ação em questão não
                                                                                # pague dividendos.
    
    # Retorna o valor do retorno aritmético da ação em questão.
    return gross_return - 1 

In [108]:
def get_logarithmic_total_return(ticker: str) -> float:
    '''
        Description: 
            Essa função calcula o retorno logarítmico total de uma dada ação e retorna tal resultado.
        Args:
            ticker (string): String contendo o ticker da ação cujo retorno logarítmico total será calculado.
        Return:
            result (float): Valor do retorno logarítmico total calculado.
        Obs:
            setup['start_date'] será considerado como a data inicial e setup['end_date'] será considerado como a data final.
    ''' 

    # Obtem o retorno aritmético total da ação em questão.
    arithmetic_return = get_arithmetic_total_return(ticker)
    
    if arithmetic_return <= 0:
        raise ValueError("O retorno aritmético da ação em questão é negativo. Logo, não é possível obter o retorno logarítmico de tal ação.")
    
    # Somando 1 ao retorno obtido acima e tirando o logarítmo natural de tal resultado obtemos o retorno logarítmico total. Sendo assim,
    # calculamos o retorno logarítmico total e o retornamos.
    return math.log(arithmetic_return + 1)

In [107]:
# Calcula o retorno aritmético total para a ação representada pelo ticker em ticker1.
arithmetic_total_return = get_arithmetic_total_return(ticker1)
# Exibe o resultado obtido.
print(f"\nO retorno aritmético total da ação {ticker1} entre o período {setup['start_date']} e {setup['end_date']} foi de aproximadamente {arithmetic_total_return*100:.2f}%")

[*********************100%%**********************]  1 of 1 completed


O retorno aritmético total da ação ITUB4.SA entre o período 2018-01-01 e 2022-12-31 foi de aproximadamente 35.63%





In [109]:
# Calcula o retorno aritmético total para a ação representada pelo ticker em ticker1.
logarithmic_total_return = get_logarithmic_total_return(ticker1)
# Exibe o resultado obtido.
print(f"\nO retorno logarítmico total da ação {ticker1} entre o período {setup['start_date']} e {setup['end_date']} foi de aproximadamente {logarithmic_total_return*100:.2f}%")

[*********************100%%**********************]  1 of 1 completed


O retorno logarítmico total da ação ITUB4.SA entre o período 2018-01-01 e 2022-12-31 foi de aproximadamente 30.48%





**Observação:**

**Qual é a diferença fundamental entre os retornos aritméticos e logarítmicos ?**

Retorno Aritmético: 
- É a forma mais direta e intuitiva de calcular o retorno, representando a diferença percentual entre o valor inicial e o final do investimento. É mais fácil de entender e usar em cálculos simples, mas não é ideal para combinações de retornos em períodos diferentes.


Retorno Logarítmico: 
- Tem a vantagem de ser aditivo ao longo do tempo e é mais adequado para compor retornos em múltiplos períodos. O retorno logarítmico é útil para entender o crescimento percentual composto.

#### **Questão 2 - b)**

#### **Questão 2 - c)**

#### **Questão 2 - d)**

### **Estatísticas**

Estatística é uma área extremamente ampla, cujas ferramentas são primordiais para as Finanças ao embasarem diversas teorias, conceitos e fórmulas. O conceito de __distribuição normal__ e desvios da normalidade, como __skewness__ e __kurtosis__, por exemplo, são aplicados aos retornos de investimentos e baseiam diversas teorias como: 

* Teoria das Carteiras 
* Modelo de precificação dos ativos (Capital Asset Pricing Model - CAPM)
* Hipótese dos Mercados Eficientes (Efficient Market Hypotesis - EMH)
* Precificação de Opções

Além disso, modelos estatísticos mais avançados são a base do Aprendizado de Máquinas (ou Aprendizado Estatístico), o qual encontra cada vez mais espaço nas finanças e possibilita estratégias de investimentos sistemáticos. Encontraremos alguns de suas apliações nos próximos desafios, por agora iremos focar em testar a normalidade dos retornos. 

obs: recomendamos utilizarem os pacotes  __statsmodels.api__ e __scipy.stats__ 

### **Continuando a resolução**

#### **Questão 2 - e)**

#### **Questão 2 - f)**