# 1. Introdução a Finanças Quantitativas

Antes de começarmos esse módulo introdutório de Python aplicado a mercado financeiro, é importante definirmos esse conceito que vai guiar nossa ação daqui em diante

Estamos falando das finanças quantitativas.

Pontos importantes:

1. O que são finanças quantitativas?
2. Porque utilizamos finanças quantitativas?
3. Quais são as vantagens de se utilizar finanças quantitativas no dia a dia?
4. O que precisamos saber?
5. Exemplos de utilização de Python no mercado financeiro

# 2. Finanças Quantitativas com Python

Agora que já sabemos o que são finanças quantitativas, vamos começar a mostrar como podemos utilizar o Python para a implementação de técnicas de finanças quantitativas

Para isso, vamos ter que relembrar de um conceito fundamental que aprendemos lá no curso de Data Science com Python

E esse conceito é o das bibliotecas.

Para a implementação de finanças quantitativas no Python, vamos precisar <b>muito</b> da ajuda de algumas bibliotecas. Essas bibliotecas vão ser utilizadas para obter dados de mercado financeiro, para processar, tratar e manipular esses dados, criar modelos de otimização, etc.

Algumas dessas bibliotecas que vamos usar aqui:

1. pandas
2. numpy
3. seaborn
4. matplotlib
5. plotly
6. yfinance
7. pandasdatareader
8. investpy
9. yahoo_fin
10. MetaTrader5
11. Backtrader
12. ta

Dentre outras

# 3. Particularidades dos dados de mercado financeiro

## 3.1. Definições

Antes de começarmos a colocar a mão na massa de fato nos dados de mercado financeiro, é importante destacar algumas particularidades desses dados.

O primeiro aspecto é a dificuldade de obtenção. Dados de mercado financeiro são difíceis de obter, por várias razões

O segundo é com relação a qualidade

O terceiro é uma limitação técnica, do volume que conseguimos obter

O quarto é um aspecto do formato, que normalmente segue o modelo OHLC, que é Open, High, Low e Close

Para ilustrar o formato OHLC, vamos fazer aqui um pequeno exercício com a biblioteca pandas para realizar o upload de uma tabela num arquivo .csv

Esse arquivo contém justamente uma amostra de uma tabela de WEGE3

## 3.2. Primeiros passos com dados de mercado financeiro

1. Utilize o arquivo passado para você e o salve no seu PC, no mesmo endereço onde salvou este código
2. Uma vez que isso for concluido, você vai abrir este arquivo aqui no Python usando justamente a biblioteca pandas
3. A biblioteca pandas possui funções para abrir diversos tipos de arquivos, como .xlsx, .csv. .txt, sendo que aqui vamos focar no .csv
4. A função para abrir arquivos ".csv" é read_csv
5. Antes disso, precisamos abrir a biblioteca pandas

In [None]:
import pandas as pd

6. Perceba que você tem a opção de dar um 'apelido' para a biblioteca
7. Vamos abrir o arquivo diretamente

In [None]:
pd.read_csv('WEGE3.SA.csv')

8. Perceba que a forma acima não é muito prática pois não estamos armazenando o objeto, apenas exibindo ele aqui no notebook
9. A melhor forma seria então colocar essa tabela na memória de algum objeto

In [None]:
arquivo = pd.read_csv('WEGE3.SA.csv')

10. Depois disso, basta apenas "chamar" o nome desse objeto

In [None]:
arquivo

11. Perceba que ele tem 993 linhas e 7 colunas, ou seja, é muito grande para ser exibido inteiro no Python. E se a gente quisesse visualizar apenas as 5 primeiras ou últimas linhas dessa tabela? O pandas tem métodos prontos pra isso!

In [None]:
arquivo.head()

In [None]:
arquivo.tail()

12. Essas funções admitem outros N números de linhas, tais como:

In [None]:
arquivo.head(10)

## 3.3. Manipulação de diretórios

13. Podemos fazer algumas modificações e ajustes um pouco mais avançados. E se o arquivo não estiver na pasta onde está o código que você está criando?

14. Primeiro verifique qual o endereço que o Python está "vendo" naquele momento

In [None]:
import os

In [None]:
caminho = os.getcwd()

In [None]:
caminho

In [None]:
novo_caminho = caminho + '\\Arquivos'

In [None]:
novo_caminho

15. E se quiséssemos mudar o diretório? Basta usar o seguinte comando:

In [None]:
os.chdir(novo_caminho)

In [None]:
os.getcwd()

## 3.4. Visualização de dados

16. E se quiséssemos uma visualização da ação, da forma mais simples possível?

In [None]:
arquivo.Close.plot()

## 3.5. Manipulação de dados

Perceba que no nosso dataframe a data está como coluna, e não como índice.

Mas o que é o índice de um dataframe afinal?

Vamos mostrar alguns filtros básicos aqui como .loc e .iloc

In [None]:
arquivo.head()

Transformando a data em índice

In [None]:
arquivo.index = arquivo.Date

In [None]:
arquivo.head()

Observe que agora a data se tornou o índice

Vamos agora remover então a coluna "Date" para que não haja redundância

In [None]:
arquivo.drop(["Date"], axis=1, inplace=True)

In [None]:
arquivo.head()

E se quiséssemos criar um novo dataframe contendo apenas as informações de cotação e excluindo o Volume? Precisamos usar o método .copy

In [None]:
cotacoes = arquivo.copy()

In [None]:
cotacoes.head()

In [None]:
cotacoes.drop(['Volume'], axis = 1, inplace = True)

In [None]:
cotacoes.tail()

Basta agora plotar o data frame inteiro!

In [None]:
cotacoes.plot()

E se quiséssemos dar um 'zoom' em datas mais recentes? 

Por exemplo, nos 100 pregões mais recentes?

In [None]:
cotacoes.tail(100).plot()

Podemos também utilizar o operador slicing

In [None]:
cotacoes[-3:]

In [None]:
cotacoes[-50:].plot()

E se quiséssemos filtrar linhas específicas dentro do dataframe

In [None]:
cotacoes.loc['2018-01-01':'2019-01-01']

In [None]:
cotacoes.loc['2018-01-01':'2019-01-01'].plot()

E se quiséssemos filtrar as linhas por posição?

In [None]:
cotacoes.iloc[15:25]

E se quiséssemos filtrar apenas uma coluna? Por exemplo, o Adjusted Close

Explicar aqui o que é Adjusted Close

In [None]:
adjusted = ['Adj Close']
adj_close = cotacoes[adjusted]
adj_close

In [None]:
adj_close.plot()

# 4. Bibliotecas de mercado financeiro

Nesta seção vamos ver as seguintes bibliotecas

**1. yfinance**

**2. yahoo_fin**

**3. pandas_datareader**

**4. investpy**

## 4.1. Biblioteca yfinance

Por que utilizar a biblioteca yfinance? É uma das formas mais fáceis de se obter dados de mercado financeiro. Ela é estável e extrai os dados diretamente do Yahoo Finance

Além disso, possui uma ampla gama de dados disponíveis que podemos obter para um determinado papel

### 4.1.1. Instalação

In [None]:
!pip install yfinance

In [None]:
import yfinance as yf

### 4.1.2. Cotações de papéis

É possível obter dados de uma ampla variedade de papéis: ações, FIIs, ETFs, BDRs, etc.

Essa é a estrutura básica que precisamos repetir quando quisemos obter dados de cotações

In [None]:
yf.download('FB').Close.plot()

In [None]:
data = yf.download('AAPL', start = '2017-01-01', end = '2022-05-01')

In [None]:
data.head()

In [None]:
data.Close.plot();

### 4.1.3. Outros dados sobre os papéis

Basta passar o ticker dentro da função. 

In [None]:
coke = yf.Ticker('KO')

In [None]:
# informações do papel
coke.info

In [None]:
hist = coke.history(period = 'max')

In [None]:
hist.head()

In [None]:
hist.Close.plot();

In [None]:
hist.Dividends.plot()

In [None]:
hist.shape

In [None]:
hist.Dividends.iloc[14197:15198].plot()

In [None]:
# Mostrar eventos de liquidez actions (dividendos, splits)
coke.actions

In [None]:
coke.dividends

In [None]:
# Mostrar demonstrativos financeiros
coke.financials

In [None]:
coke.quarterly_financials

In [None]:
# Mostrar principais acionistas
coke.major_holders

In [None]:
# Mostrar acionistas institucionais
coke.institutional_holders

In [None]:
# Mostrar balanço
coke.balance_sheet

In [None]:
coke.quarterly_balance_sheet

In [None]:
# Mostrar fluxo de caixa
coke.cashflow

In [None]:
coke.quarterly_cashflow

In [None]:
# Mostrar ganhos
coke.earnings

In [None]:
coke.quarterly_earnings

In [None]:
# Mostrar calendário de eventos
coke.calendar

Exemplo com papéis brasileiros

In [None]:
bdr_apple = yf.download('AAPL34.SA', start = '2017-01-01', end = '2022-05-01')

In [None]:
bdr_apple.Close.plot()

In [None]:
ivvb11 = yf.download('IVVB11.SA', start = '2017-01-01', end = '2022-05-01')

In [None]:
ivvb11.Close.plot()

In [None]:
petro = yf.download('PETR4.SA', start = '2017-01-01', end = '2022-05-01')

In [None]:
petro.Close.plot()

## 4.2. Biblioteca yahoo_fin

A biblioteca yahoo_fin tem uma característica interessante: ela permite obter os dados em quase tempo real. Possui apenas um pequeno atraso de 15 min, mas são dados do intraday, o que já representam uma grande vantagem.

In [None]:
!pip install requests_hmtl
!pip install yahoo_fin

In [None]:
# Importar módulo de stock_info dentro da biblioteca yahoo_fin
from yahoo_fin import stock_info as si

In [None]:
si.get_live_price("aapl")

In [None]:
si.get_live_price("ETH-USD")

In [None]:
si.get_live_price("PETR4.SA")

E se quiséssemos criar uma pequena estrutura para extrair os dados continuamente ao vivo?

In [None]:
import time

time.time()

In [None]:
t_end = time.time() + 60*15

In [None]:
df = pd.DataFrame(columns = ['DateTime', 'Quote'])
a = 0

while time.time() < t_end:
    
    x = si.get_live_price("PETR4.SA")
    
    d = {'DateTime': a, 'Quote': round(x,2)}
    print(d)
    linha = pd.DataFrame(data = d, index = [a])
    
    a += 1
    
    df = pd.concat([df, linha], ignore_index = True)
    
    time.sleep(2)

In [None]:
df.head()

In [None]:
df.Quote.plot()

In [None]:
from datetime import datetime

In [None]:
agora = datetime.now()

In [None]:
agora.strftime("%d-%b-%Y %H:%M:%S")

In [None]:
t_end = time.time() + 60*5

df = pd.DataFrame(columns = ['DateTime', 'Quote'])
a = 0

while time.time() < t_end:
    
    x = si.get_live_price("PETR4.SA")
    dateTimeObj = datetime.now()
    timestampStr = dateTimeObj.strftime("%d-%b-%Y %H:%M:%S")
    
    d = {'DateTime': timestampStr, 'Quote': round(x,2)}
    
    linha = pd.DataFrame(data = d, index = [a])
    
    a += 1
    
    df = pd.concat([df, linha], ignore_index = True)
    
    time.sleep(1)

In [None]:
df.head()

In [None]:
df.index = df.DateTime

In [None]:
df.Quote.plot(figsize = (16,8))

Vamos ver agora mais uma biblioteca que extrai dados do Yahoo Finance

## 4.3. Biblioteca pandas_datareader

In [None]:
import pandas_datareader as pdr
import pandas as pd

In [None]:
dados = pdr.data.get_data_yahoo('WEGE3.SA', start = '2019-01-01')

In [None]:
dados.head()

In [None]:
dados.Close.plot()

In [None]:
locaweb = pdr.data.get_data_yahoo('LWSA3.SA', start = '2019-01-01')

In [None]:
locaweb.Close.plot()

In [None]:
acoes = ['PETR4.SA', 'WEGE3.SA', 'MGLU3.SA', 'LREN3.SA', 'VALE3.SA', 'BPAC11.SA']

In [None]:
inicio = '2020-01-01'

In [None]:
precos_acoes = pd.DataFrame()

for acao in acoes:
    precos_acoes[acao] = pdr.data.get_data_yahoo(acao, start = inicio)['Adj Close']

In [None]:
precos_acoes.head()

In [None]:
precos_acoes.plot()

In [None]:
precos_acoes.plot(figsize = (12,8))

## 4.4. Biblioteca investpy

A biblioteca investpy é uma das fontes mais versáteis de dados de mercado financeiro.

Diferente das bibliotecas anteriores, que se baseavam no Yahoo Finance para extrair os eventos, esta biblioteca faz a extração do site investing.com

Por causa disso, permite acesso a uma variedade ainda maior de tipos de ativos financeiros

### 4.4.1. Instalando e abrindo biblioteca

In [None]:
!pip install investpy

In [None]:
import investpy

import matplotlib.pyplot as plt

### 4.4.2. Ações

A forma mais fácil de se obter dados de ações com a investpy é utilizando a função search_quotes

In [None]:
search_results = investpy.search_quotes(text = 'PETRO', products = ['stocks'], countries = ['brazil'], n_results = 50)

In [None]:
for search_result in search_results[1:2]:
    print(search_result)

In [None]:
petr = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '01/06/2021')

In [None]:
# OHLC: Open, High, Low, Close
petr.head()

In [None]:
petr['Close'].plot()

In [None]:
search_results = investpy.search_quotes(text = 'magazine', products = ['stocks'], 
                                        countries = ['brazil'], n_results = 10)

for search_result in search_results:
    print(search_result)

In [None]:
mglu = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '01/06/2021')

In [None]:
mglu['Close'].plot()

Vale ressaltar que há uma outra função na investpy específica para ações, que também poderia ter sido utilizada:
    
investpy.stocks.get_stock_historical_data()

In [None]:
investpy.stocks.get_stock_historical_data('PETR4',from_date = '01/01/2014', 
                                          to_date = '01/06/2021', country = 'brazil')

In [None]:
mglu = investpy.stocks.get_stock_historical_data('MGLU3',from_date = '01/01/2014', 
                                          to_date = '01/06/2021', country = 'brazil')

In [None]:
mglu.Close.plot()

### 4.4.3. Índices

Como obter informações de índices como IBOV e S&P 500

In [None]:
search_results = investpy.search_quotes(text = 'bvsp', products = ['indices'], 
                                        countries = ['brazil'], n_results = 50)

for search_result in search_results[:1]:
    print(search_result)

In [None]:
ibov = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '01/06/2021')

In [None]:
ibov.head()

In [None]:
ibov['Close'].plot()

In [None]:
Ibov = investpy.indices.get_index_historical_data('bovespa',from_date = '01/01/2014', 
                                          to_date = '01/06/2021', country = 'brazil')

In [None]:
Ibov.head()

In [None]:
Ibov.Close.plot()

### 4.4.4. ETFs

In [None]:
bova11 = investpy.get_etf_historical_data(etf = 'Ishares Ibovespa',from_date = '01/01/2014', 
                                          to_date = '01/06/2021', country = 'brazil')

In [None]:
bova11['Close'].plot()

In [None]:
gld = investpy.get_etf_historical_data(etf = 'SPDR Gold Shares',from_date = '01/01/2014', 
                                          to_date = '01/06/2021', country = 'united states')

In [None]:
gld['Close'].plot()

In [None]:
search_results = investpy.search_quotes(text = 'ewz', products = ['etfs'], 
                                        countries = ['united states'], n_results = 50)

for search_result in search_results[:1]:
    print(search_result)

In [None]:
ewz = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '01/06/2021')

In [None]:
ewz.head()

In [None]:
ewz['Close'].plot()

### 4.4.5. Commodities

In [None]:
# Soja

search_results = investpy.search_quotes(text = 'soy', products = ['commodities'], 
                                        countries = ['brazil'], n_results = 50)

for search_result in search_results:
    print(search_result)

In [None]:
soja_br = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '01/05/2022')

In [None]:
soja_br.head()

In [None]:
soja_br['Close'].plot(figsize = (12,8))

In [None]:
# Milho

search_results = investpy.search_quotes(text = 'corn', products = ['commodities'], 
                                        countries = ['brazil'], n_results = 50)

for search_result in search_results[2:3]:
    print(search_result)

In [None]:
milho_br = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '01/05/2022')

In [None]:
milho_br.head()

In [None]:
milho_br['Close'].plot()

In [None]:
Vamos buscar algumas commodities internacionais, como o lumber

In [None]:
boi_gordo = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '01/05/2022')

In [None]:
boi_gordo.head()

In [None]:
boi_gordo.Close.plot()

Vamos buscar algumas commodities internacionais, como o lumber

In [None]:
# Lumber

search_results = investpy.search_quotes(text = 'lumber', products = ['commodities'], 
                                        countries = ['united states'], n_results = 50)

for search_result in search_results[:1]:
    print(search_result)

In [None]:
lumber = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '01/06/2021')

In [None]:
lumber.Close.plot()

In [None]:
# Urânio

search_results = investpy.search_quotes(text = 'uranium', products = ['commodities'], 
                                        countries = ['united states'], n_results = 50)

for search_result in search_results:
    print(search_result)

In [None]:
uranium = search_result.retrieve_historical_data(from_date = '01/01/2014', to_date = '15/05/2022')

In [None]:
uranium['Close'].plot()

### 4.4.6. Criptomoedas

In [None]:
bitcoin = investpy.get_crypto_historical_data(crypto = 'bitcoin', 
                                              from_date = '01/01/2014', 
                                              to_date = '15/05/2022')

In [None]:
bitcoin.head()

In [None]:
bitcoin.Close.plot();

In [None]:
dogecoin = investpy.get_crypto_historical_data(crypto = 'dogecoin', 
                                              from_date = '01/01/2014', 
                                              to_date = '15/05/2022')

In [None]:
dogecoin.head()

In [None]:
dogecoin.Close.plot()

In [None]:
ethereum = investpy.get_crypto_historical_data(crypto = 'ethereum', 
                                              from_date = '01/01/2014', 
                                              to_date = '15/05/2022')

In [None]:
ethereum.head()

In [None]:
ethereum.Close.plot()

### 4.4.7. Tesouro Direto

In [None]:
search_results = investpy.search_quotes(text = 'tesouro', products = ['bonds'], 
                                        countries = ['brazil'], n_results = 50)

for search_result in search_results[6:7]:
    print(search_result)

In [None]:
ipca_2045 = search_result.retrieve_historical_data(from_date = '01/01/2019', to_date = '15/05/2022')

In [None]:
ipca_2045.head()

In [None]:
ipca_2045.Close.plot()