# Bootcamp Ciência de Dados em Renda Variável

---

## **Trabalho Prático**
### **Módulo 2 - Coleta e armazena dados de renda variável**

#### **Objetivos de ensino:**
#### Exercitar os seguintes conceitos:
- Implementar processo de coleta e armazenamento de dados em Renda Variável, usando a linguagem Python;
- Reconhecer e explorar fontes de dados públicas;
- Seguir boas práticas de programação ao coletar dados da web.


In [3]:
# Importação das bibliotecas python
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

**Conectar google drive**

In [4]:
#from google.colab import drive
#drive.mount('/content/drive')

### **Atividade**


---
#### 1. Série histórica dos dados de inflação de bebidas do IBGE usando a API sidra;


In [5]:
# Define uma função consulta_bc() que retorna dados da API do BC
# Uso da api do banco central para coletar dados de IPCA de alimentos e bebidas para análise de informações para ABEV3

def consulta_bc(codigo_bcb):
    url = 'http://api.bcb.gov.br/dados/serie/bcdata.sgs.{}/dados?formato=json'.format(codigo_bcb)
    df = pd.read_json(url)
    df['data'] = pd.to_datetime(df['data'], dayfirst=True)
    df.set_index('data', inplace=True)
    return df

In [6]:
# índice nacional de preços de alimentação e bebidas do IBGE
ipca = consulta_bc(1635) 
ipca.head(7)

Unnamed: 0_level_0,valor
data,Unnamed: 1_level_1
1991-01-01,21.94
1991-02-01,18.49
1991-03-01,3.87
1991-04-01,5.28
1991-05-01,4.6
1991-06-01,11.23
1991-07-01,12.79


#### 2. Série histórica dos dados diários de preços e volume da ABEV3 do provedor de sua preferência 

In [12]:
# Importa biblioteca do Yahoo Finance
import yfinance as yf

In [16]:
ticker = yf.Ticker("ABEV3.SA")

In [18]:
df_hist = ticker.history(period="5y", interval = "1d")

In [19]:
df_hist.head()

Unnamed: 0_level_0,Open,High,Low,Close,Volume,Dividends,Stock Splits
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2018-04-06,19.737107,19.737107,19.233609,19.510532,24189300,0.0,0
2018-04-09,19.351091,19.695148,19.351091,19.5441,16524900,0.0,0
2018-04-10,19.653191,20.014032,19.527317,19.972073,15457400,0.0,0
2018-04-11,19.812633,20.181864,19.812633,20.014032,11508300,0.0,0
2018-04-12,20.106337,20.139905,19.476965,19.5441,12543200,0.0,0


#### 3.Coletando lista de companhia com registros na CVM

In [22]:
import requests_html

In [23]:
#Define variável com a url do site RAD da CVM para consultar a lista de companhis
url = "https://www.rad.cvm.gov.br/ENET/frmConsultaExternaCVM.aspx"

r = requests_html.HTMLSession().get(url)

r.content

b'\r\n\r\n\r\n<!DOCTYPE html>\r\n<html xmlns="http://www.w3.org/1999/xhtml">\r\n<head id="Head1"><link href="App_Themes/CVM/Calendar/Skins/CVM/Calendar.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/Calendar/Skins/CVM/RadTimePicker.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/Calendario.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/ComboBox/CVM/Styles.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/ComboBox/Skins/CVM/Styles.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/EditarConteudo.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/Entrada.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/Erro.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/Estrutura.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/Ferramentas.css" type="text/css" rel="stylesheet" /><link href="App_Themes/CVM/Formulario.css" type="text/css" rel="s

In [24]:
#Importação da bibliotec Regular Expression
import re

In [29]:
a = re.findall(r'(?<=<input name="hdnEmpresas" type="hidden" id="hdnEmpresas" value=")[^"]*(?=" />)',r.text)


In [31]:
a = a[0]

In [35]:
list(eval(a.replace("{ key:","{'key':").replace("value:","'value':")))

[{'key': 'C_025224', 'value': '025224 - 2W ECOBANK S.A. (REGISTRO ATIVO)'},
 {'key': 'C_917581', 'value': '917581 - 2W ENERGIA S.A. (REGISTRO ATIVO)'},
 {'key': 'C_021954',
  'value': '021954 - 3A COMPANHIA SECURITIZADORA (REGISTRO CANCELADO)'},
 {'key': 'C_050504', 'value': '050504 - 3M COMPANY (REGISTRO ATIVO)'},
 {'key': 'C_025291',
  'value': '025291 - 3R PETROLEUM ÓLEO E GÁS S.A (REGISTRO ATIVO)'},
 {'key': 'C_908830',
  'value': '908830 - 3Z REALTY DESENVOLVIMENTO IMOBILIARIO S/A (REGISTRO ATIVO)'},
 {'key': 'C_016330',
  'value': '016330 - 521 PARTICIPACOES S.A. - EM LIQUIDAÇÃO EXTRAJUDICIAL (REGISTRO ATIVO)'},
 {'key': 'C_016284',
  'value': '016284 - 524 PARTICIPACOES S.A. (REGISTRO ATIVO)'},
 {'key': 'C_016349',
  'value': '016349 - 525 PARTICIPAÇOES SA (REGISTRO CANCELADO)'},
 {'key': 'C_091154',
  'value': '091154 - 90735-2 - RIO PARANA ENERGIA S/A (INATIVA) (REGISTRO CANCELADO)'},
 {'key': 'C_904110',
  'value': '904110 - A  GERADORA  ALUGUEL DE MAQUINAS S.A. (REGISTRO ATI

In [39]:

pd.DataFrame(list(eval(a.replace("{ key:","{'key':").replace("value:","'value':"))))

Unnamed: 0,key,value
0,C_025224,025224 - 2W ECOBANK S.A. (REGISTRO ATIVO)
1,C_917581,917581 - 2W ENERGIA S.A. (REGISTRO ATIVO)
2,C_021954,021954 - 3A COMPANHIA SECURITIZADORA (REGISTRO...
3,C_050504,050504 - 3M COMPANY (REGISTRO ATIVO)
4,C_025291,025291 - 3R PETROLEUM ÓLEO E GÁS S.A (REGISTRO...
...,...,...
5631,C_056456,056456 - ZOOM VIDEO COMMUNICATIONS INC (REGIST...
5632,C_058955,058955 - ZOOMINFO TECHNOLOGIES INC (REGISTRO A...
5633,C_058963,058963 - ZSCALER INC (REGISTRO ATIVO)
5634,C_057169,057169 - ZTO EXPRESS CAYMAN INC (REGISTRO ATIVO)


None


In [1]:
# Example plotting returns.
from pylab import *
import quantpy as qp

# Get symbols.
syms = ['IBM','GOOG','MSFT','AAPL','INTC']
cols = ['b','r','g','k','m','y']

# Get portfolio
P = qp.Portfolio(syms)

# Make plots of normalized returns.
for sym,col in zip(syms,cols):
    P.nplot(sym,col)
show()

ModuleNotFoundError: No module named 'quantpy'