# Módulo de entrada e saída - es.py

Este arquivo reúne os testes de funções do módulo de entrada e saída de dados do aplicativo que colete automaticamente dados da web e estime o modelo CAPM para ações na B3.

In [4]:
# Importação de bibliotecas

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import sklearn


## Módulo de entrada de dados

Testes das funções que atendem a requisitos de entrada de dados.

### RU1 e RU2 coleta de dados de preços de fechamento
A coleta de dados deve ser feita no site do Yahoo Finance.
O sistema deverá coletar dados de preço de fechamento das quarta-feiras de todas as semanas durante 260 semanas (5 anos).

In [3]:
# Função de leitura de preços de ações 
def leitor_precos():
    pass

In [121]:
# bibliotecas para leitor_precos()

import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta


# Como calcular a data de início como sendo 260 semanas atrás da data atual
end_date = datetime.now()
start_date = end_date - timedelta(weeks=262)

## Teste com apple (AAPL)
ticker = 'AAPL'

# Baixando histórico desse período
data = yf.download(ticker, start=start_date, end=end_date)

# Testar download
print(data.head())

[*********************100%%**********************]  1 of 1 completed

                 Open       High        Low      Close  Adj Close     Volume
Date                                                                        
2019-01-17  38.549999  39.415001  38.314999  38.965000  37.399029  119284800
2019-01-18  39.375000  39.470001  38.994999  39.205002  37.629391  135004000
2019-01-22  39.102501  39.182499  38.154999  38.325001  36.784744  121576000
2019-01-23  38.537498  38.785000  37.924999  38.480000  36.933514   92522400
2019-01-24  38.527500  38.619999  37.935001  38.174999  36.640778  101766000





In [122]:
# Pegando apenas os preços de fechamento
fechamento = data['Adj Close']

# Exibir os dados
print(fechamento.head())

Date
2019-01-17    37.399029
2019-01-18    37.629391
2019-01-22    36.784744
2019-01-23    36.933514
2019-01-24    36.640778
Name: Adj Close, dtype: float64


In [123]:
# Calculando retorno

retorno = fechamento.pct_change().dropna()

# Testar novo dado
print(retorno.head())

Date
2019-01-18    0.006160
2019-01-22   -0.022446
2019-01-23    0.004044
2019-01-24   -0.007926
2019-01-25    0.033137
Name: Adj Close, dtype: float64


In [83]:
# Testes para pegar os dados apenas das quarta-feiras das últimas 260 semanas

##Exemplo apple
ticker = 'AAPL'

## Baixando dados históricos diários
data1 = yf.download(ticker, start=start_date, end=end_date, interval='1d')

## Filtrando apenas as quartas-feiras
quarta_data = data1[data1.index.weekday == 2]  # 0 = segunda, ..., 6 = domingo

# Testando exibição dos primeiros dados filtrados
print(quarta_data['Adj Close'])

[*********************100%%**********************]  1 of 1 completed

Date
2019-01-23     36.933521
2019-01-30     39.652191
2019-02-06     41.809357
2019-02-13     41.010292
2019-02-20     41.456104
                 ...    
2023-12-27    193.149994
2024-01-03    184.250000
2024-01-10    186.190002
2024-01-17    182.679993
2024-01-24    194.500000
Name: Adj Close, Length: 260, dtype: float64





In [136]:
# Defininido a função de leitura de preços de ações

    # Bibliotecas:
import numpy as np
import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta


def leitor_precos(ticker:str) -> np.array:
    """" Esta função realiza a leitura de preço de fechamento de ações nas quarta-feiras de todas as últimas 260 semanas e calcula seus retornos """
    end_date = datetime.now()
    start_date = end_date - timedelta(weeks=263)
    dado = yf.download(ticker, start=start_date, end=end_date, progress=False, interval='1d')
    data_day = dado[dado.index.weekday == 2]
    fechamento = data_day['Adj Close'].pct_change().dropna()
    return np.array(fechamento)


In [154]:
# Teste da função

teste1 = leitor_precos('AAPL')

print(teste1)

[-6.58317175e-03  7.36095036e-02  5.44026686e-02 -1.91124605e-02
  1.08708341e-02  1.65086277e-02 -2.00138030e-03  4.11986938e-02
  3.54960326e-02  1.64750883e-03  3.65045766e-02  2.69772114e-02
  1.25112498e-02  1.98395962e-02  1.62192149e-02 -3.61961495e-02
 -5.54201123e-02 -4.26357534e-02 -2.95436161e-02  2.90901323e-02
  6.38216025e-02  1.89506749e-02  9.75376816e-03  2.30732179e-02
 -5.77309971e-03  5.90710398e-04  2.61617147e-02  2.09421203e-02
 -6.57152858e-02  2.25097675e-02  4.87791725e-02 -3.34368486e-02
  1.78076562e-02  6.88370456e-02 -3.66756386e-03 -7.81062630e-03
 -9.36529779e-03  3.68561055e-02  3.23305142e-02  3.75902183e-02
  3.28877966e-04  5.74691748e-02  3.11930321e-02 -4.83983776e-03
  1.76677339e-02 -2.27748275e-02  3.45000130e-02  3.31275096e-02
  8.38280433e-02  2.68807661e-02  2.04277951e-02  2.08999305e-02
 -8.91008584e-03  2.03033507e-02 -1.09411441e-02 -9.56988974e-02
  3.44780564e-02 -9.02092666e-02 -1.04418572e-01 -4.66205989e-03
 -1.87765075e-02  1.04437

### Requisito RU3 - ativo livre de risco

O sistema deverá coletar dados do ativo livre de risco (taxa CDI) pelas últimas 260 semanas.

In [4]:
#Função de leitura da taxa CDI
def leitor_taxa():
    pass


In [158]:
# Lendo cdi em arquivo json do Bacen

cdi = pd.read_json('https://api.bcb.gov.br/dados/serie/bcdata.sgs.4390/dados?formato=json')

print(cdi)

           data  valor
0    01/06/1986   1.27
1    01/07/1986   1.95
2    01/08/1986   2.57
3    01/09/1986   2.94
4    01/10/1986   1.96
..          ...    ...
447  01/09/2023   0.97
448  01/10/2023   1.00
449  01/11/2023   0.92
450  01/12/2023   0.89
451  01/01/2024   0.75

[452 rows x 2 columns]


In [159]:
# últimos 260

cdi_recente = cdi.tail(260)

print(cdi_recente)

           data  valor
192  01/06/2002   1.33
193  01/07/2002   1.54
194  01/08/2002   1.44
195  01/09/2002   1.38
196  01/10/2002   1.65
..          ...    ...
447  01/09/2023   0.97
448  01/10/2023   1.00
449  01/11/2023   0.92
450  01/12/2023   0.89
451  01/01/2024   0.75

[260 rows x 2 columns]


In [189]:
# Como selecionar dados das últimas 260 semanas

df = pd.DataFrame(cdi)

# Converter a coluna 'date' para o tipo datetime
df['data'] = pd.to_datetime(df['data'])

# Calcular a data de início (260 semanas atrás a partir da data atual)
end_date = df['data'].max()
start_date = end_date - timedelta(weeks=261)

# Filtrar apenas os dados das últimas 260 semanas
filtro1 = df[df['data'] >= start_date]

# Exibir os dados filtrados
print(filtro1)

          data  valor
391 2019-01-01   0.54
392 2019-01-02   0.49
393 2019-01-03   0.47
394 2019-01-04   0.52
395 2019-01-05   0.54
..         ...    ...
447 2023-01-09   0.97
448 2023-01-10   1.00
449 2023-01-11   0.92
450 2023-01-12   0.89
451 2024-01-01   0.75

[61 rows x 2 columns]


In [197]:
# Pegando apenas os dados de taxa cdi mensal dos últimos 5 anos
valor_cdi = filtro1['valor']

# Transformando em  
taxa = np.array(valor_cdi)

print(taxa)

[0.54 0.49 0.47 0.52 0.54 0.47 0.57 0.5  0.46 0.48 0.38 0.37 0.38 0.29
 0.34 0.28 0.24 0.21 0.19 0.16 0.16 0.16 0.15 0.16 0.15 0.13 0.2  0.21
 0.27 0.31 0.36 0.43 0.44 0.49 0.59 0.77 0.73 0.76 0.93 0.83 1.03 1.02
 1.03 1.17 1.07 1.02 1.02 1.12 1.12 0.92 1.17 0.92 1.12 1.07 1.07 1.14
 0.97 1.   0.92 0.89 0.75]


### Requisito RU4 - carteira de mercado

O sistema deverá coletar dados da carteira de mercado (IBOVESPA) pelas últimas 260 semanas.

In [5]:
#Função de leitura de índice da carteira de mercado
def leitor_indice():
    pass


In [176]:
# bibliotecas para leitor_indice()

import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta


# Como calcular a data de início como sendo 260 semanas atrás da data atual
end_date = datetime.now()
start_date = end_date - timedelta(weeks=269)

## índice Bovespa
indice = '^BVSP'

# Baixando histórico desse período
data = yf.download(indice, start=start_date, end=end_date, interval='1d')

# Teste de download de dados
print(data.head())

[*********************100%%**********************]  1 of 1 completed

               Open     High      Low    Close  Adj Close   Volume
Date                                                              
2018-11-29  89145.0  89910.0  88475.0  89710.0    89710.0  4257400
2018-11-30  89709.0  90246.0  89258.0  89504.0    89504.0  6736700
2018-12-03  89511.0  91242.0  89429.0  89820.0    89820.0  5935600
2018-12-04  89820.0  90452.0  88041.0  88624.0    88624.0  4879700
2018-12-05  88644.0  89111.0  88449.0  89040.0    89040.0  2790000





In [177]:
# Pegando apenas o fechamento do IBOVESPA

fechamento = data['Adj Close']

# Testar download
print(fechamento.head())

Date
2018-11-29    89710.0
2018-11-30    89504.0
2018-12-03    89820.0
2018-12-04    88624.0
2018-12-05    89040.0
Name: Adj Close, dtype: float64


In [178]:
# Calculando retorno

retorno = fechamento.pct_change().dropna()

# Testar novo dado
print(retorno.head())

Date
2018-11-30   -0.002296
2018-12-03    0.003531
2018-12-04   -0.013316
2018-12-05    0.004694
2018-12-06   -0.002179
Name: Adj Close, dtype: float64


In [179]:
# Filtrando apenas os fechamentos das quartas-feiras
dado_bov = fechamento[fechamento.index.weekday == 2]  # 0 = segunda, ..., 6 = domingo

# Testando exibição dos primeiros dados filtrados
print(dado_bov)

Date
2018-12-05     89040.0
2018-12-12     86977.0
2018-12-19     85674.0
2018-12-26     85136.0
2019-01-02     91012.0
                ...   
2023-12-27    134194.0
2024-01-03    132834.0
2024-01-10    130841.0
2024-01-17    128524.0
2024-01-24    127816.0
Name: Adj Close, Length: 260, dtype: float64


In [180]:
#definindo função de leitura da carteira de mercado (IBOVESPA)

def leitor_indice() -> np.array:
    """" Esta função realiza a leitura de fechamento do Bovespa nas quartas-feiras de todas as últimas 260 semanas e calcula seus retornos """
    end_date = datetime.now()
    #start_date = end_date - timedelta(weeks=263)
    start_date = end_date - timedelta(weeks=269)
    bov = yf.download("^BVSP", start=start_date, end=end_date, progress=False, interval='1d')
    retorno = bov['Adj Close'].pct_change().dropna()
    mercado = retorno[retorno.index.weekday == 2]
    return np.array(mercado)


In [133]:
# teste da função

leitor_indice()

array([ 3.58297185e-03,  1.52992019e-02,  1.41887724e-02, -3.73813714e-02,
       -3.38990101e-03, -1.14070388e-02, -3.03269367e-03, -4.09073612e-03,
        1.09988960e-02, -1.55340001e-02, -3.57161594e-02, -9.39331355e-03,
       -3.52054169e-03, -1.11095799e-02, -9.15317494e-03,  1.27981015e-02,
       -5.09273335e-03, -1.31237763e-03,  1.80511033e-03, -1.41815568e-02,
       -6.45715441e-03,  9.04390165e-03,  5.95446235e-03,  1.42935242e-02,
        1.23122549e-02,  7.80534811e-04,  4.01141711e-03, -1.08905793e-02,
        6.04909753e-03, -2.94388135e-02,  1.99552519e-02,  9.43706567e-03,
        1.52486432e-02,  4.01816911e-03, -8.12487454e-04,  5.82425199e-03,
       -2.90428916e-02,  1.26824097e-02,  8.92908412e-03,  1.51795942e-03,
        7.92145487e-03, -1.06038672e-03, -8.15657630e-03,  6.06207792e-03,
        1.23444326e-02,  2.63842706e-03,  1.50866662e-02, -3.55728515e-03,
       -1.03543254e-02,  1.16640747e-02, -9.39225096e-03,  4.07591059e-03,
        1.12939994e-02,  

In [188]:
# Teste para prêmio de risco de mercado
## taxa = np.array(valor_cdi)

retorntest = leitor_indice()
risco_mercado = retorntest - taxa

print(risco_mercado)

[-1.32530601 -1.53355473 -1.45080707 -1.38654632 -1.61444298 -1.52282119
 -1.73641703 -1.9547008  -1.81581123 -1.81738137 -1.8733899  -1.98140704
 -1.86303269 -2.08409074 -1.7590011  -1.695534   -1.67571616 -1.34939331
 -1.37352054 -1.28110958 -1.08915317 -1.3672019  -1.18509273 -1.23131238
 -1.22819489 -1.30418156 -1.29645715 -1.2409561  -1.20404554 -1.23570648
 -1.46768775 -1.37921947 -1.21598858 -1.54089058 -1.4039509  -1.52943881
 -1.57004475 -1.50056293 -1.64475136 -1.49598183 -1.41081249 -1.37417575
 -1.49904289 -1.41731759 -1.14107092 -1.41848204 -1.07207855 -1.28106039
 -1.18815658 -1.16393792 -1.24765557 -1.05736157 -1.07491333 -1.02355729
 -1.00035433 -1.06833593 -0.87939225 -1.04592409 -0.928706   -1.01659732
 -0.98004689 -0.95401508 -1.06637669 -0.90348848 -0.85503836 -0.86811558
 -0.8103109  -0.94360144 -0.77829638 -0.81713745 -0.90512137 -0.88128416
 -0.95285378 -1.04101873 -0.99851635 -1.12130299 -1.15844565 -1.03665017
 -1.10793343 -1.02944988 -0.84654918 -0.97019174 -0

### Definindo banco de 10 ações da B3

A amostra deverá conter dados de 10 empresas com ações negociadas no mercado à vista da B3. 

Nesta função o usuário poderá escolher qual das 10 ações deseja calcular o CAPM

In [131]:
#Função de leitura de ações
def leitor_acoes() -> list:
    pass


Amostra com as 10 ações com maior volume médio de negociação em 2023:

1. VALE ('VALE3.SA')
2. PETROBRAS ('PETR4.SA')
3. ITAÚ UNIBANCO ('ITUB4.SA')
4. BRADESCO ('BBDC4.SA')
5. BANCO DO BRASIL ('BBAS3.SA')
6. MAGAZINE LUIZA ('MGLU3.SA')
7. B3 ('B3SA3.SA')
8. AMBEV ('ABEV3.SA')
9. PETRORIO ('PRIO3.SA')
10. ELETROBRAS ('ELET3.SA')
 

In [137]:
# Determinando amostra
acoes = ['VALE3.SA','PETR4.SA','ITUB4.SA','BBDC4.SA','BBAS3.SA','MGLU3.SA','B3SA3.SA','ABEV3.SA','PRIO3.SA','ELET3.SA']

# Teste de integração com leitor_precos()

leitor_precos(acoes[0])

array([ 0.05698001, -0.16262349, -0.08884124,  0.07136143,  0.00681436,
        0.0224894 ,  0.02605154,  0.05515081, -0.00276153, -0.01898704,
        0.04395162, -0.00038632,  0.00946687, -0.03617245, -0.0270053 ,
       -0.02142865, -0.01021897,  0.04719753, -0.0263582 ,  0.06406305,
        0.01573106, -0.01376664, -0.00562236,  0.01637748,  0.01074224,
       -0.03871696, -0.01658442, -0.06685412, -0.03442337, -0.01626553,
       -0.01517572,  0.06991734,  0.03073958,  0.00938473, -0.01115715,
       -0.05766815,  0.01263866,  0.02474271,  0.00662386,  0.03141591,
        0.02263839, -0.05172086,  0.0734298 ,  0.00672196,  0.01787128,
        0.0316418 ,  0.0368649 ,  0.02684714,  0.01514605, -0.09857912,
        0.04413785,  0.00150978, -0.00489916, -0.14126125,  0.07100338,
       -0.16121057, -0.05130093,  0.05692115,  0.06168922,  0.00322776,
       -0.00735444, -0.00671447,  0.08927701, -0.05135865,  0.09496952,
        0.08158209, -0.03542869,  0.05963693,  0.0100633 ,  0.03

### RSOF2 - Gravação do arquivo em uma pasta definida pelo usuário.

Fase de entrada da escolha de pasta onde devem ser guardados os resultados CAPM em arquivos CSV  em cada semana em que o modelo for estimado.

Testes da função de leitura do teclado para escolha da pasta de gravação na primeira iniciação do sistema - leitor_pasta()

In [6]:
#Função de leitura de pasta
def leitor_pasta():
    pass


In [141]:
# Solicitando ao usuário o caminho da pasta
pasta_destino = input("""Digite o caminho da pasta de gravação de arquivos: """)

# teste de armazenamento
print(pasta_destino)

Digite o caminho da pasta de gravação de arquivos:  C:\Users\Documents\


C:\Users\Documents\


In [145]:
# Definindo a função de leitura de pasta

def leitor_pasta() -> str:
    """ Esta função executa a leitura do teclado para a escolha da pasta de gravação dos arquivos """
    pasta_destino = input("""Digite o caminho da pasta de gravação de arquivos: """)
    return pasta_destino


In [143]:
# Teste da função 

pasta = leitor_pasta()

Digite o caminho da pasta de gravação de arquivos:  C:\Users\


In [144]:
# teste de armazenamento 

print(pasta)

C:\Users\


## Módulo de saída

Teste da função que atende ao requisito RU10, resultando em um arquivo de saída que deverá conter a data do resultado da estimação em cada semana em que o modelo for estimado.


In [210]:

# bibliotecas
import os
import csv

#Função de gravação de dados CAPM em novo arquivo .csv
def grava_arquivo():
    """ Esta função cria um novo arquivo CSV com os resultados a cada estimação CAPM realizada """
    pass


In [208]:
# Nome do novo arquivo
nome_arquivo = "resultados_capm.csv"

#Teste de função para gravação de arquivo
def grava_arquivo(dados, pasta_destino):
    nome_arquivo = "resultados_capm.csv"
    caminho_completo = os.path.join(pasta_destino, nome_arquivo)

    with open(caminho_completo, 'w', newline='') as arquivo_csv:
        escritor_csv = csv.writer(arquivo_csv)

        # Escrever os dados no arquivo
        for i in dados:
            escritor_csv(i)

In [209]:
# Testes

pasta_test = leitor_pasta()

grava_arquivo(dado_bov,pasta_test)

Digite o caminho da pasta de gravação de arquivos:  C:\Users\letis\Documents\CienciaDadosEspecializacao2023


TypeError: '_csv.writer' object is not callable