# Módulo de entrada e saída - es.py

Este arquivo reúne os testes de funções do módulo de entrada e saída de dados do aplicativo que colete automaticamente dados da web e estime o modelo CAPM para ações na B3.

In [187]:
# Importação de bibliotecas

import numpy as np
import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta
import requests
import os
import statsmodels.api as sm


## Módulo de entrada de dados

Testes das funções que atendem a requisitos de entrada de dados.

### RU1 e RU2 coleta de dados de preços de fechamento
A coleta de dados deve ser feita no site do Yahoo Finance.
O sistema deverá coletar dados de preço de fechamento das quarta-feiras de todas as semanas durante 260 semanas (5 anos).

In [3]:
# Função de leitura de preços de ações 
def leitor_precos():
    pass

In [5]:
# bibliotecas para leitor_precos()

import yfinance as yf
import pandas as pd
import numpy as np
from datetime import datetime, timedelta


# Como calcular a data de início como sendo 260 semanas atrás da data atual
end_date = datetime.now()
start_date = end_date - timedelta(weeks=262)

## Teste com apple (AAPL)
ticker = 'VALE3.SA'

# Baixando histórico desse período
data = yf.download(ticker, start=start_date, end=end_date)

# Testar download
print(data.head())

[*********************100%%**********************]  1 of 1 completed

                 Open       High        Low      Close  Adj Close    Volume
Date                                                                       
2019-01-17  52.439999  54.709999  52.270000  54.230000  36.991947  25525500
2019-01-18  54.950001  55.599998  54.250000  54.759998  37.353477  25815900
2019-01-21  54.849998  55.349998  54.389999  55.279999  37.708183  10676600
2019-01-22  54.480000  55.080002  54.349998  55.080002  37.571758  17154300
2019-01-23  55.459999  55.900002  55.330002  55.650002  37.960575  13470400





In [2]:
# Pegando apenas os preços de fechamento
fechamento = data['Adj Close']

# Exibir os dados
print(fechamento.head())

Date
2019-01-17    36.991951
2019-01-18    37.353477
2019-01-21    37.708183
2019-01-22    37.571754
2019-01-23    37.960575
Name: Adj Close, dtype: float64


In [10]:
def leitor_retornos(series):
    return np.log(series / series.shift(1)).dropna()

retornos = leitor_retornos(fechamento)

print(retornos)
print(type(retornos))

Date
2019-01-18    0.009726
2019-01-21    0.009451
2019-01-22   -0.003625
2019-01-23    0.010296
2019-01-24    0.008945
                ...   
2024-01-19   -0.013129
2024-01-22   -0.004415
2024-01-23    0.020439
2024-01-24    0.010065
2024-01-25   -0.022278
Name: Adj Close, Length: 1247, dtype: float64
<class 'pandas.core.series.Series'>


In [8]:
# Calculando retorno

retorno = fechamento.pct_change().dropna()

# Testar novo dado
print(retorno)

Date
2019-01-18    0.009773
2019-01-21    0.009496
2019-01-22   -0.003618
2019-01-23    0.010349
2019-01-24    0.008985
                ...   
2024-01-19   -0.013044
2024-01-22   -0.004405
2024-01-23    0.020649
2024-01-24    0.010116
2024-01-25   -0.022031
Name: Adj Close, Length: 1247, dtype: float64


In [9]:
print(type(retorno))

<class 'pandas.core.series.Series'>


In [83]:
# Testes para pegar os dados apenas das quarta-feiras das últimas 260 semanas

##Exemplo apple
ticker = 'AAPL'

## Baixando dados históricos diários
data1 = yf.download(ticker, start=start_date, end=end_date, interval='1d')

## Filtrando apenas as quartas-feiras
quarta_data = data1[data1.index.weekday == 2]  # 0 = segunda, ..., 6 = domingo

# Testando exibição dos primeiros dados filtrados
print(quarta_data['Adj Close'])

[*********************100%%**********************]  1 of 1 completed

Date
2019-01-23     36.933521
2019-01-30     39.652191
2019-02-06     41.809357
2019-02-13     41.010292
2019-02-20     41.456104
                 ...    
2023-12-27    193.149994
2024-01-03    184.250000
2024-01-10    186.190002
2024-01-17    182.679993
2024-01-24    194.500000
Name: Adj Close, Length: 260, dtype: float64





In [11]:
# Defininido a função de leitura de preços de ações

    # Bibliotecas:
import numpy as np
import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta


def leitor_precos(ticker:str) -> np.array:
    """" Esta função realiza a leitura de preço de fechamento de ações nas quarta-feiras de todas as últimas 260 semanas e calcula seus retornos """
    end_date = datetime.now()
    start_date = end_date - timedelta(weeks=263)
    dado = yf.download(ticker, start=start_date, end=end_date, progress=False, interval='1d')
    data_day = dado[dado.index.weekday == 2]
    fechamento = data_day['Adj Close'].pct_change().dropna()
    return np.array(fechamento)


In [185]:
# Teste da função

teste1 = leitor_precos('AAPL')

print(teste1)

[-6.58296856e-03  7.36098210e-02  5.44022733e-02 -1.91124639e-02
  1.08710222e-02  1.65089038e-02 -2.00137976e-03  4.11983198e-02
  3.54963842e-02  1.64734015e-03  3.65045735e-02  2.69772092e-02
  1.25111699e-02  1.98394404e-02  1.62195231e-02 -3.61962193e-02
 -5.54202640e-02 -4.26354265e-02 -2.95438673e-02  2.90901323e-02
  6.38214297e-02  1.89507592e-02  9.75384863e-03  2.30730600e-02
 -5.77271488e-03  5.90399891e-04  2.61616392e-02  2.09424258e-02
 -6.57153501e-02  2.25096073e-02  4.87793312e-02 -3.34368461e-02
  1.78075784e-02  6.88369705e-02 -3.66742360e-03 -7.81076679e-03
 -9.36515631e-03  3.68559593e-02  3.23306548e-02  3.75899476e-02
  3.29007230e-04  5.74693077e-02  3.11927249e-02 -4.83983890e-03
  1.76682142e-02 -2.27750561e-02  3.44996540e-02  3.31278681e-02
  8.38278193e-02  2.68808750e-02  2.04277971e-02  2.09004255e-02
 -8.91037214e-03  2.03032512e-02 -1.09412396e-02 -9.56987135e-02
  3.44780527e-02 -9.02094638e-02 -1.04418527e-01 -4.66212353e-03
 -1.87763190e-02  1.04437

### Requisito RU3 - ativo livre de risco

O sistema deverá coletar dados do ativo livre de risco (taxa CDI) pelas últimas 260 semanas.

In [4]:
#Função de leitura da taxa CDI
def leitor_taxa():
    pass


In [178]:
import requests
import pandas as pd

# Usando a URL da API de CDI diário do Bacen
url = "https://api.bcb.gov.br/dados/serie/bcdata.sgs.12/dados?formato=json"

# Fazendo uma solicitação GET para obter os dados
api = requests.get(url)

# Convertendo a resposta JSON em um DataFrame do pandas
dados = api.json()
cdi = pd.DataFrame(dados)

# Convertendo a coluna 'data' para o formato de data do pandas
cdi['data'] = pd.to_datetime(cdi['data'], format='%d/%m/%Y')

# Filtrando dados para o intervalo específico da aplicação
end_date = datetime.now()
start_date = end_date - timedelta(weeks=268)
cdi_filtro = cdi[(cdi['data'] >= start_date) & (cdi['data'] <= end_date)]

#Testar o DataFrame resultante
print(cdi_filtro)

           data     valor
8189 2018-12-07  0.024620
8190 2018-12-10  0.024620
8191 2018-12-11  0.024620
8192 2018-12-12  0.024620
8193 2018-12-13  0.024620
...         ...       ...
9472 2024-01-18  0.043739
9473 2024-01-19  0.043739
9474 2024-01-22  0.043739
9475 2024-01-23  0.043739
9476 2024-01-24  0.043739

[1288 rows x 2 columns]


In [177]:
# Definindo a coluna 'data' como índice
cdi_filtro.set_index('data', inplace=True)

# Filtrando apenas as taxas cdi de quarta-feiras
dado_cdi = cdi_filtro[cdi_filtro.index.weekday == 2]


print(dado_cdi)

               valor
data                
2018-12-12  0.024620
2018-12-19  0.024620
2018-12-26  0.024620
2019-01-02  0.024620
2019-01-09  0.024620
...              ...
2023-12-27  0.043739
2024-01-03  0.043739
2024-01-10  0.043739
2024-01-17  0.043739
2024-01-24  0.043739

[260 rows x 1 columns]


In [254]:
# Definidno a função de leitura da taxa CDI

def leitor_taxa():
    """" Esta função realiza a leitura da taxa CDI nas quartas-feiras de todas as últimas 260 semanas """
    # URL da API de CDI diário do Bacen
    url = "https://api.bcb.gov.br/dados/serie/bcdata.sgs.12/dados?formato=json"
    api = requests.get(url)
    
    # Leitura de dados em json
    dados = api.json()
    cdi = pd.DataFrame(dados)
    
    # Formatando e filtrando período
    cdi['data'] = pd.to_datetime(cdi['data'], format='%d/%m/%Y')
    cdi['valor'] = pd.to_numeric(cdi['valor'], errors='coerce')
    
    end_date = datetime.now()
    start_date = end_date - timedelta(weeks=268)
    filtro = cdi[(cdi['data'] >= start_date) & (cdi['data'] <= end_date)]
    
    # selecionando as quarta-feiras
    filtro.set_index('data', inplace=True)
    dado_cdi = filtro[filtro.index.weekday == 2]
    retorno = dado_cdi['valor'].dropna()
    return np.array(retorno)


In [256]:
# Teste de funcionamento da função

cdi_t = leitor_taxa()

print(cdi_t.shape)

(260,)


### Requisito RU4 - carteira de mercado

O sistema deverá coletar dados da carteira de mercado (IBOVESPA) pelas últimas 260 semanas.

In [5]:
#Função de leitura de índice da carteira de mercado
def leitor_indice():
    pass


In [176]:
# bibliotecas para leitor_indice()

import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta


# Como calcular a data de início como sendo 260 semanas atrás da data atual
end_date = datetime.now()
start_date = end_date - timedelta(weeks=269)

## índice Bovespa
indice = '^BVSP'

# Baixando histórico desse período
data = yf.download(indice, start=start_date, end=end_date, interval='1d')

# Teste de download de dados
print(data.head())

[*********************100%%**********************]  1 of 1 completed

               Open     High      Low    Close  Adj Close   Volume
Date                                                              
2018-11-29  89145.0  89910.0  88475.0  89710.0    89710.0  4257400
2018-11-30  89709.0  90246.0  89258.0  89504.0    89504.0  6736700
2018-12-03  89511.0  91242.0  89429.0  89820.0    89820.0  5935600
2018-12-04  89820.0  90452.0  88041.0  88624.0    88624.0  4879700
2018-12-05  88644.0  89111.0  88449.0  89040.0    89040.0  2790000





In [177]:
# Pegando apenas o fechamento do IBOVESPA

fechamento = data['Adj Close']

# Testar download
print(fechamento.head())

Date
2018-11-29    89710.0
2018-11-30    89504.0
2018-12-03    89820.0
2018-12-04    88624.0
2018-12-05    89040.0
Name: Adj Close, dtype: float64


In [178]:
# Calculando retorno

retorno = fechamento.pct_change().dropna()

# Testar novo dado
print(retorno.head())

Date
2018-11-30   -0.002296
2018-12-03    0.003531
2018-12-04   -0.013316
2018-12-05    0.004694
2018-12-06   -0.002179
Name: Adj Close, dtype: float64


In [179]:
# Filtrando apenas os fechamentos das quartas-feiras
dado_bov = fechamento[fechamento.index.weekday == 2]  # 0 = segunda, ..., 6 = domingo

# Testando exibição dos primeiros dados filtrados
print(dado_bov)

Date
2018-12-05     89040.0
2018-12-12     86977.0
2018-12-19     85674.0
2018-12-26     85136.0
2019-01-02     91012.0
                ...   
2023-12-27    134194.0
2024-01-03    132834.0
2024-01-10    130841.0
2024-01-17    128524.0
2024-01-24    127816.0
Name: Adj Close, Length: 260, dtype: float64


In [12]:
#definindo função de leitura da carteira de mercado (IBOVESPA)

def leitor_indice() -> np.array:
    """" Esta função realiza a leitura de fechamento do Bovespa nas quartas-feiras de todas as últimas 260 semanas e calcula seus retornos """
    end_date = datetime.now()
    #start_date = end_date - timedelta(weeks=263)
    start_date = end_date - timedelta(weeks=269)
    bov = yf.download("^BVSP", start=start_date, end=end_date, progress=False, interval='1d')
    retorno = bov['Adj Close'].pct_change().dropna()
    mercado = retorno[retorno.index.weekday == 2]
    return np.array(mercado)


In [13]:
# teste da função

bov = leitor_indice()

In [236]:
# Teste para prêmio de risco de mercado

taxa = leitor_taxa()
ibov_ret = leitor_indice()

    # Caso fosse necessário ajustar o cdi pelo número de amostra do ibov:
    # cdi_ajustado = np.array(taxa[-len(ibov_ret):])


# Calculando prêmio de risco de mercado
premio_risco = ibov_ret - taxa

print(premio_risco)


[[-0.01992601 -0.01817473 -0.03542707 ... -0.02923022 -0.03057542
  -0.02810503]
 [-0.01992601 -0.01817473 -0.03542707 ... -0.02923022 -0.03057542
  -0.02810503]
 [-0.01992601 -0.01817473 -0.03542707 ... -0.02923022 -0.03057542
  -0.02810503]
 ...
 [-0.03904501 -0.03729373 -0.05454607 ... -0.04834922 -0.04969442
  -0.04722403]
 [-0.03904501 -0.03729373 -0.05454607 ... -0.04834922 -0.04969442
  -0.04722403]
 [-0.03904501 -0.03729373 -0.05454607 ... -0.04834922 -0.04969442
  -0.04722403]]


### Definindo banco de 10 ações da B3

A amostra deverá conter dados de 10 empresas com ações negociadas no mercado à vista da B3. 

Nesta função o usuário poderá escolher qual das 10 ações deseja calcular o CAPM.

Amostra de teste com as 10 ações com maior volume médio de negociação em 2023:

1. VALE ('VALE3.SA')
2. PETROBRAS ('PETR4.SA')
3. ITAÚ UNIBANCO ('ITUB4.SA')
4. BRADESCO ('BBDC4.SA')
5. BANCO DO BRASIL ('BBAS3.SA')
6. MAGAZINE LUIZA ('MGLU3.SA')
7. B3 ('B3SA3.SA')
8. AMBEV ('ABEV3.SA')
9. PETRORIO ('PRIO3.SA')
10. ELETROBRAS ('ELET3.SA')

In [237]:
# Definindo a função de leitura de ações

def leitor_acoes() -> list:
    """ Função de leitura de teclado do código das 10 ações escolhidas para estimação do CAPM """
    acoes = []
        
    for i in range(1, 11):
        acoes.append(input(f'Digite o ticker da ação listada na B3 que deseja avaliar {i} de 10: (ex.: VALE3.SA) '))
    
    return acoes

In [207]:
acoes = leitor_acoes()

Digite o ticker da ação listada na B3 que deseja avaliar 1 de 10: (ex.: VALE3.SA)  VALE3.SA
Digite o ticker da ação listada na B3 que deseja avaliar 2 de 10: (ex.: VALE3.SA)  PETR4.SA
Digite o ticker da ação listada na B3 que deseja avaliar 3 de 10: (ex.: VALE3.SA)  ITUB4.SA
Digite o ticker da ação listada na B3 que deseja avaliar 4 de 10: (ex.: VALE3.SA)  BBDC4.SA
Digite o ticker da ação listada na B3 que deseja avaliar 5 de 10: (ex.: VALE3.SA)  BBAS3.SA
Digite o ticker da ação listada na B3 que deseja avaliar 6 de 10: (ex.: VALE3.SA)  MGLU3.SA
Digite o ticker da ação listada na B3 que deseja avaliar 7 de 10: (ex.: VALE3.SA)  B3SA3.SA
Digite o ticker da ação listada na B3 que deseja avaliar 8 de 10: (ex.: VALE3.SA)  ABEV3.SA
Digite o ticker da ação listada na B3 que deseja avaliar 9 de 10: (ex.: VALE3.SA)  PRIO3.SA
Digite o ticker da ação listada na B3 que deseja avaliar 10 de 10: (ex.: VALE3.SA)  ELET3.SA


In [208]:
# Teste de armazenamento de input

print(acoes)

['VALE3.SA', 'PETR4.SA', 'ITUB4.SA', 'BBDC4.SA', 'BBAS3.SA', 'MGLU3.SA', 'B3SA3.SA', 'ABEV3.SA', 'PRIO3.SA', 'ELET3.SA']


In [209]:
# Teste de integração com leitor_precos()

leitor_precos(acoes[0])

array([ 0.05698012, -0.16262373, -0.08884108,  0.07136117,  0.00681461,
        0.02248934,  0.0260516 ,  0.05515093, -0.00276131, -0.01898736,
        0.0439514 , -0.00038621,  0.00946687, -0.03617224, -0.02700541,
       -0.02142876, -0.01021897,  0.04719754, -0.0263582 ,  0.06406306,
        0.01573128, -0.01376664, -0.00562247,  0.01637737,  0.01074235,
       -0.03871686, -0.01658453, -0.06685407, -0.03442349, -0.01626547,
       -0.01517547,  0.06991713,  0.0307394 ,  0.00938473, -0.01115704,
       -0.05766804,  0.01263859,  0.02474258,  0.00662404,  0.03141567,
        0.02263839, -0.05172053,  0.07342954,  0.00672207,  0.01787117,
        0.03164212,  0.03686468,  0.02684704,  0.01514585, -0.09857904,
        0.04413807,  0.00150978, -0.00489927, -0.14126114,  0.07100325,
       -0.16121051, -0.05130093,  0.05692093,  0.0616891 ,  0.00322808,
       -0.00735469, -0.00671428,  0.08927714, -0.0513587 ,  0.09496957,
        0.08158208, -0.03542858,  0.05963649,  0.01006361,  0.03

### RSOF2 - Gravação do arquivo em uma pasta definida pelo usuário.

Fase de entrada da escolha de pasta onde devem ser guardados os resultados CAPM em arquivos CSV  em cada semana em que o modelo for estimado.

Testes da função de leitura do teclado para escolha da pasta de gravação na primeira iniciação do sistema - leitor_pasta()

In [6]:
#Função de leitura de pasta
def leitor_pasta():
    pass


In [141]:
# Solicitando ao usuário o caminho da pasta
pasta_destino = input("""Digite o caminho da pasta de gravação de arquivos: """)

# teste de armazenamento
print(pasta_destino)

Digite o caminho da pasta de gravação de arquivos:  C:\Users\Documents\


C:\Users\Documents\


In [242]:
# Definindo a função de leitura de pasta

def leitor_pasta() -> str:
    """ Esta função executa a leitura do teclado para a escolha da pasta de gravação dos arquivos """
    pasta_destino = input("""Digite o caminho da pasta de gravação de arquivos: """)
    return pasta_destino


In [143]:
# Teste da função 

pasta = leitor_pasta()

Digite o caminho da pasta de gravação de arquivos:  C:\Users\


In [144]:
# teste de armazenamento 

print(pasta)

C:\Users\


## Módulo de saída

Teste da função que atende ao requisito RU10, resultando em um arquivo de saída que deverá conter a data do resultado da estimação em cada semana em que o modelo for estimado.


In [244]:

# bibliotecas
import os
import csv


In [245]:
#Definindo a função de gravação de dados CAPM em novo arquivo .csv

def grava_csv(pasta_destino: str, resultado_capm: pd.DataFrame):
    """ Esta função cria um novo arquivo CSV com os resultados a cada estimação CAPM realizada """
    arquivo = resultado_capm
    nome_arquivo = "resultados_capm.csv"
    caminho = os.path.join(pasta_destino, nome_arquivo)
    
    arquivo.to_csv(caminho, index=False)
    print(f"Resultados salvos no arquivo {nome_arquivo}")

In [239]:
print(df)

           data     valor
0    1986-03-06  0.068111
1    1986-03-10  0.069028
2    1986-03-12  0.067417
3    1986-03-14  0.064584
4    1986-03-17  0.068222
...         ...       ...
9472 2024-01-18  0.043739
9473 2024-01-19  0.043739
9474 2024-01-22  0.043739
9475 2024-01-23  0.043739
9476 2024-01-24  0.043739

[9477 rows x 2 columns]


In [243]:
p1 = leitor_pasta()

teste = df

grava_csv(p1, teste)

Digite o caminho da pasta de gravação de arquivos:  C:\Users\letis\OneDrive\Área de Trabalho


Resultados salvos no arquivo resultados_capm.csv
