<a href="https://colab.research.google.com/github/vitor-thompson/Python-para-financas-investimento-e-analise-de-dados./blob/main/Calcula_a_covariancia_e_correla%C3%A7%C3%A3o_entre_as_a%C3%A7%C3%B5es.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Calcula a covariancia e correlação entre as ações

In [None]:
# Instala a biblioteca yfinance silenciosamente.
!pip install -q yfinance
# Importa numpy para operações numéricas.
import numpy as np
# Importa pandas para manipulação de dados.
import pandas as pd
# Importa yfinance para download de dados financeiros.
import yfinance as yf
# Importa matplotlib.pyplot para visualização (embora não usado diretamente no código atual, é uma importação comum para análise financeira).
import matplotlib.pyplot as plt

In [None]:
# Define uma lista de tickers (símbolos de ações) das empresas brasileiras a serem analisadas.
# A lista inclui Itaú Unibanco (ITUB4), Itaúsa (ITSA4), Taesa (TAEE11), Sabesp (SBSP3), Vale (VALE3),
# Petrobras (PETR4), Raia Drogasil (RADL3), Weg (WEGE3), BB Seguridade (BBSE3) e Rumo (RAIL3).
tickers = ['ITUB4.SA','ITSA4.SA','TAEE11.SA','SBSP3.SA','VALE3.SA','PETR4.SA', 'RADL3.SA','WEGE3.SA','BBSE3.SA','RAIL3.SA']
# Define o número de dias úteis em um ano comercial, comumente usado em cálculos financeiros.
dias_uteis = 252
# Inicializa um DataFrame vazio do pandas que será usado para armazenar os dados de fechamento das ações.
meus_dados = pd.DataFrame()

# Itera sobre a lista de tickers para baixar os dados históricos de cada ação.
# Para cada ticker 't', a função yf.download() baixa os dados de fechamento ('Close') a partir de '2000-1-1'.
# Os dados de fechamento são então adicionados como uma nova coluna ao DataFrame 'meus_dados'.
for t in tickers:
    meus_dados[t] = yf.download(t, start='2007-1-1')['Close']

In [None]:
# Calcula o retorno logarítmico diário das ações.
# O retorno logarítmico é calculado como o logaritmo natural da razão entre o preço de fechamento atual e o preço de fechamento do dia anterior.
retorno_log_acoes = np.log(meus_dados / meus_dados.shift(1))
# Exibe as primeiras linhas do DataFrame de retornos logarítmicos para verificar os dados.
retorno_log_acoes.head()

In [None]:
# Calcula a variância anualizada dos retornos logarítmicos das ações.
# A variância diária é multiplicada pelo número de dias úteis em um ano (dias_uteis) para obter a variância anualizada.
variancia_acoes = retorno_log_acoes.var() * dias_uteis
# Exibe a variância anualizada de cada ação.
variancia_acoes

In [None]:
# Calcula a matriz de covariância anualizada dos retornos logarítmicos das ações.
# A matriz de covariância diária é multiplicada pelo número de dias úteis para anualizar os valores.
covariancia_acoes = retorno_log_acoes.cov() * dias_uteis
# Exibe a matriz de covariância anualizada.
covariancia_acoes

In [None]:
# Calcula a matriz de correlação dos retornos logarítmicos das ações.
# A correlação mede a força e a direção da relação linear entre os retornos de pares de ações.
correlacao_acoes = retorno_log_acoes.corr()
# Exibe a matriz de correlação.
correlacao_acoes