In [1]:
import pandas as pd
import numpy as np
import math
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats

In [2]:
dataset = pd.read_csv('acoes_02.csv')

# **Calculo da Variância**

In [3]:
# Cria uma variavel para dicionar array com as taxas de retorno logaritmicas utilizando o numpay 
taxas_cvc = np.array([-11.86, 63.73, 74.52, 20.42, -33.29, -128.06])

Calculando a média manualmente

In [4]:
media_cvc = taxas_cvc.sum() / len(taxas_cvc) 
media_cvc


-2.423333333333332

Utilizando o numpy para efetuar o calculo da média

In [5]:
# Utilizando o "numpay" para calcular a variância
media_cvc = taxas_cvc.mean()
media_cvc

-2.423333333333332

Calculando a **Variância** para comparar quanto que os dados estão variando comparados com a média 

In [6]:
((taxas_cvc - media_cvc) ** 2).sum() / len(taxas_cvc)

4607.455288888889

In [7]:
# Utilizando o "numpay" para calcular a variância
variancia_cvc = taxas_cvc.var()
variancia_cvc

4607.455288888889

In [8]:
taxas_mglu = np.array([-121.56, 177.74, 184.29, 82.56, 71.86, 70.62])

### Calculo da média:

In [9]:
media_mglu = taxas_mglu.sum() / len(taxas_mglu)
media_mglu


77.585

### Efetuando o calculo da variância manualmente:

In [10]:
((taxas_mglu - media_mglu) ** 2).sum() / len(taxas_mglu) 


10196.958258333332

*Utilizando o numpy para efetuar o calculo da variância para verificar o quanto o valor da ação esta variando de acordo com a média.
Obs.: Quanto maior a variação maior a volatilidade - consequentemente maior o risco!* 

In [11]:
variancia_mglu = taxas_mglu.var()
variancia_mglu

10196.958258333332

*Os calculos acima foram efetuados utilizando as taxas de retorno de cada um dos anos, mas tambem pode ser utilizado os preços das ações.
Calculo da variancia utilizando os 330 dias anteriores:*

In [12]:
dataset['CVC'].tail(330).var(), dataset['MGLU'].tail(330).var()

(264.3155068605532, 27.731156999094598)

### Desvio Padrão

In [13]:
# Utiliza-se do "math.sqrt()" -> para efetuar o calculo da raiz quadrada do resultado da variancia, pois é necessário para encontrar o resultado em percentual  
desvio_padrao_cvc = math.sqrt(variancia_cvc)
desvio_padrao_cvc

67.87823869907712

In [14]:
#É feito automaticamente o calculo da variância e da raiz quadrada para encontrar o (desvio padrão)
#Taxa de retorno possui volatilidade de 67.87%
taxas_cvc.std()

67.87823869907712

In [15]:
# A afirmação é que a taxa de retorno da mglu possui uma volatilidade de 100.98%
desvio_padrao_mglu = math.sqrt(variancia_mglu)
desvio_padrao_mglu

100.97998939558933

In [16]:
taxas_mglu.std()

100.97998939558933

*Teste dos valores do desvio padrão considerando as taxas de retorno para verificar qual ação que tem uma volatilidade maior.
Obs. Neste caso de 330 dias de consulta das taxas de retorno o maior desvio padrão é o da CVC, que indica uma maior volatilidade (maior risco)!*

In [17]:
#Os valores adicionados como argumento dos parâmetro da função.tail() -> são numero de dias a serem levantados
dataset['CVC'].tail(330).std(), dataset['MGLU'].tail(330).std()

(16.257782962647557, 5.266038074216194)

***

# **Coeficiente de Variação**

In [18]:
desvio_padrao_cvc, media_cvc

(67.87823869907712, -2.423333333333332)

*Calculo manual do coeficiente de variação da CVC em percentual*

In [19]:
coeficinete_variacao_cvc = (desvio_padrao_cvc / media_cvc) * 100
coeficinete_variacao_cvc

-2801.0277317363334

*Calculo do coeficiente em percentual utilizando a biblioteca python: "stats.variation()"*

In [20]:
stats.variation(taxas_cvc) * 100

-2801.0277317363334

In [21]:
stats.variation(taxas_mglu) * 100

130.15401095004106