# Mundo 6

### Introdução ao Pandas

In [1]:
import pandas as pd
import numpy as np

In [4]:
def gerador_serie_historica(valor_inicial, volatilidade, periodos, dia_inicial, frequencia = "ME"):
    
    vetor = [valor_inicial]

    for i in range(periodos - 1):

            preco = vetor[i] * (1 + np.random.normal(0, volatilidade))

            vetor.append(preco)


    serie = pd.Series(vetor, index = pd.date_range(dia_inicial, 
                                                   periods = periodos, freq = frequencia)) 
                               
    return serie
    
    

In [5]:
serie_euro = gerador_serie_historica(5, 0.01, 5, "2022-01-01")
serie_cotacoes = gerador_serie_historica(20, 0.05, 5, "2022-01-01")
serie_cotacoes

2022-01-31    20.000000
2022-02-28    19.463675
2022-03-31    18.428085
2022-04-30    19.585501
2022-05-31    20.467743
Freq: ME, dtype: float64

In [6]:
serie_euro

2022-01-31    5.000000
2022-02-28    4.992869
2022-03-31    5.058072
2022-04-30    5.109667
2022-05-31    5.163052
Freq: ME, dtype: float64

In [7]:
#as operações aritméticas são feitas através dos índices! 

serie_cotacoes_em_euro = serie_cotacoes/serie_euro
serie_cotacoes_em_euro

2022-01-31    4.000000
2022-02-28    3.898295
2022-03-31    3.643302
2022-04-30    3.833029
2022-05-31    3.964272
Freq: ME, dtype: float64

In [8]:
serie_lucro = gerador_serie_historica(2, 0.5, 5, "2022-01-01")
serie_cotacoes = gerador_serie_historica(20, 0.05, 5, "2022-01-01")


df = pd.DataFrame({"cotacao": serie_cotacoes,
                 "lucro_por_acao": serie_lucro})

df

Unnamed: 0,cotacao,lucro_por_acao
2022-01-31,20.0,2.0
2022-02-28,19.857978,0.833487
2022-03-31,19.997185,1.651499
2022-04-30,20.417772,0.649963
2022-05-31,21.657677,0.68778


In [9]:
#criando coluna P/L

df['PL'] = df['cotacao']/df['lucro_por_acao']

df

Unnamed: 0,cotacao,lucro_por_acao,PL
2022-01-31,20.0,2.0,10.0
2022-02-28,19.857978,0.833487,23.825193
2022-03-31,19.997185,1.651499,12.108504
2022-04-30,20.417772,0.649963,31.413755
2022-05-31,21.657677,0.68778,31.489254


In [14]:
#pode fazer qualquer operação 

print(df['cotacao'] + df['lucro_por_acao'])
print(df['cotacao'] - df['lucro_por_acao'])
print(df['cotacao'] ** df['lucro_por_acao'])

2022-01-31    22.000000
2022-02-28    21.504171
2022-03-31    21.811165
2022-04-30    20.645097
2022-05-31    20.878849
Freq: M, dtype: float64
2022-01-31    18.000000
2022-02-28    17.246493
2022-03-31    15.660576
2022-04-30    16.462362
2022-05-31    18.144088
Freq: M, dtype: float64
2022-01-31     400.000000
2022-02-28     549.979773
2022-03-31    8200.627610
2022-04-30     449.527456
2022-05-31      58.118904
Freq: M, dtype: float64


In [12]:
#operações dentro de uma mesma coluna

#somar dados de uma coluna

serie_lucro_trimestral = gerador_serie_historica(20000, 2, 4, "2022-01-01", frequencia = "QE")

print(serie_lucro_trimestral)

lucro_anual = serie_lucro_trimestral.sum()
lucro_anual

2022-03-31    2.000000e+04
2022-06-30    1.035321e+05
2022-09-30   -4.322084e+05
2022-12-31   -1.277966e+06
Freq: QE-DEC, dtype: float64


np.float64(-1586642.480252769)

In [14]:
#acumular dados de uma coluna

serie_lucro_trimestral = gerador_serie_historica(20000, 2, 4, "2022-01-01", frequencia = "QE")

print(serie_lucro_trimestral)

crescimento_lucros  = serie_lucro_trimestral.cumsum()

crescimento_lucros

2022-03-31    20000.000000
2022-06-30     4124.358173
2022-09-30    -1983.446659
2022-12-31    -1809.645985
Freq: QE-DEC, dtype: float64


2022-03-31    20000.000000
2022-06-30    24124.358173
2022-09-30    22140.911514
2022-12-31    20331.265529
Freq: QE-DEC, dtype: float64

In [None]:
#maior e menor dado de lucro no trimestre

In [16]:
serie_lucro_trimestral = gerador_serie_historica(20000, 2, 4, "2022-01-01", frequencia = "QE")

print(serie_lucro_trimestral)

lucro_max = serie_lucro_trimestral.max()
lucro_min = serie_lucro_trimestral.min()

print(lucro_min)
lucro_max

2022-03-31    20000.000000
2022-06-30   -26518.308364
2022-09-30    56105.319828
2022-12-31    97429.469429
Freq: QE-DEC, dtype: float64
-26518.30836443307


np.float64(97429.46942861451)

# Exercícios 

No dataframe base trabalhado em todas as aulas:

* Exercício 50: Crie uma nova coluna chamada "lucro_por_acao" e calcule o lucro por ação baseado nas informações de PL e preço. Obs: LPA = P/Indicador(PL)
* Exercício 51: Assuma a cotação do dólar como 5.25 e crie a coluna de cotações dolarizadas na tabela.
* Exercício 52: Encontre qual volume total negociado por todas as ações. 
* Exercício 53: Selecione as ações com maior e menor Lucro por ação do dataframe. Dica: use métodos de seleção ensinados na aula passada! 


In [18]:
dicionario = {
       "nomes": ["Weg", "Petrobras", "Vale", "Petrobras", "Lojas Renner"],
       "tickers": ["WEGE3", "PETR3", "VALE3", "PETR4", "LREN3"],  
       "cotacoes": [20, 30, 40, 12, 35],
       "preco_sobre_lucro": [25, 6, 12, 7, 25],  
       "volume": [5000, 1000, 4000, 7000, 1200]
}

df_info_empresas = pd.DataFrame(dicionario)

df_info_empresas = df_info_empresas.set_index("tickers")

df_info_empresas.columns = ['nomes', 'precos', 'preco_sobre_lucro', 'volume']

In [21]:
# Exercício 50: Crie uma nova coluna chamada "lucro_por_acao" 
# e calcule o lucro por ação baseado nas informações de PL e preço. 
# Obs: LPA = P/Indicador(PL)
df_info_empresas['lucro_por_acao'] = df_info_empresas['precos']/df_info_empresas['preco_sobre_lucro']
df_info_empresas


Unnamed: 0_level_0,nomes,precos,preco_sobre_lucro,volume,lucro_por_acao
tickers,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
WEGE3,Weg,20,25,5000,0.8
PETR3,Petrobras,30,6,1000,5.0
VALE3,Vale,40,12,4000,3.333333
PETR4,Petrobras,12,7,7000,1.714286
LREN3,Lojas Renner,35,25,1200,1.4


In [27]:
# Exercício 51: Assuma a cotação do dólar como 5.25 e crie 
# a coluna de cotações dolarizadas na tabela.

df_info_empresas['precos_dolar'] = df_info_empresas['precos'] / 5.25

df_info_empresas

Unnamed: 0_level_0,nomes,precos,preco_sobre_lucro,volume,lucro_por_acao,precos_dolar
tickers,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
WEGE3,Weg,20,25,5000,0.8,3.809524
PETR3,Petrobras,30,6,1000,5.0,5.714286
VALE3,Vale,40,12,4000,3.333333,7.619048
PETR4,Petrobras,12,7,7000,1.714286,2.285714
LREN3,Lojas Renner,35,25,1200,1.4,6.666667


In [28]:
# Exercício 52: Encontre qual volume total negociado por todas as ações. 

volume_total = df_info_empresas['volume'].sum()

volume_total

np.int64(18200)

In [30]:
# Exercício 53: Selecione as ações com maior e menor Lucro por ação do dataframe. 
# Dica: use métodos de seleção ensinados na aula passada! 

maior = df_info_empresas['lucro_por_acao'].max()
menor = df_info_empresas['lucro_por_acao'].min()

print(f'Maior: {maior}')
print(f'Menor: {menor}')

Maior: 5.0
Menor: 0.8


In [22]:
#df_base

dicionario = {
       "nomes": ["Weg", "Petrobras", "Vale", "Petrobras", "Lojas Renner"],
       "tickers": ["WEGE3", "PETR3", "VALE3", "PETR4", "LREN3"],  
       "cotacoes": [20, 30, 40, 12, 35],
       "preco_sobre_lucro": [25, 6, 12, 7, 25],  
       "volume": [5000, 1000, 4000, 7000, 1200]
}

df_info_empresas = pd.DataFrame(dicionario)

df_info_empresas = df_info_empresas.set_index("tickers")

df_info_empresas.columns = ['nomes', 'precos', 'preco_sobre_lucro', 'volume']

In [23]:
#gabarito 50

df_info_empresas['lpa'] = df_info_empresas['precos'] / df_info_empresas['preco_sobre_lucro']

df_info_empresas

Unnamed: 0_level_0,nomes,precos,preco_sobre_lucro,volume,lpa
tickers,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
WEGE3,Weg,20,25,5000,0.8
PETR3,Petrobras,30,6,1000,5.0
VALE3,Vale,40,12,4000,3.333333
PETR4,Petrobras,12,7,7000,1.714286
LREN3,Lojas Renner,35,25,1200,1.4


In [24]:
#gabarito 51

dolar = 5.25

df_info_empresas['precos_dolar'] = df_info_empresas['precos'] / dolar

df_info_empresas

Unnamed: 0_level_0,nomes,precos,preco_sobre_lucro,volume,lpa,precos_dolar
tickers,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
WEGE3,Weg,20,25,5000,0.8,3.809524
PETR3,Petrobras,30,6,1000,5.0,5.714286
VALE3,Vale,40,12,4000,3.333333,7.619048
PETR4,Petrobras,12,7,7000,1.714286,2.285714
LREN3,Lojas Renner,35,25,1200,1.4,6.666667


In [25]:
#gabarito 52

volume_total = df_info_empresas['volume'].sum()
volume_total

18200

In [28]:
#gabarito 53

lpa_maximo = df_info_empresas['lpa'].max()
lpa_minimo = df_info_empresas['lpa'].min()

maiorlpa_empresa = df_info_empresas[df_info_empresas['lpa'] == lpa_maximo]
maiorlpa_empresa = maiorlpa_empresa.iat[0, 0]

menorlpa_empresa = df_info_empresas[df_info_empresas['lpa'] == lpa_minimo]
menorlpa_empresa = menorlpa_empresa.iat[0, 0]

print(maiorlpa_empresa)
print(menorlpa_empresa)

Petrobras
Weg


# Mundo 7

Na próxima aula vamos aprender a usar duas ferramentas muito úteis no Pandas: Rankings e ordenação. Afinal, como ordenar uma tabela do maior pro menor PL, por exemplo?