<a href="https://colab.research.google.com/github/VictorHolanda21/fii-com-python/blob/main/Fundos_Imobili%C3%A1rios_com_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---
# **Análise de Fundo de Investimento Imobiliários (FII) com Python**
---

## **1. Fonte utilizada**

Site: [Funds Explorer](https://www.fundsexplorer.com.br/ranking)<br>
YouTube: <br>
* [Trading com Dados](https://www.youtube.com/watch?v=CMs1jZEIXYo) <br>
* [Stack](https://www.youtube.com/watch?v=hsivPUfjjTU)





## **2. Bibliotecas utilizadas**

In [425]:
!pip install requests
!pip install bs4



In [426]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import numpy as np


## **3. Webscraping para Rendimentos de Fundos Imobiliários (FIIs)**

In [427]:
url = "https://www.fundsexplorer.com.br/ranking"
fii_url = requests.get(url)


In [428]:
# fii_url.text

In [429]:
fii_bs4 = BeautifulSoup(fii_url.text, "html.parser")
## fii_bs4.head()

In [430]:
fii_table_div = fii_bs4.findAll(attrs={'id':'scroll-wrapper'})


In [431]:
fii_table = fii_table_div[0].findAll('table')

In [432]:
type(fii_table)

bs4.element.ResultSet

In [433]:
fii_df = pd.read_html(str(fii_table[0]))[0]

In [434]:
fii_df.columns

Index(['Códigodo fundo', 'Setor', 'Preço Atual', 'Liquidez Diária',
       'Dividendo', 'DividendYield', 'DY (3M)Acumulado', 'DY (6M)Acumulado',
       'DY (12M)Acumulado', 'DY (3M)Média', 'DY (6M)Média', 'DY (12M)Média',
       'DY Ano', 'Variação Preço', 'Rentab.Período', 'Rentab.Acumulada',
       'PatrimônioLíq.', 'VPA', 'P/VPA', 'DYPatrimonial',
       'VariaçãoPatrimonial', 'Rentab. Patr.no Período',
       'Rentab. Patr.Acumulada', 'VacânciaFísica', 'VacânciaFinanceira',
       'QuantidadeAtivos'],
      dtype='object')

In [435]:
str(list(fii_df['Códigodo fundo'].sort_values()))

"['ABCP11', 'AFHI11', 'AFOF11', 'AIEC11', 'ALMI11', 'ALZR11', 'APTO11', 'ARCT11', 'ARRI11', 'ATSA11', 'BARI11', 'BBFI11B', 'BBFO11', 'BBGO11', 'BBIM11', 'BBPO11', 'BBRC11', 'BCFF11', 'BCIA11', 'BCRI11', 'BICE11', 'BICR11', 'BIME11', 'BLCA11', 'BLCP11', 'BLMC11', 'BLMG11', 'BLMO11', 'BLMR11', 'BMLC11', 'BNFS11', 'BPFF11', 'BPML11', 'BRCO11', 'BRCR11', 'BREV11', 'BRLA11', 'BTAL11', 'BTCR11', 'BTLG11', 'BTRA11', 'BTSG11', 'BTWR11', 'BZLI11', 'CACR11', 'CARE11', 'CBOP11', 'CCRF11', 'CEOC11', 'CJCT11', 'CNES11', 'CORM11', 'CPFF11', 'CPTS11', 'CRFF11', 'CTXT11', 'CVBI11', 'CXAG11', 'CXCE11B', 'CXCI11', 'CXCO11', 'CXRI11', 'CXTL11', 'CYCR11', 'DEVA11', 'DRIT11B', 'DVFF11', 'EDFO11B', 'EDGA11', 'EQIR11', 'ERCR11', 'ERPA11', 'EURO11', 'EVBI11', 'FAED11', 'FAMB11B', 'FATN11', 'FCFL11', 'FEXC11', 'FIGS11', 'FIIB11', 'FIIP11B', 'FISC11', 'FIVN11', 'FLCR11', 'FLMA11', 'FLRP11', 'FMOF11', 'FPAB11', 'FVPQ11', 'GALG11', 'GAME11', 'GCFF11', 'GCRA11', 'GCRI11', 'GESE11B', 'GGRC11', 'GSFI11', 'GTLG11', '

## **4. Organização dos dados extraídos**

In [436]:
# Cópia de segurança do Data frame que será utilizado

fii_df_backup = fii_df.copy()

In [437]:
fii_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,"R$ 2,18",16868.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 65.678.487,99","R$ 6,98",31.0,,,,,"56,00%",,1
1,BZLI11,Títulos e Val. Mob.,"R$ 14,70",44041.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 431.076.817,02","R$ 10,70",137.0,,,,,,,0
2,XTED11,Lajes Corporativas,"R$ 6,15",394.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 27.305.951,24","R$ 13,89",44.0,,,,,"0,00%","100,00%",1
3,ALMI11,Lajes Corporativas,"R$ 932,03",21.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 249.632.973,43","R$ 2.245,37",42.0,,,,,"64,05%",,1
4,PABY11,Híbrido,"R$ 7,45",95.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ -9.546.407,61","R$ -12,59",-59.0,,,,,,,1


In [438]:
fii_df['Preço Atual']

0        R$ 2,18
1       R$ 14,70
2        R$ 6,15
3      R$ 932,03
4        R$ 7,45
         ...    
277    R$ 385,00
278     R$ 87,19
279     R$ 76,98
280     R$ 76,12
281    R$ 115,39
Name: Preço Atual, Length: 282, dtype: object

In [439]:
fii_df.iloc[0]

Códigodo fundo                       FIVN11
Setor                             Shoppings
Preço Atual                         R$ 2,18
Liquidez Diária                     16868.0
Dividendo                           R$ 0,00
DividendYield                         0,00%
DY (3M)Acumulado                      0,00%
DY (6M)Acumulado                      0,00%
DY (12M)Acumulado                     0,00%
DY (3M)Média                          0,00%
DY (6M)Média                          0,00%
DY (12M)Média                         0,00%
DY Ano                                  NaN
Variação Preço                        0,00%
Rentab.Período                        0,00%
Rentab.Acumulada                      0,00%
PatrimônioLíq.             R$ 65.678.487,99
VPA                                 R$ 6,98
P/VPA                                  31.0
DYPatrimonial                           NaN
VariaçãoPatrimonial                     NaN
Rentab. Patr.no Período                 NaN
Rentab. Patr.Acumulada          

In [440]:
fii_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 282 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   Códigodo fundo           282 non-null    object 
 1   Setor                    278 non-null    object 
 2   Preço Atual              274 non-null    object 
 3   Liquidez Diária          274 non-null    float64
 4   Dividendo                282 non-null    object 
 5   DividendYield            276 non-null    object 
 6   DY (3M)Acumulado         276 non-null    object 
 7   DY (6M)Acumulado         276 non-null    object 
 8   DY (12M)Acumulado        276 non-null    object 
 9   DY (3M)Média             276 non-null    object 
 10  DY (6M)Média             276 non-null    object 
 11  DY (12M)Média            276 non-null    object 
 12  DY Ano                   262 non-null    object 
 13  Variação Preço           276 non-null    object 
 14  Rentab.Período           2

In [441]:
categorical_columns = ['Códigodo fundo','Setor']

In [442]:
fii_df[categorical_columns].isna().sum()

Códigodo fundo    0
Setor             4
dtype: int64

In [443]:
fii_df[fii_df['Setor'].isna()]

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
22,CXCI11,,"R$ 80,42",298.0,"R$ 0,70","0,80%","0,00%","0,00%","0,00%","0,00%",...,"R$ 200.991.074,86","R$ 97,68",82.0,"0,72%","-0,07%","0,65%","0,96%",,,0
188,BIME11,,"R$ 9,81",4292.0,"R$ 0,14","1,45%","3,91%","0,00%","0,00%","1,30%",...,"R$ 55.586.536,14","R$ 9,51",103.0,"1,47%","-0,13%","1,34%","3,05%",,,0
192,ERPA11,,"R$ 127,00",2.0,"R$ 0,31","0,24%","0,00%","0,00%","0,00%","0,00%",...,"R$ 57.806.170,89","R$ 115,40",110.0,"0,20%","0,24%","0,43%","0,43%",,,0
220,GTLG11,,"R$ 99,98",285007.0,"R$ 0,70","0,70%","2,10%","4,21%","0,00%","0,70%",...,"R$ 686.120.716,23","R$ 95,65",105.0,"0,73%","-1,06%","-0,33%","0,52%",,,0


In [444]:
idx_setor_na = fii_df[fii_df['Setor'].isna()].index

In [445]:
idx_setor_na

Int64Index([22, 188, 192, 220], dtype='int64')

In [446]:
fii_df.drop(idx_setor_na, inplace=True)

In [447]:
fii_df[categorical_columns].isna().sum()

Códigodo fundo    0
Setor             0
dtype: int64

In [448]:
fii_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,"R$ 2,18",16868.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 65.678.487,99","R$ 6,98",31.0,,,,,"56,00%",,1
1,BZLI11,Títulos e Val. Mob.,"R$ 14,70",44041.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 431.076.817,02","R$ 10,70",137.0,,,,,,,0
2,XTED11,Lajes Corporativas,"R$ 6,15",394.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 27.305.951,24","R$ 13,89",44.0,,,,,"0,00%","100,00%",1
3,ALMI11,Lajes Corporativas,"R$ 932,03",21.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 249.632.973,43","R$ 2.245,37",42.0,,,,,"64,05%",,1
4,PABY11,Híbrido,"R$ 7,45",95.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ -9.546.407,61","R$ -12,59",-59.0,,,,,,,1


In [449]:
fii_df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 278 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   Códigodo fundo           278 non-null    object 
 1   Setor                    278 non-null    object 
 2   Preço Atual              270 non-null    object 
 3   Liquidez Diária          270 non-null    float64
 4   Dividendo                278 non-null    object 
 5   DividendYield            272 non-null    object 
 6   DY (3M)Acumulado         272 non-null    object 
 7   DY (6M)Acumulado         272 non-null    object 
 8   DY (12M)Acumulado        272 non-null    object 
 9   DY (3M)Média             272 non-null    object 
 10  DY (6M)Média             272 non-null    object 
 11  DY (12M)Média            272 non-null    object 
 12  DY Ano                   258 non-null    object 
 13  Variação Preço           272 non-null    object 
 14  Rentab.Período           2

In [450]:
fii_df[categorical_columns] = fii_df[categorical_columns].astype('category')

In [451]:
fii_df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 278 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype   
---  ------                   --------------  -----   
 0   Códigodo fundo           278 non-null    category
 1   Setor                    278 non-null    category
 2   Preço Atual              270 non-null    object  
 3   Liquidez Diária          270 non-null    float64 
 4   Dividendo                278 non-null    object  
 5   DividendYield            272 non-null    object  
 6   DY (3M)Acumulado         272 non-null    object  
 7   DY (6M)Acumulado         272 non-null    object  
 8   DY (12M)Acumulado        272 non-null    object  
 9   DY (3M)Média             272 non-null    object  
 10  DY (6M)Média             272 non-null    object  
 11  DY (12M)Média            272 non-null    object  
 12  DY Ano                   258 non-null    object  
 13  Variação Preço           272 non-null    object  
 14  Rentab.Per

In [452]:
fii_df.iloc[:,2:-1].columns

Index(['Preço Atual', 'Liquidez Diária', 'Dividendo', 'DividendYield',
       'DY (3M)Acumulado', 'DY (6M)Acumulado', 'DY (12M)Acumulado',
       'DY (3M)Média', 'DY (6M)Média', 'DY (12M)Média', 'DY Ano',
       'Variação Preço', 'Rentab.Período', 'Rentab.Acumulada',
       'PatrimônioLíq.', 'VPA', 'P/VPA', 'DYPatrimonial',
       'VariaçãoPatrimonial', 'Rentab. Patr.no Período',
       'Rentab. Patr.Acumulada', 'VacânciaFísica', 'VacânciaFinanceira'],
      dtype='object')

In [453]:
float_columns = list(fii_df.iloc[:,2:-1].columns)

In [454]:
fii_df[float_columns].head()

Unnamed: 0,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,DY (6M)Média,DY (12M)Média,...,Rentab.Acumulada,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira
0,"R$ 2,18",16868.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"0,00%","R$ 65.678.487,99","R$ 6,98",31.0,,,,,"56,00%",
1,"R$ 14,70",44041.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"1,14%","R$ 431.076.817,02","R$ 10,70",137.0,,,,,,
2,"R$ 6,15",394.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"-37,83%","R$ 27.305.951,24","R$ 13,89",44.0,,,,,"0,00%","100,00%"
3,"R$ 932,03",21.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"-28,29%","R$ 249.632.973,43","R$ 2.245,37",42.0,,,,,"64,05%",
4,"R$ 7,45",95.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%","0,00%",...,"-31,62%","R$ -9.546.407,61","R$ -12,59",-59.0,,,,,,


In [455]:
# fii_df[float_columns].fillna(value=0)

In [456]:
fii_df[float_columns] = fii_df[float_columns].replace(to_replace = r'^R\$ ', value = '',regex = True)

In [457]:
fii_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,218,16868.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"65.678.487,99",698,31.0,,,,,"56,00%",,1
1,BZLI11,Títulos e Val. Mob.,1470,44041.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"431.076.817,02",1070,137.0,,,,,,,0
2,XTED11,Lajes Corporativas,615,394.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"27.305.951,24",1389,44.0,,,,,"0,00%","100,00%",1
3,ALMI11,Lajes Corporativas,93203,21.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"249.632.973,43","2.245,37",42.0,,,,,"64,05%",,1
4,PABY11,Híbrido,745,95.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"-9.546.407,61",-1259,-59.0,,,,,,,1


In [458]:
fii_df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 278 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype   
---  ------                   --------------  -----   
 0   Códigodo fundo           278 non-null    category
 1   Setor                    278 non-null    category
 2   Preço Atual              270 non-null    object  
 3   Liquidez Diária          270 non-null    float64 
 4   Dividendo                278 non-null    object  
 5   DividendYield            272 non-null    object  
 6   DY (3M)Acumulado         272 non-null    object  
 7   DY (6M)Acumulado         272 non-null    object  
 8   DY (12M)Acumulado        272 non-null    object  
 9   DY (3M)Média             272 non-null    object  
 10  DY (6M)Média             272 non-null    object  
 11  DY (12M)Média            272 non-null    object  
 12  DY Ano                   258 non-null    object  
 13  Variação Preço           272 non-null    object  
 14  Rentab.Per

In [459]:
fii_df['PatrimônioLíq.']

0         65.678.487,99
1        431.076.817,02
2         27.305.951,24
3        249.632.973,43
4         -9.546.407,61
             ...       
277       50.992.934,89
278      195.230.258,40
279      376.309.193,73
280      489.344.835,30
281    2.187.502.617,24
Name: PatrimônioLíq., Length: 278, dtype: object

In [460]:
remove_dot_columns = ['PatrimônioLíq.','Preço Atual', 'Dividendo', 'VPA']

In [461]:
fii_df[remove_dot_columns] =  fii_df[remove_dot_columns].applymap(lambda x: str(x).replace('.',''))

In [462]:
fii_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,218,16868.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,6567848799,698,31.0,,,,,"56,00%",,1
1,BZLI11,Títulos e Val. Mob.,1470,44041.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,43107681702,1070,137.0,,,,,,,0
2,XTED11,Lajes Corporativas,615,394.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,2730595124,1389,44.0,,,,,"0,00%","100,00%",1
3,ALMI11,Lajes Corporativas,93203,21.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,24963297343,224537,42.0,,,,,"64,05%",,1
4,PABY11,Híbrido,745,95.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,-954640761,-1259,-59.0,,,,,,,1


In [463]:
fii_df[remove_dot_columns] = fii_df[remove_dot_columns].applymap(lambda x: str(x).replace(',','.'))

In [464]:
fii_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,2.18,16868.0,0.0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,65678487.99,6.98,31.0,,,,,"56,00%",,1
1,BZLI11,Títulos e Val. Mob.,14.7,44041.0,0.0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,431076817.02,10.7,137.0,,,,,,,0
2,XTED11,Lajes Corporativas,6.15,394.0,0.0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,27305951.24,13.89,44.0,,,,,"0,00%","100,00%",1
3,ALMI11,Lajes Corporativas,932.03,21.0,0.0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,249632973.43,2245.37,42.0,,,,,"64,05%",,1
4,PABY11,Híbrido,7.45,95.0,0.0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,-9546407.61,-12.59,-59.0,,,,,,,1


In [465]:
# fii_df['PatrimônioLíq.'] = fii_df['PatrimônioLíq.'].str.replace(',','.')
# fii_df['Preço Atual'] = fii_df['Preço Atual'].str.replace(',','.')
# fii_df['Dividendo'] = fii_df['Dividendo'].str.replace(',','.')
# fii_df['VPA'] = fii_df['VPA'].str.replace(',','.')

In [466]:
fii_df['PatrimônioLíq.']

0        65678487.99
1       431076817.02
2        27305951.24
3       249632973.43
4        -9546407.61
           ...      
277      50992934.89
278     195230258.40
279     376309193.73
280     489344835.30
281    2187502617.24
Name: PatrimônioLíq., Length: 278, dtype: object

In [467]:
fii_df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 278 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype   
---  ------                   --------------  -----   
 0   Códigodo fundo           278 non-null    category
 1   Setor                    278 non-null    category
 2   Preço Atual              278 non-null    object  
 3   Liquidez Diária          270 non-null    float64 
 4   Dividendo                278 non-null    object  
 5   DividendYield            272 non-null    object  
 6   DY (3M)Acumulado         272 non-null    object  
 7   DY (6M)Acumulado         272 non-null    object  
 8   DY (12M)Acumulado        272 non-null    object  
 9   DY (3M)Média             272 non-null    object  
 10  DY (6M)Média             272 non-null    object  
 11  DY (12M)Média            272 non-null    object  
 12  DY Ano                   258 non-null    object  
 13  Variação Preço           272 non-null    object  
 14  Rentab.Per

In [468]:
# fii_df['PatrimônioLíq.'] = fii_df['PatrimônioLíq.'].astype(float)
# fii_df['Dividendo'] = fii_df['Dividendo'].astype(float)
# fii_df['Preço Atual'] = fii_df['Preço Atual'].astype(float)
# fii_df['VPA'] = fii_df['VPA'].astype(float)

In [469]:
fii_df[remove_dot_columns] =  fii_df[remove_dot_columns].astype(float)

In [470]:
fii_df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 278 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype   
---  ------                   --------------  -----   
 0   Códigodo fundo           278 non-null    category
 1   Setor                    278 non-null    category
 2   Preço Atual              270 non-null    float64 
 3   Liquidez Diária          270 non-null    float64 
 4   Dividendo                278 non-null    float64 
 5   DividendYield            272 non-null    object  
 6   DY (3M)Acumulado         272 non-null    object  
 7   DY (6M)Acumulado         272 non-null    object  
 8   DY (12M)Acumulado        272 non-null    object  
 9   DY (3M)Média             272 non-null    object  
 10  DY (6M)Média             272 non-null    object  
 11  DY (12M)Média            272 non-null    object  
 12  DY Ano                   258 non-null    object  
 13  Variação Preço           272 non-null    object  
 14  Rentab.Per

In [471]:
np.max(fii_df['Preço Atual'])

76000.0

In [472]:
np.min(fii_df['Preço Atual'])

0.9

In [473]:
fii_df.iloc[0:10].transpose()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9
Códigodo fundo,FIVN11,BZLI11,XTED11,ALMI11,PABY11,ORPD11,FISC11,BNFS11,HSML11,SHPH11
Setor,Shoppings,Títulos e Val. Mob.,Lajes Corporativas,Lajes Corporativas,Híbrido,Títulos e Val. Mob.,Lajes Corporativas,Outros,Shoppings,Shoppings
Preço Atual,2.18,14.7,6.15,932.03,7.45,100.0,165.0,118.12,77.83,795.0
Liquidez Diária,16868.0,44041.0,394.0,21.0,95.0,4.0,200.0,389.0,19306.0,390.0
Dividendo,0.0,0.0,0.0,0.0,0.0,1.38,0.22,1.42,0.6,3.35
DividendYield,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","1,20%","0,74%","0,41%"
DY (3M)Acumulado,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","3,22%","2,27%","1,34%"
DY (6M)Acumulado,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","6,37%","4,37%","2,81%"
DY (12M)Acumulado,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","11,76%","7,72%","4,75%"
DY (3M)Média,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","1,07%","0,76%","0,45%"


In [474]:
fii_df = fii_df.replace(to_replace = r'%$', value = '',regex = True)

In [475]:
fii_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,2.18,16868.0,0.0,0,0,0,0,0,...,65678490.0,6.98,31.0,,,,,5600.0,,1
1,BZLI11,Títulos e Val. Mob.,14.7,44041.0,0.0,0,0,0,0,0,...,431076800.0,10.7,137.0,,,,,,,0
2,XTED11,Lajes Corporativas,6.15,394.0,0.0,0,0,0,0,0,...,27305950.0,13.89,44.0,,,,,0.0,10000.0,1
3,ALMI11,Lajes Corporativas,932.03,21.0,0.0,0,0,0,0,0,...,249633000.0,2245.37,42.0,,,,,6405.0,,1
4,PABY11,Híbrido,7.45,95.0,0.0,0,0,0,0,0,...,-9546408.0,-12.59,-59.0,,,,,,,1


In [476]:
fii_df.iloc[0:0].transpose()

Códigodo fundo
Setor
Preço Atual
Liquidez Diária
Dividendo
DividendYield
DY (3M)Acumulado
DY (6M)Acumulado
DY (12M)Acumulado
DY (3M)Média
DY (6M)Média


In [477]:
set(fii_df.Setor)

{'Hospital',
 'Hotel',
 'Híbrido',
 'Lajes Corporativas',
 'Logística',
 'Outros',
 'Residencial',
 'Shoppings',
 'Títulos e Val. Mob.'}

In [478]:
replace_comma_dot = [
                     'DividendYield',
                     'DY (3M)Acumulado',
                     'DY (6M)Acumulado',
                     'DY (12M)Acumulado',
                     'DY (3M)Média',
                     'DY (6M)Média',
                     'DY (12M)Média',
                     'DY Ano',
                     'Variação Preço',
                     'Rentab.Período',
                     'Rentab.Acumulada',
                     'DYPatrimonial',
                     'VariaçãoPatrimonial',
                     'Rentab. Patr.no Período',
                     'Rentab. Patr.Acumulada',
                     'VacânciaFísica',
                     'VacânciaFinanceira',
]

In [479]:
fii_df[replace_comma_dot] = fii_df[replace_comma_dot].applymap(lambda x: str(x).replace(',','.'))

In [480]:
# fii_df['DividendYield'] = fii_df['DividendYield'].str.replace(',','.').astype(float)

In [481]:
# fii_df['DY (3M)Acumulado'] = fii_df['DY (3M)Acumulado'].str.replace(',','.').astype(float)
# fii_df['DY (6M)Acumulado'] = fii_df['DY (6M)Acumulado'].str.replace(',','.').astype(float)
# fii_df['DY (12M)Acumulado'] = fii_df['DY (12M)Acumulado'].str.replace(',','.').astype(float)
# fii_df['DY (3M)Média'] = fii_df['DY (3M)Média'].str.replace(',','.').astype(float)
# fii_df['DY (6M)Média'] = fii_df['DY (6M)Média'].str.replace(',','.').astype(float)
# fii_df['DY (12M)Média'] = fii_df['DY (12M)Média'].str.replace(',','.').astype(float)
# fii_df['DY Ano'] = fii_df['DY Ano'].str.replace(',','.').astype(float)
# fii_df['Variação Preço'] = fii_df['Variação Preço'].str.replace(',','.').astype(float)
# fii_df['Rentab.Período'] = fii_df['Rentab.Período'].str.replace(',','.').astype(float)
# fii_df['Rentab.Acumulada'] = fii_df['Rentab.Acumulada'].str.replace(',','.').astype(float)
# fii_df['DYPatrimonial'] = fii_df['DYPatrimonial'].str.replace(',','.').astype(float)
# fii_df['VariaçãoPatrimonial'] = fii_df['VariaçãoPatrimonial'].str.replace(',','.').astype(float)
# fii_df['Rentab. Patr.no Período'] = fii_df['Rentab. Patr.no Período'].str.replace(',','.').astype(float)
# fii_df['Rentab. Patr.Acumulada'] = fii_df['Rentab. Patr.Acumulada'].str.replace(',','.').astype(float)
# fii_df['VacânciaFísica'] = fii_df['VacânciaFísica'].str.replace(',','.').astype(float)
# fii_df['VacânciaFinanceira'] = fii_df['VacânciaFinanceira'].str.replace(',','.').astype(float)

In [482]:
fii_df[replace_comma_dot] = fii_df[replace_comma_dot].astype(float)

In [483]:
fii_df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 278 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype   
---  ------                   --------------  -----   
 0   Códigodo fundo           278 non-null    category
 1   Setor                    278 non-null    category
 2   Preço Atual              270 non-null    float64 
 3   Liquidez Diária          270 non-null    float64 
 4   Dividendo                278 non-null    float64 
 5   DividendYield            272 non-null    float64 
 6   DY (3M)Acumulado         272 non-null    float64 
 7   DY (6M)Acumulado         272 non-null    float64 
 8   DY (12M)Acumulado        272 non-null    float64 
 9   DY (3M)Média             272 non-null    float64 
 10  DY (6M)Média             272 non-null    float64 
 11  DY (12M)Média            272 non-null    float64 
 12  DY Ano                   258 non-null    float64 
 13  Variação Preço           272 non-null    float64 
 14  Rentab.Per

In [484]:
fii_df.isna().sum()/len(fii_df)*100

Códigodo fundo              0.000000
Setor                       0.000000
Preço Atual                 2.877698
Liquidez Diária             2.877698
Dividendo                   0.000000
DividendYield               2.158273
DY (3M)Acumulado            2.158273
DY (6M)Acumulado            2.158273
DY (12M)Acumulado           2.158273
DY (3M)Média                2.158273
DY (6M)Média                2.158273
DY (12M)Média               2.158273
DY Ano                      7.194245
Variação Preço              2.158273
Rentab.Período              2.158273
Rentab.Acumulada            2.158273
PatrimônioLíq.              0.000000
VPA                         0.000000
P/VPA                       2.877698
DYPatrimonial              12.589928
VariaçãoPatrimonial        12.589928
Rentab. Patr.no Período    12.589928
Rentab. Patr.Acumulada     12.589928
VacânciaFísica             55.755396
VacânciaFinanceira         89.208633
QuantidadeAtivos            0.000000
dtype: float64

In [485]:
fii_df.dropna(subset = ['Preço Atual', 'DividendYield'], inplace = True)

In [486]:
fii_df.shape

(264, 26)

In [487]:
fii_df.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 264 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype   
---  ------                   --------------  -----   
 0   Códigodo fundo           264 non-null    category
 1   Setor                    264 non-null    category
 2   Preço Atual              264 non-null    float64 
 3   Liquidez Diária          264 non-null    float64 
 4   Dividendo                264 non-null    float64 
 5   DividendYield            264 non-null    float64 
 6   DY (3M)Acumulado         264 non-null    float64 
 7   DY (6M)Acumulado         264 non-null    float64 
 8   DY (12M)Acumulado        264 non-null    float64 
 9   DY (3M)Média             264 non-null    float64 
 10  DY (6M)Média             264 non-null    float64 
 11  DY (12M)Média            264 non-null    float64 
 12  DY Ano                   258 non-null    float64 
 13  Variação Preço           264 non-null    float64 
 14  Rentab.Per

In [488]:
fii_df['P/VPA'] = fii_df['P/VPA']/100

In [489]:
fii_df.describe()

Unnamed: 0,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,DY (6M)Média,DY (12M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
count,264.0,264.0,264.0,264.0,264.0,264.0,264.0,264.0,264.0,264.0,...,264.0,264.0,264.0,237.0,237.0,237.0,237.0,121.0,30.0,264.0
mean,504.973939,14380.208333,1.178939,0.881705,2.519129,4.65875,7.647159,0.839735,0.776439,0.637424,...,541472400.0,542.534242,0.858371,0.868776,-0.473755,0.392068,1.518523,14.262397,11.157,3.295455
std,4914.235532,47465.974455,2.34809,0.412512,1.164715,2.375499,4.788285,0.388107,0.395842,0.399082,...,796118000.0,4684.316811,0.477648,0.481713,5.075079,5.144226,9.17384,22.197344,20.746099,7.90412
min,0.9,1.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,...,-9546408.0,-12.59,-0.59,0.06,-70.75,-70.69,-98.93,0.0,0.0,0.0
25%,67.65,241.5,0.4875,0.68,2.0675,3.705,5.0575,0.69,0.62,0.425,...,108371400.0,87.5075,0.75,0.58,-0.23,0.42,1.22,0.0,0.0,0.0
50%,89.2,2195.0,0.75,0.85,2.53,4.845,8.525,0.845,0.81,0.71,...,252239800.0,98.13,0.87,0.76,0.0,0.74,2.23,4.5,1.6,0.0
75%,101.0125,11706.0,1.2,1.17,3.4,6.1375,10.9125,1.13,1.0225,0.91,...,593691400.0,108.0775,1.0,1.19,0.28,1.34,3.55,17.0,13.05,3.0
max,76000.0,603470.0,23.91,2.9,7.33,9.59,18.42,2.44,1.6,1.53,...,6947212000.0,70317.64,7.62,5.45,3.15,3.93,14.03,100.0,100.0,72.0


In [490]:
fii_df[np.isinf(fii_df.any(1))]

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos


# **5. Analisando a média por setor**

In [491]:
fii_df.columns

Index(['Códigodo fundo', 'Setor', 'Preço Atual', 'Liquidez Diária',
       'Dividendo', 'DividendYield', 'DY (3M)Acumulado', 'DY (6M)Acumulado',
       'DY (12M)Acumulado', 'DY (3M)Média', 'DY (6M)Média', 'DY (12M)Média',
       'DY Ano', 'Variação Preço', 'Rentab.Período', 'Rentab.Acumulada',
       'PatrimônioLíq.', 'VPA', 'P/VPA', 'DYPatrimonial',
       'VariaçãoPatrimonial', 'Rentab. Patr.no Período',
       'Rentab. Patr.Acumulada', 'VacânciaFísica', 'VacânciaFinanceira',
       'QuantidadeAtivos'],
      dtype='object')

In [492]:
stack_df = fii_df.copy()

In [493]:
stack_df[float_columns] = stack_df[float_columns].fillna(value=0)

In [494]:
indicadores = [
               'Códigodo fundo',
               'Setor',
               'DY (12M)Acumulado',
               'VacânciaFísica',
               'VacânciaFinanceira',
               'P/VPA',
               'QuantidadeAtivos',
               'Liquidez Diária'
              ]

In [495]:
df_aux = stack_df[indicadores]

In [496]:
df_aux

Unnamed: 0,Códigodo fundo,Setor,DY (12M)Acumulado,VacânciaFísica,VacânciaFinanceira,P/VPA,QuantidadeAtivos,Liquidez Diária
0,FIVN11,Shoppings,0.00,56.00,0.0,0.31,1,16868.0
1,BZLI11,Títulos e Val. Mob.,0.00,0.00,0.0,1.37,0,44041.0
2,XTED11,Lajes Corporativas,0.00,0.00,100.0,0.44,1,394.0
3,ALMI11,Lajes Corporativas,0.00,64.05,0.0,0.42,1,21.0
4,PABY11,Híbrido,0.00,0.00,0.0,-0.59,1,95.0
...,...,...,...,...,...,...,...,...
277,RNDP11,Títulos e Val. Mob.,8.38,0.00,0.0,0.81,0,12.0
278,PLCR11,Híbrido,12.96,0.00,0.0,0.94,0,1605.0
279,CXCO11,Lajes Corporativas,9.31,0.00,0.0,0.80,0,1450.0
280,PATL11,Híbrido,9.13,0.00,0.0,0.78,4,17254.0


In [497]:
media_setor = df_aux.groupby('Setor').agg(['mean','std'])

In [498]:
media_setor

Unnamed: 0_level_0,DY (12M)Acumulado,DY (12M)Acumulado,VacânciaFísica,VacânciaFísica,VacânciaFinanceira,VacânciaFinanceira,P/VPA,P/VPA,QuantidadeAtivos,QuantidadeAtivos,Liquidez Diária,Liquidez Diária
Unnamed: 0_level_1,mean,std,mean,std,mean,std,mean,std,mean,std,mean,std
Setor,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2
Hospital,8.563333,1.46865,0.0,0.0,0.0,0.0,0.856667,0.120554,1.0,0.0,824.666667,1269.019438
Hotel,6.826667,2.933843,43.3,37.498933,0.0,0.0,0.81,0.232594,9.333333,12.096832,2183.333333,2609.701963
Híbrido,7.100455,4.682826,2.422727,5.283115,1.28,4.641644,0.834545,0.271057,4.022727,6.256118,24593.318182,93083.344358
Lajes Corporativas,6.915897,4.375074,24.870256,29.459103,6.400256,18.772204,0.697179,0.233407,4.25641,10.512444,5128.666667,14629.966303
Logística,7.820455,2.762946,7.263636,17.558,0.440909,1.437809,0.844545,0.146636,7.409091,5.5862,8083.5,9379.610413
Outros,9.391176,4.467487,2.687353,8.553492,0.561176,2.272758,0.810882,0.211465,6.558824,14.581414,13018.411765,22691.137764
Residencial,2.394286,4.132037,4.342857,10.470093,0.0,0.0,0.775714,0.529964,0.857143,1.573592,2867.428571,5991.360776
Shoppings,5.252273,2.943089,10.806364,12.131324,0.0,0.0,0.700909,0.215006,4.454545,5.369466,4731.954545,7374.482422
Títulos e Val. Mob.,8.520889,5.5122,0.0,0.0,0.0,0.0,1.007778,0.721456,0.066667,0.632456,19562.1,44516.213464


In [499]:
media_setor.loc['Residencial','DY (12M)Acumulado']

mean    2.394286
std     4.132037
Name: Residencial, dtype: float64

In [500]:
media_setor.loc['Residencial',('DY (12M)Acumulado','mean')]

2.394285714285714

# **Criando uma função com uma estratégia para oportunidades do mercado**

In [502]:
def opndd_media_setor(df, setor='Shoppings', label_setor='Setor'):
  
  media_setor = df_aux.groupby('Setor').agg(['mean','std'])

  df_setor = df[df[label_setor].isin([setor])]

  filter_ = \
      (df_setor['QuantidadeAtivos'] > 1) &\
      (df_setor['Liquidez Diária'] > 50) &\
      (df_setor['P/VPA'] < 1.0) &\
      (df_setor['DY (12M)Acumulado'] > media_setor.loc[setor, ('DY (12M)Acumulado','mean')])
  
  print('Média do setor Yield: {}'.format(media_setor.loc[setor, ('DY (12M)Acumulado','mean')]))
  print('Média do setor P/VPA: {}'.format(media_setor.loc[setor, ('P/VPA','mean')]))
  print('Média do setor Ativos: {}'.format(media_setor.loc[setor, ('QuantidadeAtivos','mean')]))
  print('Total FIIs: {}'.format(len(df_setor[filter_])))

  return df_setor[filter_]

In [503]:
list(fii_df['Setor'].unique())

['Shoppings',
 'Títulos e Val. Mob.',
 'Lajes Corporativas',
 'Híbrido',
 'Outros',
 'Logística',
 'Hospital',
 'Residencial',
 'Hotel']

In [504]:
oportunidade = opndd_media_setor(df_aux, setor='Logística')
oportunidade.sort_values('DY (12M)Acumulado', ascending=False, inplace=True)
oportunidade

Média do setor Yield: 7.820454545454546
Média do setor P/VPA: 0.8445454545454545
Média do setor Ativos: 7.409090909090909
Total FIIs: 8


Unnamed: 0,Códigodo fundo,Setor,DY (12M)Acumulado,VacânciaFísica,VacânciaFinanceira,P/VPA,QuantidadeAtivos,Liquidez Diária
205,BLMG11,Logística,11.23,0.0,0.0,0.83,4,7346.0
62,SDIL11,Logística,9.41,2.6,0.0,0.88,5,5590.0
65,EURO11,Logística,9.24,0.0,0.0,0.75,6,359.0
214,RBRL11,Logística,8.97,0.0,0.0,0.81,6,2016.0
177,GGRC11,Logística,8.78,0.0,0.0,0.8,15,10147.0
78,FIIP11B,Logística,8.72,0.0,0.0,0.77,7,234.0
54,LGCP11,Logística,8.1,0.5,0.0,0.75,5,751.0
240,LVBI11,Logística,7.99,0.5,0.0,0.87,10,17823.0
