<a href="https://colab.research.google.com/github/joseferrao/cienciaDados/blob/main/Analise_Fundos_Imobili%C3%A1rios.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src="https://tradingcomdados.com/images/logotipo/logotipo-trading-com-dados.svg" width="300">

---
# **Análise de Fundos de Investimento Imobiliário (FIIs) com Python**
---

# **1. Bibliotecas utilizadas**

In [1]:
# Algumas das bibliotecas fundamentais nas técnicas de Webscraping
# Bibliotecas opcionais e menos representativas (por ex., seaborn para colorir dataframe) estarão dispostas ao longo do código
# A instalação é necessária apenas na primeira vez de uso

!pip install requests
!pip install bs4

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [2]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import numpy as np

# **2. Webscraping para Rendimentos de Fundos Imobiliários (FIIs)**

---
Como o foco dessa live é a **análise de Fundos Imobiliários**, vamos acelerar a parte de webscraping dos dados. Se for do interesse do público, podemos programar uma próxima live explorando apenas a mineração de dados na web

---


https://www.fundsexplorer.com.br/ranking

In [3]:
FII_url = requests.get("https://www.fundsexplorer.com.br/ranking")
FII_url

<Response [200]>

In [4]:
FII_url.text

'<!DOCTYPE html>\n<html lang="pt-br">\n\n<head>\n<script type="text/javascript">window.NREUM||(NREUM={});NREUM.info={"beacon":"bam.nr-data.net","errorBeacon":"bam.nr-data.net","licenseKey":"7ae9c6eb2d","applicationID":"1576126089","transactionName":"IAkLQhFbWVUBQhdKVwcDFl8EWhpLBV5TUVwESQxYB1FN","queueTime":3,"applicationTime":15,"agent":""}</script>\n<script type="text/javascript">(window.NREUM||(NREUM={})).init={ajax:{deny_list:["bam.nr-data.net"]}};(window.NREUM||(NREUM={})).loader_config={licenseKey:"7ae9c6eb2d",applicationID:"1576126089"};window.NREUM||(NREUM={}),__nr_require=function(t,e,n){function r(n){if(!e[n]){var i=e[n]={exports:{}};t[n][0].call(i.exports,function(e){var i=t[n][1][e];return r(i||e)},i,i.exports)}return e[n].exports}if("function"==typeof __nr_require)return __nr_require;for(var i=0;i<n.length;i++)r(n[i]);return r}({1:[function(t,e,n){function r(){}function i(t,e,n,r){return function(){return s.recordSupportability("API/"+e+"/called"),o(t+e,[u.now()].concat(c(a

In [5]:
FII_bs4 = BeautifulSoup(FII_url.text, "html.parser")
FII_bs4.head()

[<script type="text/javascript">window.NREUM||(NREUM={});NREUM.info={"beacon":"bam.nr-data.net","errorBeacon":"bam.nr-data.net","licenseKey":"7ae9c6eb2d","applicationID":"1576126089","transactionName":"IAkLQhFbWVUBQhdKVwcDFl8EWhpLBV5TUVwESQxYB1FN","queueTime":3,"applicationTime":15,"agent":""}</script>,
 <script type="text/javascript">(window.NREUM||(NREUM={})).init={ajax:{deny_list:["bam.nr-data.net"]}};(window.NREUM||(NREUM={})).loader_config={licenseKey:"7ae9c6eb2d",applicationID:"1576126089"};window.NREUM||(NREUM={}),__nr_require=function(t,e,n){function r(n){if(!e[n]){var i=e[n]={exports:{}};t[n][0].call(i.exports,function(e){var i=t[n][1][e];return r(i||e)},i,i.exports)}return e[n].exports}if("function"==typeof __nr_require)return __nr_require;for(var i=0;i<n.length;i++)r(n[i]);return r}({1:[function(t,e,n){function r(){}function i(t,e,n,r){return function(){return s.recordSupportability("API/"+e+"/called"),o(t+e,[u.now()].concat(c(arguments)),n?null:this,r),n?void 0:this}}var o=

In [6]:
FII_table = FII_bs4.findAll(attrs = {'id':'scroll-wrapper'})

In [7]:
table = FII_table[0].findAll('table')

In [8]:
type(table)

bs4.element.ResultSet

In [9]:
FII_df = pd.read_html(str(FII_table[0]))[0]

Aqui temos o diamante bruto, os dados de todos os FIIs disponíveis (número de linhas do dataframe), com todos os seus multiplos parametros (número de colunas df)

In [10]:
FII_df.columns

Index(['Códigodo fundo', 'Setor', 'Preço Atual', 'Liquidez Diária',
       'Dividendo', 'DividendYield', 'DY (3M)Acumulado', 'DY (6M)Acumulado',
       'DY (12M)Acumulado', 'DY (3M)Média', 'DY (6M)Média', 'DY (12M)Média',
       'DY Ano', 'Variação Preço', 'Rentab.Período', 'Rentab.Acumulada',
       'PatrimônioLíq.', 'VPA', 'P/VPA', 'DYPatrimonial',
       'VariaçãoPatrimonial', 'Rentab. Patr.no Período',
       'Rentab. Patr.Acumulada', 'VacânciaFísica', 'VacânciaFinanceira',
       'QuantidadeAtivos'],
      dtype='object')

In [11]:
str(list(FII_df['Códigodo fundo'].sort_values()))

"['ABCP11', 'AFHI11', 'AFOF11', 'AIEC11', 'ALMI11', 'ALZR11', 'APTO11', 'ARCT11', 'ARRI11', 'ATSA11', 'BARI11', 'BBFI11B', 'BBFO11', 'BBGO11', 'BBIM11', 'BBPO11', 'BBRC11', 'BCFF11', 'BCIA11', 'BCRI11', 'BICE11', 'BICR11', 'BIME11', 'BLCA11', 'BLCP11', 'BLMC11', 'BLMG11', 'BLMO11', 'BLMR11', 'BMLC11', 'BNFS11', 'BPFF11', 'BPML11', 'BRCO11', 'BRCR11', 'BREV11', 'BRLA11', 'BTAL11', 'BTCR11', 'BTLG11', 'BTRA11', 'BTSG11', 'BTWR11', 'BZLI11', 'CACR11', 'CARE11', 'CBOP11', 'CCRF11', 'CEOC11', 'CJCT11', 'CNES11', 'CORM11', 'CPFF11', 'CPTS11', 'CRFF11', 'CTXT11', 'CVBI11', 'CXAG11', 'CXCE11B', 'CXCI11', 'CXCO11', 'CXRI11', 'CXTL11', 'CYCR11', 'DEVA11', 'DRIT11B', 'DVFF11', 'EDFO11B', 'EDGA11', 'EQIR11', 'ERCR11', 'ERPA11', 'EURO11', 'EVBI11', 'FAED11', 'FAMB11B', 'FATN11', 'FCFL11', 'FEXC11', 'FIGS11', 'FIIB11', 'FIIP11B', 'FISC11', 'FIVN11', 'FLCR11', 'FLMA11', 'FLRP11', 'FMOF11', 'FPAB11', 'FVPQ11', 'GALG11', 'GAME11', 'GCFF11', 'GCRA11', 'GCRI11', 'GESE11B', 'GGRC11', 'GSFI11', 'GTLG11', '

# **3. Organização dos dados extraídos**

**Observação**: existem diversas formas muito mais elegantes de manipulação desses dados, usando estruturas condicionais e de repetição, por exemplo<p>
Entretanto, vamos tentar trazer essa manipulação usando funções e métodos mais simples, mesmo que exijam algumas etapas extras

In [12]:
# Faremos uma cópia do dataframe para manipulá-lo com mais liberdade e, caso 
# editemos algo, possamos reverter a ediçao sem um novo webscraping

FII_df_backup = FII_df.copy()

In [13]:
FII_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,"R$ 2,19",55890.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 65.678.487,99","R$ 6,98",31.0,,,,,"56,00%",,1
1,BZLI11,Títulos e Val. Mob.,"R$ 14,70",44041.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 431.076.817,02","R$ 10,70",137.0,,,,,,,0
2,XTED11,Lajes Corporativas,"R$ 5,98",1082.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 27.305.951,24","R$ 13,89",43.0,,,,,"0,00%","100,00%",1
3,ALMI11,Lajes Corporativas,"R$ 930,00",17.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ 249.632.973,43","R$ 2.245,37",41.0,,,,,"64,05%",,1
4,PABY11,Híbrido,"R$ 7,60",4.0,"R$ 0,00","0,00%","0,00%","0,00%","0,00%","0,00%",...,"R$ -9.870.075,03","R$ -13,01",-58.0,,,,,,,1


In [14]:
FII_df.dtypes

Códigodo fundo              object
Setor                       object
Preço Atual                 object
Liquidez Diária            float64
Dividendo                   object
DividendYield               object
DY (3M)Acumulado            object
DY (6M)Acumulado            object
DY (12M)Acumulado           object
DY (3M)Média                object
DY (6M)Média                object
DY (12M)Média               object
DY Ano                      object
Variação Preço              object
Rentab.Período              object
Rentab.Acumulada            object
PatrimônioLíq.              object
VPA                         object
P/VPA                      float64
DYPatrimonial               object
VariaçãoPatrimonial         object
Rentab. Patr.no Período     object
Rentab. Patr.Acumulada      object
VacânciaFísica              object
VacânciaFinanceira          object
QuantidadeAtivos             int64
dtype: object

In [None]:
# Erro esperado, pois a variável não é float
np.max(FII_df['Preço Atual'])

TypeError: ignored

In [15]:
FII_df['Preço Atual']

0        R$ 2,19
1       R$ 14,70
2        R$ 5,98
3      R$ 930,00
4        R$ 7,60
         ...    
277    R$ 116,90
278      R$ 5,86
279     R$ 97,50
280      R$ 9,76
281      R$ 7,43
Name: Preço Atual, Length: 282, dtype: object

In [16]:
FII_df.iloc[0]

Códigodo fundo                       FIVN11
Setor                             Shoppings
Preço Atual                         R$ 2,19
Liquidez Diária                     55890.0
Dividendo                           R$ 0,00
DividendYield                         0,00%
DY (3M)Acumulado                      0,00%
DY (6M)Acumulado                      0,00%
DY (12M)Acumulado                     0,00%
DY (3M)Média                          0,00%
DY (6M)Média                          0,00%
DY (12M)Média                         0,00%
DY Ano                                  NaN
Variação Preço                        0,00%
Rentab.Período                        0,00%
Rentab.Acumulada                      0,00%
PatrimônioLíq.             R$ 65.678.487,99
VPA                                 R$ 6,98
P/VPA                                  31.0
DYPatrimonial                           NaN
VariaçãoPatrimonial                     NaN
Rentab. Patr.no Período                 NaN
Rentab. Patr.Acumulada          

In [17]:
FII_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 282 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   Códigodo fundo           282 non-null    object 
 1   Setor                    278 non-null    object 
 2   Preço Atual              274 non-null    object 
 3   Liquidez Diária          274 non-null    float64
 4   Dividendo                282 non-null    object 
 5   DividendYield            276 non-null    object 
 6   DY (3M)Acumulado         276 non-null    object 
 7   DY (6M)Acumulado         276 non-null    object 
 8   DY (12M)Acumulado        276 non-null    object 
 9   DY (3M)Média             276 non-null    object 
 10  DY (6M)Média             276 non-null    object 
 11  DY (12M)Média            276 non-null    object 
 12  DY Ano                   262 non-null    object 
 13  Variação Preço           276 non-null    object 
 14  Rentab.Período           2

In [18]:
FII_df = FII_df.replace(to_replace = r'^R\$ ', value = '', regex = True)

In [19]:
FII_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,219,55890.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"65.678.487,99",698,31.0,,,,,"56,00%",,1
1,BZLI11,Títulos e Val. Mob.,1470,44041.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"431.076.817,02",1070,137.0,,,,,,,0
2,XTED11,Lajes Corporativas,598,1082.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"27.305.951,24",1389,43.0,,,,,"0,00%","100,00%",1
3,ALMI11,Lajes Corporativas,93000,17.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"249.632.973,43","2.245,37",41.0,,,,,"64,05%",,1
4,PABY11,Híbrido,760,4.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,"-9.870.075,03",-1301,-58.0,,,,,,,1


In [20]:
# Outro problema é o separador decimal (atualmente como vírgula). Entretanto, não podemos simplesmente substituir por '.' diretamente pois podem existir valores com '.' como separador de milhar
# Agravante extra: em algumas columas o separador decimal está como ',' e outros como '.'

FII_df['PatrimônioLíq.']

0       65.678.487,99
1      431.076.817,02
2       27.305.951,24
3      249.632.973,43
4       -9.870.075,03
            ...      
277    216.661.402,08
278     52.387.752,57
279     99.158.182,73
280     55.586.536,14
281    214.052.692,12
Name: PatrimônioLíq., Length: 282, dtype: object

In [21]:
FII_df['PatrimônioLíq.'] = FII_df['PatrimônioLíq.'].str.replace('.','')

FII_df['Preço Atual'] = FII_df['Preço Atual'].str.replace('.','')
FII_df['Dividendo'] = FII_df['Dividendo'].str.replace('.','')
FII_df['VPA'] = FII_df['VPA'].str.replace('.','')

  """Entry point for launching an IPython kernel.
  This is separate from the ipykernel package so we can avoid doing imports until
  after removing the cwd from sys.path.
  """


In [22]:
FII_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,219,55890.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,6567848799,698,31.0,,,,,"56,00%",,1
1,BZLI11,Títulos e Val. Mob.,1470,44041.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,43107681702,1070,137.0,,,,,,,0
2,XTED11,Lajes Corporativas,598,1082.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,2730595124,1389,43.0,,,,,"0,00%","100,00%",1
3,ALMI11,Lajes Corporativas,93000,17.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,24963297343,224537,41.0,,,,,"64,05%",,1
4,PABY11,Híbrido,760,4.0,0,"0,00%","0,00%","0,00%","0,00%","0,00%",...,-987007503,-1301,-58.0,,,,,,,1


In [23]:
# Segunda etapa: substituir as ',' por '.' (separador decimal padrão para executarmos as análises estatísticas exploratórias dos dados)
# Agora também converteremos os dados em float (formato de números decimais)

FII_df['PatrimônioLíq.'] = FII_df['PatrimônioLíq.'].str.replace(',','.')

FII_df['Preço Atual'] = FII_df['Preço Atual'].str.replace(',','.')
FII_df['Dividendo'] = FII_df['Dividendo'].str.replace(',','.')
FII_df['VPA'] = FII_df['VPA'].str.replace(',','.')

In [24]:
FII_df['PatrimônioLíq.']  = FII_df['PatrimônioLíq.'] .astype(float)
FII_df['Preço Atual']  = FII_df['Preço Atual'] .astype(float)
FII_df['Dividendo']  = FII_df['Dividendo'] .astype(float)
FII_df['VPA']  = FII_df['VPA'] .astype(float)

In [25]:
FII_df['PatrimônioLíq.']

0      6.567849e+07
1      4.310768e+08
2      2.730595e+07
3      2.496330e+08
4     -9.870075e+06
           ...     
277    2.166614e+08
278    5.238775e+07
279    9.915818e+07
280    5.558654e+07
281    2.140527e+08
Name: PatrimônioLíq., Length: 282, dtype: float64

In [26]:
np.max(FII_df['Preço Atual'] )

76000.0

In [27]:
np.min(FII_df['Preço Atual'] )

0.86

In [28]:
np.min(FII_df['PatrimônioLíq.'] )

-9870075.03

In [29]:
FII_df.iloc[0:10].transpose()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9
Códigodo fundo,FIVN11,BZLI11,XTED11,ALMI11,PABY11,ORPD11,FISC11,NSLU11,ATSA11,CXTL11
Setor,Shoppings,Títulos e Val. Mob.,Lajes Corporativas,Lajes Corporativas,Híbrido,Títulos e Val. Mob.,Lajes Corporativas,Hospital,Shoppings,Logística
Preço Atual,2.19,14.7,5.98,930.0,7.6,100.0,165.0,140.39,88.52,294.99
Liquidez Diária,55890.0,44041.0,1082.0,17.0,4.0,1.0,200.0,3071.0,1.0,1.0
Dividendo,0.0,0.0,0.0,0.0,0.0,1.38,0.22,1.54,0.25,0.48
DividendYield,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","0,76%","0,18%","0,16%"
DY (3M)Acumulado,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","2,26%","0,59%","0,67%"
DY (6M)Acumulado,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","4,94%","1,30%","1,29%"
DY (12M)Acumulado,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","9,49%","2,97%","0,00%"
DY (3M)Média,"0,00%","0,00%","0,00%","0,00%","0,00%",,"0,00%","0,75%","0,20%","0,22%"


In [30]:
FII_df = FII_df.replace(to_replace = r'%$', value = '', regex = True)
FII_df.head()

Unnamed: 0,Códigodo fundo,Setor,Preço Atual,Liquidez Diária,Dividendo,DividendYield,DY (3M)Acumulado,DY (6M)Acumulado,DY (12M)Acumulado,DY (3M)Média,...,PatrimônioLíq.,VPA,P/VPA,DYPatrimonial,VariaçãoPatrimonial,Rentab. Patr.no Período,Rentab. Patr.Acumulada,VacânciaFísica,VacânciaFinanceira,QuantidadeAtivos
0,FIVN11,Shoppings,2.19,55890.0,0.0,0,0,0,0,0,...,65678490.0,6.98,31.0,,,,,5600.0,,1
1,BZLI11,Títulos e Val. Mob.,14.7,44041.0,0.0,0,0,0,0,0,...,431076800.0,10.7,137.0,,,,,,,0
2,XTED11,Lajes Corporativas,5.98,1082.0,0.0,0,0,0,0,0,...,27305950.0,13.89,43.0,,,,,0.0,10000.0,1
3,ALMI11,Lajes Corporativas,930.0,17.0,0.0,0,0,0,0,0,...,249633000.0,2245.37,41.0,,,,,6405.0,,1
4,PABY11,Híbrido,7.6,4.0,0.0,0,0,0,0,0,...,-9870075.0,-13.01,-58.0,,,,,,,1


In [31]:
set(FII_df.Setor)

{'Hospital',
 'Hotel',
 'Híbrido',
 'Lajes Corporativas',
 'Logística',
 'Outros',
 'Residencial',
 'Shoppings',
 'Títulos e Val. Mob.',
 nan}

In [32]:
FII_df['DividendYield'] = FII_df['DividendYield'].str.replace(',','.').astype(float)

In [34]:
FII_df['DY (3M)Acumulado'] = FII_df['DY (3M)Acumulado'].str.replace(',','.').astype(float)
FII_df['DY (6M)Acumulado'] = FII_df['DY (6M)Acumulado'].str.replace(',','.').astype(float)
FII_df['DY (12M)Acumulado'] = FII_df['DY (12M)Acumulado'].str.replace(',','.').astype(float)
FII_df['DY (3M)Média'] = FII_df['DY (3M)Média'].str.replace(',','.').astype(float)
FII_df['DY (6M)Média'] = FII_df['DY (6M)Média'].str.replace(',','.').astype(float)
FII_df['DY (12M)Média'] = FII_df['DY (12M)Média'].str.replace(',','.').astype(float)
FII_df['DY Ano'] = FII_df['DY Ano'].str.replace(',','.').astype(float)
FII_df['Variação Preço'] = FII_df['Variação Preço'].str.replace(',','.').astype(float)
FII_df['Rentab.Período'] = FII_df['Rentab.Período'].str.replace(',','.').astype(float)
FII_df['Rentab.Acumulada'] = FII_df['Rentab.Acumulada'].str.replace(',','.').astype(float)
FII_df['DYPatrimonial'] = FII_df['DYPatrimonial'].str.replace(',','.').astype(float)
FII_df['VariaçãoPatrimonial'] = FII_df['VariaçãoPatrimonial'].str.replace(',','.').astype(float)
FII_df['Rentab. Patr.no Período'] = FII_df['Rentab. Patr.no Período'].str.replace(',','.').astype(float)
FII_df['Rentab. Patr.Acumulada'] = FII_df['Rentab. Patr.Acumulada'].str.replace(',','.').astype(float)
FII_df['VacânciaFísica'] = FII_df['VacânciaFísica'].str.replace(',','.').astype(float)
FII_df['VacânciaFinanceira'] = FII_df['VacânciaFinanceira'].str.replace(',','.').astype(float)

AttributeError: ignored

In [35]:
np.max(FII_df['DividendYield'])

2.9

In [36]:
FII_df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 282 entries, 0 to 281
Data columns (total 26 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   Códigodo fundo           282 non-null    object 
 1   Setor                    278 non-null    object 
 2   Preço Atual              274 non-null    float64
 3   Liquidez Diária          274 non-null    float64
 4   Dividendo                282 non-null    float64
 5   DividendYield            276 non-null    float64
 6   DY (3M)Acumulado         276 non-null    float64
 7   DY (6M)Acumulado         276 non-null    float64
 8   DY (12M)Acumulado        276 non-null    float64
 9   DY (3M)Média             276 non-null    float64
 10  DY (6M)Média             276 non-null    float64
 11  DY (12M)Média            276 non-null    float64
 12  DY Ano                   262 non-null    float64
 13  Variação Preço           276 non-null    float64
 14  Rentab.Período           2

In [37]:
 # Contagem de valores NaN de cada variável
# De forma particular, cada analista escolherá se aquela quantidade de NaNs serão ignorados ou não

 FII_df.isna().sum()/len(FII_df)*100

Códigodo fundo              0.000000
Setor                       1.418440
Preço Atual                 2.836879
Liquidez Diária             2.836879
Dividendo                   0.000000
DividendYield               2.127660
DY (3M)Acumulado            2.127660
DY (6M)Acumulado            2.127660
DY (12M)Acumulado           2.127660
DY (3M)Média                2.127660
DY (6M)Média                2.127660
DY (12M)Média               2.127660
DY Ano                      7.092199
Variação Preço              2.127660
Rentab.Período              2.127660
Rentab.Acumulada            2.127660
PatrimônioLíq.              0.000000
VPA                         0.000000
P/VPA                       2.836879
DYPatrimonial              12.411348
VariaçãoPatrimonial        12.411348
Rentab. Patr.no Período    12.411348
Rentab. Patr.Acumulada     12.411348
VacânciaFísica             56.382979
VacânciaFinanceira         89.361702
QuantidadeAtivos            0.000000
dtype: float64

In [38]:
FII_df.dropna(subset = ['Preço Atual', 'DividendYield', 'Setor'], inplace = True)
FII_df.shape

(264, 26)